विक्षनरी
विक्षनरी एक वेब आधारित बहुभाषी शब्दकोश है, जिसमें कोई भी शब्द जोड़ सकता है या लिख सकता है। यह विकिमीडिया संस्थान द्वारा संचालित किया जाता है। यह भी विकिपीडिया की तरह मीडियाविकि सॉफ्टवेयर का उपयोग करता है, इस कारण आप भी इसमें कोई भी सम्पादन कर सकते हैं और अनुपलब्ध शब्दों को जोड़ कर इसे बड़ा कर सकते हैं। अभी यह हिन्दी भाषा के शब्दकोश के साथ साथ 171 अन्य भाषाओं में भी उपलब्ध है।
wiktionary.org का चित्र | |
प्रकार |
शब्दकोश |
---|---|
इनमें उपलब्ध | 170+ भाषाओं में उपलब्ध |
मालिक | विकिमीडिया संस्थान |
नारा | एक मुक्त शब्दकोश |
जालस्थल |
wiktionary |
एलेक्सा रैंक | 563 (13 अप्रैल 2017 के अनुसार)[1] |
व्यापारिक? | नहीं |
पंजीकरण | वैकल्पिक |
उद्घाटन तिथि | दिसम्बर 12, 2002 |
वर्तमान स्थिति | सक्रिय |
इतिहास
संपादित करेंयह परियोजना हेतु प्रस्ताव डेनियल एलस्टोन और विचार, विकिपीडिया के सह-संस्थापक लेरी सेंगर का था।[2] इसे 12 दिसम्बर 2002 को लिया गया था।[3] पहली बार गैर अंग्रेजी विक्षनरी का निर्माण 28 मार्च 2004 को हुआ था। इस दिन फ्रांसीसी और पोलिश भाषा में इसका निर्माण हुआ था। इसके निर्माण के साथ यह धीरे धीरे अन्य भाषाओं में बनने लगा था। 1 मई 2004 तक इसे अस्थाई रूप में wiktionary.wiki.x.io नामक स्थान पर रखा गया था। उसके बाद इसे इसके नाम वाले पते पर डाला गया। नवम्बर 2016 तक इसके सभी भाषाओं के संस्करण में ढाई करोड़ शब्द जुड़ चुके थे। पचास लाख शब्दों के साथ अंग्रेजी विक्षनरी सबसे आगे रहा। इसके बाद मालागासी 39 लाख और फ्रांसीसी 30 लाख शब्दों के साथ क्रमशः दूसरे और तीसरे स्थान पर थे। कुल इकतालीस भाषाओं की परियोजनाओं ने एक लाख शब्दों की सीमा को पार कर लिया था।
परियोजना के सबसे बड़े भाषा संस्करणों में कई परिभाषाएँ बॉट्स द्वारा बनाई गई थीं, जिन्होंने प्रविष्टियाँ उत्पन्न करने के रचनात्मक तरीके खोजे थे या (शायद ही कभी) स्वचालित रूप से पहले प्रकाशित शब्दकोशों से हजारों प्रविष्टियाँ आयात की थीं। 2007 में इंग्लिश विक्षनरी में पंजीकृत 18 बॉट्स में से सात ने वहां 163,000 प्रविष्टियाँ बनाईं।
इनमें से एक अन्य बॉट्स, "थर्डपर्सबॉट", कई तृतीय-व्यक्ति संयुग्मनों को जोड़ने के लिए जिम्मेदार था, जिन्हें मानक शब्दकोशों में अपनी प्रविष्टियाँ प्राप्त नहीं होती थीं; उदाहरण के लिए, इसने "स्मोल्डर्स" को "स्मोल्डर्स का तीसरा-व्यक्ति एकवचन सरल वर्तमान रूप" के रूप में परिभाषित किया। अंग्रेजी विक्षनरी द्वारा 996,450 अंग्रेजी शब्दों के लिए प्रदान की गई 1,269,938 परिभाषाओं में से 478,068 इस प्रकार की परिभाषाओं के "रूप" हैं। इसका मतलब यह है कि ऐसी प्रविष्टियों के बिना भी, अंग्रेजी का इसका कवरेज प्रमुख मोनोलिंगुअल प्रिंट शब्दकोशों की तुलना में काफी बड़ा है। उदाहरण के लिए, मरियम-वेबस्टर की अंग्रेजी भाषा की तीसरी नई अंतर्राष्ट्रीय डिक्शनरी, अनब्रिज्ड में 475,000 प्रविष्टियाँ हैं (कई अतिरिक्त एम्बेडेड हेडवर्ड के साथ); ऑक्सफ़ोर्ड इंग्लिश डिक्शनरी में 615,000 शीर्षक शब्द हैं, लेकिन इसमें मध्य अंग्रेजी भी शामिल है, जिसके लिए अंग्रेजी विक्षनरी में अतिरिक्त 34,234 चमकदार परिभाषाएँ हैं। यह दिखाने के लिए विस्तृत आँकड़े मौजूद हैं कि विभिन्न प्रकार की कितनी प्रविष्टियाँ मौजूद हैं।
अंग्रेजी विक्षनरी बॉट्स पर उस हद तक निर्भर नहीं है जितना कि कुछ अन्य संस्करण करते हैं। उदाहरण के लिए, फ्रांसीसी और वियतनामी विक्षनरी ने फ्री वियतनामी डिक्शनरी प्रोजेक्ट (एफवीडीपी) के बड़े हिस्से को आयात किया, जो वियतनामी से और वहां से मुफ्त सामग्री द्विभाषी शब्दकोश प्रदान करता है। ये आयातित प्रविष्टियाँ वस्तुतः वियतनामी संस्करण की सभी सामग्री बनाती हैं। अंग्रेजी संस्करण की तरह, फ्रांसीसी विकिपीडिया ने चीनी, जापानी, कोरियाई और भारतीय पात्रों के यूनिहान डेटाबेस से लगभग 20,000 प्रविष्टियाँ आयात की हैं। फ्रेंच विक्षनरी 2006 में तेजी से बढ़ी, जिसका मुख्य कारण पुराने, स्वतंत्र रूप से लाइसेंस प्राप्त शब्दकोशों से कई प्रविष्टियों की नकल करने वाले बॉट्स थे, जैसे कि डिक्शननेयर डे ल'अकाडेमी फ़्रैन्काइज़ (1935, लगभग 35,000 शब्द) का आठवां संस्करण, और जोड़ने के लिए बॉट्स का उपयोग करना। फ़्रेंच अनुवाद के साथ अन्य विक्षनरी संस्करणों के शब्द। रूसी संस्करण में लगभग 80,000 प्रविष्टियों की वृद्धि हुई क्योंकि "एलएक्सबॉट" ने अंग्रेजी और जर्मन में शब्दों के लिए बॉयलरप्लेट प्रविष्टियाँ (शीर्षकों के साथ, लेकिन परिभाषाओं के बिना) जोड़ीं।
जुलाई 2021 तक, अंग्रेजी विक्षनरी में 791,870 से अधिक ग्लोस परिभाषाएँ और अकेले अंग्रेजी प्रविष्टियों के लिए 1,269,938 से अधिक कुल परिभाषाएँ (विभिन्न रूपों सहित) हैं, सभी भाषाओं में कुल 9,928,056 से अधिक परिभाषाएँ हैं।
लोगो
विक्षनरी के कई भाषा संस्करणों में ऐतिहासिक रूप से एक समान लोगो का अभाव रहा है। कुछ संस्करण ऐसे लोगो का उपयोग करते हैं जो पिछले अंग्रेजी विक्षनरी लोगो के आधार पर "विक्षनरी" शब्द के बारे में एक शब्दकोश प्रविष्टि दर्शाते हैं, जिसे मीडियाविकि डेवलपर ब्रायन विब्बर द्वारा डिजाइन किया गया था। क्योंकि एक विशुद्ध रूप से पाठ्य लोगो को भाषा-दर-भाषा में काफी भिन्न होना चाहिए, एक समान लोगो को अपनाने के लिए सितंबर से अक्टूबर 2006 तक विकिमीडिया मेटा-विकी पर एक चार चरण की प्रतियोगिता आयोजित की गई थी। कुछ समुदायों ने "स्मुरेइनचेस्टर" की विजेता प्रविष्टि को अपनाया, एक 3 ×3 लकड़ी की टाइलों का ग्रिड, प्रत्येक पर अलग-अलग लेखन प्रणाली का एक अक्षर अंकित है। हालाँकि, सर्वेक्षण में विक्षनरी समुदाय से उतनी भागीदारी नहीं देखी गई जितनी समुदाय के कुछ सदस्यों को उम्मीद थी, और कई बड़े विकी ने अंततः अपने पाठ्य लोगो को बरकरार रखा।
अप्रैल 2009 में, एक नई प्रतियोगिता के साथ इस मुद्दे को पुनर्जीवित किया गया। इस बार, एक खुले हार्डबाउंड शब्दकोश के "AAEngelman" के चित्रण ने 2006 के लोगो के खिलाफ आमने-सामने वोट जीता, लेकिन नए लोगो को परिष्कृत करने और अपनाने की प्रक्रिया रुक गई। बाद के वर्षों में, कुछ विकी ने अपने पाठ्य लोगो को दो नए लोगो में से एक के साथ बदल दिया। 2012 में, 55 विकीज़ जो अंग्रेजी विक्षनरी लोगो का उपयोग कर रहे थे, उन्हें "स्मुरेइनचेस्टर" द्वारा 2006 के डिज़ाइन के स्थानीयकृत संस्करण प्राप्त हुए। जुलाई 2016 में, अंग्रेजी विक्षनरी ने इस लोगो का एक संस्करण अपनाया। 4 जुलाई 2016 तक, 135 विकी, विक्षनरी की 61% प्रविष्टियों का प्रतिनिधित्व करते हुए, "स्मुर्रेइनचेस्टर" द्वारा 2006 के डिज़ाइन पर आधारित लोगो का उपयोग करते हैं, 33 विकी (36%) एक टेक्स्ट लोगो का उपयोग करते हैं, और विकी (3%) 2009 का "AAEngelman" द्वारा डिज़ाइन करते हैं।
सटीकता सुनिश्चित करने के लिए मानदंड
संपादित करेंसटीकता सुनिश्चित करने के लिए, अंग्रेजी विक्षनरी की एक नीति है कि शर्तों को सत्यापित किया जाना आवश्यक है। अंग्रेजी और चीनी जैसी प्रमुख भाषाओं के शब्दों को इनके द्वारा सत्यापित किया जाना चाहिए:
- स्पष्ट रूप से व्यापक उपयोग, या
- कम से कम एक वर्ष तक फैले कम से कम तीन स्वतंत्र उदाहरणों में, अर्थ संप्रेषित करते हुए, स्थायी रूप से रिकॉर्ड किए गए मीडिया में उपयोग करें।
क्रीक जैसी कम-प्रलेखित भाषाओं और लैटिन जैसी विलुप्त भाषाओं के लिए, स्थायी रूप से रिकॉर्ड किए गए माध्यम में एक उपयोग या संदर्भ कार्य में एक उल्लेख पर्याप्त सत्यापन है।
बहुभाषी
संपादित करेंफरवरी 2024 तक, 192 भाषाओं के लिए विक्षनरी साइटें हैं जिनमें से 168 सक्रिय हैं और 24 बंद हैं। सक्रिय साइटों में 38,270,664 लेख हैं, और बंद साइटों में 339 लेख हैं। 7,191,975 पंजीकृत उपयोगकर्ता हैं जिनमें से 6,566 हाल ही में सक्रिय हैं।
मेनस्पेस आलेख गणना के अनुसार शीर्ष दस विक्षनरी भाषा परियोजनाएँ:
कुल योग सहित पूरी सूची के लिए विकिमीडिया सांख्यिकी देखें:
आलोचनात्मक स्वीकार्यता
संपादित करेंविक्षनरी का आलोचनात्मक स्वागत मिश्रित रहा है। 2006 में, जिल लेपोर ने द न्यू यॉर्कर के लिए "नूह आर्क" लेख में लिखा था,
विक्षनरी में हाथों का प्रदर्शन नहीं होता। संपादकीय स्टाफ भी नहीं है. "अपने स्वयं के कोशकार बनें!", विक्षनरी का आदर्श वाक्य हो सकता है। विशेषज्ञों की आवश्यकता किसे है? कोशकारों द्वारा लिखे गए शब्दकोष के लिए अच्छे पैसे क्यों चुकाएँ जब हम उसे स्वयं ही बना सकते हैं?
विक्षनरी माओवादी जितना गणतांत्रिक या लोकतांत्रिक नहीं है। और यह केवल कॉपीराइट-समाप्त पुस्तकों जितनी ही अच्छी है, जिनसे यह चुराया जाता है।
बुकलिस्ट के लिए कीर ग्रेफ़ की समीक्षा कम आलोचनात्मक थी:
क्या विक्षनरी के लिए कोई जगह है? निश्चित रूप से। इसके कई रचनाकारों का उद्योग और उत्साह इस बात का प्रमाण है कि एक बाज़ार है। और आज की तेजी से बदलती दुनिया और ऑनलाइन परिवेश में सामने आने वाले अजीब शब्दों को खोजते समय उपयोग करने के लिए एक और मजबूत स्रोत का होना अद्भुत है। लेकिन कई वेब स्रोतों (इस कॉलम सहित) की तरह, अधिक प्रतिष्ठित स्रोतों के संयोजन में परिष्कृत उपयोगकर्ताओं द्वारा इसका सबसे अच्छा उपयोग किया जाता है।
अन्य प्रकाशनों में सन्दर्भ क्षणभंगुर हैं और विकिपीडिया की बड़ी चर्चाओं का हिस्सा हैं, एक परिभाषा से आगे नहीं बढ़ रहे हैं, हालाँकि द नैशुआ टेलीग्राफ में डेविड ब्रूक्स ने इसे "जंगली और ऊनी" के रूप में वर्णित किया है। विक्षनरी के स्वतंत्र कवरेज में बाधाओं में से एक यह भ्रम है कि यह केवल विकिपीडिया का विस्तार है।
अंग्रेजी विक्षनरी में पोलिश शब्दों के एक उपसमूह के लिए विभक्तियों की शुद्धता के माप से पता चला है कि यह व्याकरणिक डेटा बहुत स्थिर है (एक अध्ययन से पता चला है कि 4,748 पोलिश शब्दों में से केवल 131 ने अपने विभक्ति डेटा को सही किया है)।
2016 तक, अकादमिक क्षेत्र में विक्षनरी का उपयोग बढ़ रहा है।
प्राकृतिक भाषा प्रसंस्करण में विक्षनरी डेटा
संपादित करेंविक्षनरी में अर्ध-संरचित डेटा है। प्राकृतिक भाषा प्रसंस्करण कार्यों में उपयोग करने के लिए विक्षनरी लेक्सिकोग्राफ़िक डेटा को मशीन-पठनीय प्रारूप में परिवर्तित किया जा सकता है।
विक्षनरी का डेटा माइनिंग एक जटिल कार्य है। इसमें निम्नलिखित कठिनाइयाँ हैं:
- (1) डेटा और स्कीमाटा में निरंतर और लगातार परिवर्तन
- (2) विक्षनरी भाषा संस्करण स्कीमाटा में विविधता और
- (3) विकी की मानव-केंद्रित प्रकृति।
विभिन्न विक्षनरी भाषा संस्करणों के लिए कई पार्सर हैं:
- डीबीपीडिया विक्षनरी: डीबीपीडिया का एक उपप्रोजेक्ट, डेटा अंग्रेजी, फ्रेंच, जर्मन और रूसी विक्षनरी से निकाला जाता है; डेटा में भाषा, भाषण के भाग, परिभाषाएँ, अर्थ संबंधी संबंध और अनुवाद शामिल हैं। जानकारी निकालने के लिए पेज स्कीमा का घोषणात्मक विवरण, नियमित अभिव्यक्ति और परिमित राज्य ट्रांसड्यूसर का उपयोग किया जाता है।
- JWKTL (जावा विक्षनरी लाइब्रेरी): जावा विक्षनरी एपीआई के माध्यम से अंग्रेजी विक्षनरी और जर्मन विक्षनरी डंप तक पहुंच प्रदान करता है। डेटा में भाषा, भाषण के भाग, परिभाषाएँ, उद्धरण, शब्दार्थ संबंध, व्युत्पत्तियाँ और अनुवाद शामिल हैं। JWKTL को अपाचे लाइसेंस के तहत वितरित किया जाता है।
- विकोकिट: अंग्रेजी विक्षनरी और रूसी विक्षनरी का पार्सर। पार्स किए गए डेटा में भाषा, भाषण के भाग, परिभाषाएं, उद्धरण, अर्थ संबंधी संबंध और अनुवाद शामिल हैं। यह एक बहु-लाइसेंस प्राप्त ओपन-सोर्स सॉफ़्टवेयर है।
- व्युत्पत्ति संबंधी प्रविष्टियों को व्युत्पत्ति संबंधी वर्डनेट प्रोजेक्ट में पार्स किया गया है।
विक्षनरी डेटा की सहायता से हल किए गए प्राकृतिक भाषा प्रसंस्करण कार्यों के उदाहरणों में शामिल हैं:
- डच भाषा और अफ़्रीकी के बीच नियम-आधारित मशीनी अनुवाद; एपर्टियम मशीन अनुवाद प्लेटफॉर्म के साथ अंग्रेजी विक्षनरी, डच विक्षनरी और विकिपीडिया के डेटा का उपयोग किया गया था।
- पार्सर NULEX द्वारा मशीन-पठनीय शब्दकोश का निर्माण, जो खुले भाषाई संसाधनों को एकीकृत करता है: अंग्रेजी विक्षनरी, वर्डनेट और वर्बनेट। पार्सर NULEX तनावपूर्ण जानकारी (क्रिया), बहुवचन रूप और भाषण के कुछ हिस्सों (संज्ञा) के लिए अंग्रेजी विक्षनरी को स्क्रैप करता है।
- वाक् पहचान और संश्लेषण, जहां विक्षनरी का उपयोग स्वचालित रूप से उच्चारण शब्दकोश बनाने के लिए किया जाता था। शब्द-उच्चारण जोड़े 6 विक्षनरी भाषा संस्करणों (चेक, अंग्रेजी, फ्रेंच, स्पेनिश, पोलिश और जर्मन) से पुनर्प्राप्त किए गए थे। उच्चारण अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला के अनुसार हैं। अंग्रेजी विक्षनरी पर आधारित एएसआर प्रणाली में शब्द त्रुटि दर सबसे अधिक है, जहां प्रत्येक तीसरे स्वर को बदलना पड़ता है।
- ऑन्टोलॉजी इंजीनियरिंग और सिमेंटिक नेटवर्क निर्माण।
- ऑन्टोलॉजी मिलान।
- पाठ सरलीकरण. मेडेरो और ओस्टेंडॉर्फ ने विक्षनरी डेटा की मदद से शब्दावली कठिनाई (पढ़ने के स्तर का पता लगाना) का आकलन किया। विक्षनरी प्रविष्टियों से निकाले गए शब्दों के गुणों (परिभाषा लंबाई और पीओएस, अर्थ और अनुवाद गणना) की जांच की गई।
मेडेरो और ओस्टेंडॉर्फ को इसकी उम्मीद थी
- (1) बहुत सामान्य शब्दों में भाषण के कई भाग होने की अधिक संभावना होगी,
- (2) सामान्य शब्दों में एकाधिक अर्थ होने की अधिक संभावना होगी,
- (3) सामान्य शब्दों का कई भाषाओं में अनुवाद होने की अधिक संभावना होगी। विक्षनरी प्रविष्टियों से निकाली गई ये विशेषताएं सरल अंग्रेजी विकिपीडिया लेखों में दिखाई देने वाले शब्द प्रकारों को उन शब्दों से अलग करने में उपयोगी थीं जो केवल मानक अंग्रेजी तुलनीय लेखों में दिखाई देते हैं।
- भाषण का भाग टैगिंग. ली एट अल. (2012) ने अंग्रेजी विक्षनरी और छिपे हुए मार्कोव मॉडल के आधार पर आठ संसाधन-गरीब भाषाओं के लिए बहुभाषी पीओएस-टैगर्स का निर्माण किया।
- भावनाओं का विश्लेषण।
विकिपीडिया को संरचित डेटा समर्थन प्रदान करने के लिए 2018 में "विकिडेटा: लेक्सिकोग्राफ़िकल डेटा" शुरू किया गया था। यह विकिडेटा में एक समर्पित "लेक्सेम" नेमस्पेस के तहत मशीन पठनीय डेटा मॉडल में सभी भाषाओं के शब्द डेटा को संग्रहीत करता है। अक्टूबर 2021 तक, परियोजना ने विभिन्न भाषाओं की 600,000 से अधिक लेक्सेम प्रविष्टियाँ एकत्र की हैं।
यह भी देखिए
संपादित करेंसन्दर्भ
संपादित करें- ↑ "Wiktionary.org Site Info". मूल से 18 मई 2017 को पुरालेखित. अभिगमन तिथि 2017-04-13.
- ↑ "Main Page", Wikipedia, the free encyclopedia (अंग्रेज़ी में), 2023-12-12, अभिगमन तिथि 2024-02-15
- ↑ "Main Page". Wikipedia, the free encyclopedia (अंग्रेज़ी में). 12 दिसम्बर 2023.