Total Pageviews

Sunday, December 10, 2017

वर्डनेट (WordNet)


वर्डनेट अँग्रेज़ी के शब्दों का एक विशाल डाटाबेस है। जार्ज . मिलर (George a. miller) द्वारा 1980 के दशक में इस परियोजना का आरंभ किया गया। इसमें शब्दों को उनके वर्गों, यथा- संज्ञा, विशेषण, क्रिया, क्रियाविशेषण आदि में समूहित करके रखा गया है जिसे संज्ञानात्मक पर्यायों का समुच्चय (सिनसेटSynset) कहा जाता है। प्रत्येक सिनसेट एक प्रकार की संकल्पना का प्रतिनिधित्व करता है। सभी सिनसेटों को संकल्पनार्थी (conceptual-semantic) और शब्दवृत्तिक (lexical) संबंधों द्वारा एक दूसरे से जोड़ा जाता है। वर्डनेट ऑनलाइन प्रयोग के लिए इंटरनेट पर नि:शुल्क उपलब्ध है। इसमें शब्दों एवं सूचनाओं को देखने के लिए एक अंतरापृष्ठ भी दिया गया है – 
 इस अंतरापृष्ठ में कोई भी शब्द या पदबंध इनपुट के रूप में दिया जा सकता है। उसके बारे में आप जो भी सूचनाएँ देखना चाहते हैं उन्हें “Display Options” में चयनित करें, जैसे यहाँ पर ‘Show all’ हाईलाइट है। इसमें सब कुछ प्रदर्शित किया जाएगा। उदाहरण के लिए नीचे ‘science’ शब्द देने के बाद प्राप्त परिणामों को दिखाया जा रहा है
इसमें लिंक S द्वारा सिनसेट या आर्थी संबंधों को प्रदर्शित किया जा रहा है। प्रथम S को क्लिक करने पर आने वाली सूचनाएँ इस प्रकार हैं: 
इसमें science शब्द के अर्थ के प्रयोग एवं विस्तार से जुड़ी अनेक प्रकार की सूचनाएँ दी गई हैं जिन्हें संबंधित लिंक पर क्लिक करके प्राप्त किया जा सकता है।
इस प्रकार देखा जाए तो वर्डनेट संकल्पनाओं एवं उनके बीच निहित संबंधों को व्यवस्थित रूप से प्रदर्शित करने वाली एक इकाई है। इसमें प्रत्येक शब्द से जुड़ी आर्थी सूचनाओं को ऊपर दिखाए गए लिंकों के माध्यम से प्राप्त किया जा सकता है। अत: यह संगणकीय आर्थी विश्लेषण के संबंध में एक उपयोगी टूल है।
हिंदी शब्दतंत्र पर आई.आई.टी. मुंबई में पुष्पक भट्टाचार्य के नेतृत्व में कार्य किया गया है।
संदर्भ-
Fellbaum, Christiane (2005). WordNet and wordnets. In: Brown, Keith et al. (eds.), Encyclopedia of Language and Linguistics, Second Edition, Oxford: Elsevier, 665-670
http://wordnet.princeton.edu/

No comments:

Post a Comment