वर्डनेट अँग्रेज़ी के शब्दों का एक विशाल डाटाबेस है। जार्ज ए. मिलर (George a. miller) द्वारा 1980 के दशक में इस परियोजना का आरंभ किया गया। इसमें शब्दों को उनके वर्गों, यथा- संज्ञा, विशेषण, क्रिया, क्रियाविशेषण आदि में समूहित करके रखा गया है जिसे संज्ञानात्मक पर्यायों का समुच्चय (सिनसेट – Synset) कहा जाता है। प्रत्येक सिनसेट एक प्रकार की संकल्पना का प्रतिनिधित्व करता है। सभी सिनसेटों को संकल्पनार्थी (conceptual-semantic) और शब्दवृत्तिक (lexical) संबंधों द्वारा एक दूसरे से जोड़ा जाता है। वर्डनेट ऑनलाइन प्रयोग के लिए
इंटरनेट पर नि:शुल्क उपलब्ध है। इसमें शब्दों एवं सूचनाओं को देखने के लिए एक अंतरापृष्ठ भी दिया गया है –
इस अंतरापृष्ठ में कोई भी शब्द या पदबंध इनपुट के रूप में दिया जा सकता है। उसके बारे में आप जो भी सूचनाएँ देखना चाहते हैं उन्हें “Display Options” में चयनित करें, जैसे यहाँ पर ‘Show all’ हाईलाइट है। इसमें सब कुछ प्रदर्शित किया जाएगा। उदाहरण के लिए नीचे ‘science’ शब्द देने के बाद प्राप्त परिणामों को दिखाया जा रहा है –
इसमें लिंक S द्वारा सिनसेट या आर्थी संबंधों को प्रदर्शित किया जा रहा है। प्रथम S को क्लिक करने पर आने वाली सूचनाएँ इस प्रकार हैं:
इसमें science शब्द के अर्थ के प्रयोग एवं विस्तार से जुड़ी अनेक प्रकार की सूचनाएँ दी गई हैं जिन्हें संबंधित लिंक पर क्लिक करके प्राप्त किया जा सकता है।
इस प्रकार देखा जाए तो वर्डनेट संकल्पनाओं एवं उनके बीच निहित संबंधों को व्यवस्थित रूप से प्रदर्शित करने वाली एक इकाई है। इसमें प्रत्येक शब्द से जुड़ी आर्थी सूचनाओं को ऊपर दिखाए गए लिंकों के माध्यम से प्राप्त किया जा सकता है। अत: यह संगणकीय आर्थी विश्लेषण के संबंध में एक उपयोगी टूल है।
संदर्भ-
हिंदी शब्दतंत्र पर आई.आई.टी.
मुंबई में पुष्पक भट्टाचार्य के नेतृत्व में कार्य किया गया है।
Fellbaum, Christiane (2005). WordNet and wordnets. In: Brown, Keith et al. (eds.), Encyclopedia of Language and Linguistics, Second Edition, Oxford: Elsevier, 665-670
http://wordnet.princeton.edu/
No comments:
Post a Comment