भाषा प्रौद्योगिकी :
परिचय (Language Technology : An
Introduction)
भाषा प्रौद्योगिकी वह ज्ञानानुशासन है जिसके अंतर्गत मानव भाषाओं के ज्ञान को
विश्लेषित करके मशीन में इस प्रकार से स्थापित करने का प्रयास किया जाता है कि
मशीन द्वारा भाषा संबंधी कार्य कराए जा सकें। यह एक अंतरानुशासनिक विषय है- जिसमें
भाषा का पक्ष ‘भाषाविज्ञान’ (Linguistics) द्वारा और ‘प्रौद्योगिकी/मशीन’ का पक्ष ‘कंप्यूटरविज्ञान’ (Computer
Science) द्वारा संपन्न किया जाता है। इनमें से भाषाविज्ञान द्वारा
किसी मानव भाषा का भाषावैज्ञानिक अध्ययन कर उसमें प्राप्त ‘इकाइयों
और नियमों की व्यवस्था’ को सूत्ररूप में प्रस्तुत किया जाता
है। ‘कंप्यूटरविज्ञान’ से कंप्यूटर के
संबंध में केवल उतना ज्ञान अर्जित किया जाता है, जिससे भाषावैज्ञानिक
अध्ययन से प्राप्त ज्ञान को कंप्यूटर में स्थापित किया जा सके।
हम जानते हैं कि कंप्यूटर या मशीन विद्युत के ‘ऑन और ऑफ’ द्वारा संचालित होती है, जिसे हम अपनी सुविधा के लिए ‘1’ और ‘0’ से प्रदर्शित करते हैं और इनके संयोजनों (combinations) से निर्मित भाषा को ‘द्विआधारी भाषा’ (बाइनरी भाषा) कहते हैं। मशीन केवल इसी भाषा में दिए गए निर्देशों को
समझने और संसाधित करने में सक्षम होती है। इस भाषा में आदेश देने के लिए संयोजित
कोड इस प्रकार दिखाई देते हैं- 00100101, 10101110 आदि। शून्य और एक के ये दो संयोजन हैं, जिनके
माध्यम से मशीन को दो बातें बताई जा सकती हैं। एक पूरे कंप्यूटर को संचालित करने
के लिए ऐसे हजारों-लाखों कोड दिए जाते हैं। स्पष्ट है कि किसी व्यक्ति द्वारा ऐसे
कोडों को याद रख पाना संभव नहीं है। इसीलिए प्रोग्रामिंग भाषाओं का विकास
किया गया। अतः भाषा प्रौद्योगिकी के शोधकर्ता को किसी मानव भाषा के ज्ञान को मशीन
में स्थापित करने के लिए प्रोग्रामिंग भाषा का ज्ञान आवश्यक है। इसी प्रकार भाषा
की आधारभूत इकाइयाँ हैं- शब्द और वाक्य। इनका विशाल संचय शब्दकोश और कार्पस
में किया जाता है। कंप्यूटर में इस प्रकार का संरचित संचय डाटाबेस के
माध्यम से किया जाता है। अतः भाषा प्रौद्योगिकी के शोधकर्ता को किसी-न-किसी
डाटाबेस प्रबंधन प्रणाली का भी ज्ञान होना चाहिए।
इस प्रकार स्पष्ट है कि भाषा प्रौद्योगिकी में मानव भाषाओं का सैद्धांतिक
अध्ययन-विश्लेषण किया जाता है और इस प्रकार प्राप्त ज्ञान को प्रोग्रामिंग भाषाओं
और डाटाबेस के माध्यम से मशीन में इस प्रकार से स्थापित किया जाता है कि मशीन मानव
भाषा संबंधी कार्यों को संपन्न कर सके। प्रोग्रामिंग भाषाओं में मानव भाषाओं के
सामान्य नियम नहीं दिए जा सकते। इसके लिए उन्हें तार्किक रचनाओं में ढालना
पड़ता है। दो अनुशासनों के योग के रूप में भाषा प्रौद्योगिकी की स्थिति इस प्रकार
है-
भाषा प्रौद्योगिकी = भाषाविज्ञान + प्रौद्योगिकी (कंप्यूटर और कंप्यूटर
आधारित मशीनें)
विश्लेषण और अनुप्रयोग की प्रक्रिया की दृष्टि से इसे निम्नलिखित चित्र में
देख सकते हैं-
No comments:
Post a Comment