Total Pageviews

Sunday, February 3, 2019

भाषा प्रौद्योगिकी : परिचय


भाषा प्रौद्योगिकी : परिचय (Language Technology : An Introduction)
भाषा प्रौद्योगिकी वह ज्ञानानुशासन है जिसके अंतर्गत मानव भाषाओं के ज्ञान को विश्लेषित करके मशीन में इस प्रकार से स्थापित करने का प्रयास किया जाता है कि मशीन द्वारा भाषा संबंधी कार्य कराए जा सकें। यह एक अंतरानुशासनिक विषय है- जिसमें भाषा का पक्ष भाषाविज्ञान (Linguistics) द्वारा और प्रौद्योगिकी/मशीन का पक्ष कंप्यूटरविज्ञान’ (Computer Science) द्वारा संपन्न किया जाता है। इनमें से भाषाविज्ञान द्वारा किसी मानव भाषा का भाषावैज्ञानिक अध्ययन कर उसमें प्राप्त इकाइयों और नियमों की व्यवस्था को सूत्ररूप में प्रस्तुत किया जाता है। कंप्यूटरविज्ञान से कंप्यूटर के संबंध में केवल उतना ज्ञान अर्जित किया जाता है, जिससे भाषावैज्ञानिक अध्ययन से प्राप्त ज्ञान को कंप्यूटर में स्थापित किया जा सके।
हम जानते हैं कि कंप्यूटर या मशीन विद्युत के ऑन और ऑफ द्वारा संचालित होती है, जिसे हम अपनी सुविधा के लिए ‘1’ और ‘0’ से प्रदर्शित करते हैं और इनके संयोजनों (combinations) से निर्मित भाषा को द्विआधारी भाषा (बाइनरी भाषा) कहते हैं। मशीन केवल इसी भाषा में दिए गए निर्देशों को समझने और संसाधित करने में सक्षम होती है। इस भाषा में आदेश देने के लिए संयोजित कोड इस प्रकार दिखाई देते हैं- 00100101, 10101110 आदि। शून्य और एक के ये दो संयोजन हैं, जिनके माध्यम से मशीन को दो बातें बताई जा सकती हैं। एक पूरे कंप्यूटर को संचालित करने के लिए ऐसे हजारों-लाखों कोड दिए जाते हैं। स्पष्ट है कि किसी व्यक्ति द्वारा ऐसे कोडों को याद रख पाना संभव नहीं है। इसीलिए प्रोग्रामिंग भाषाओं का विकास किया गया। अतः भाषा प्रौद्योगिकी के शोधकर्ता को किसी मानव भाषा के ज्ञान को मशीन में स्थापित करने के लिए प्रोग्रामिंग भाषा का ज्ञान आवश्यक है। इसी प्रकार भाषा की आधारभूत इकाइयाँ हैं- शब्द और वाक्य। इनका विशाल संचय शब्दकोश और कार्पस में किया जाता है। कंप्यूटर में इस प्रकार का संरचित संचय डाटाबेस के माध्यम से किया जाता है। अतः भाषा प्रौद्योगिकी के शोधकर्ता को किसी-न-किसी डाटाबेस प्रबंधन प्रणाली का भी ज्ञान होना चाहिए।
इस प्रकार स्पष्ट है कि भाषा प्रौद्योगिकी में मानव भाषाओं का सैद्धांतिक अध्ययन-विश्लेषण किया जाता है और इस प्रकार प्राप्त ज्ञान को प्रोग्रामिंग भाषाओं और डाटाबेस के माध्यम से मशीन में इस प्रकार से स्थापित किया जाता है कि मशीन मानव भाषा संबंधी कार्यों को संपन्न कर सके। प्रोग्रामिंग भाषाओं में मानव भाषाओं के सामान्य नियम नहीं दिए जा सकते। इसके लिए उन्हें तार्किक रचनाओं में ढालना पड़ता है। दो अनुशासनों के योग के रूप में भाषा प्रौद्योगिकी की स्थिति इस प्रकार है-
भाषा प्रौद्योगिकी =  भाषाविज्ञान + प्रौद्योगिकी (कंप्यूटर और कंप्यूटर आधारित मशीनें)
विश्लेषण और अनुप्रयोग की प्रक्रिया की दृष्टि से इसे निम्नलिखित चित्र में देख सकते हैं-


No comments:

Post a Comment