Total Pageviews

Sunday, November 13, 2016

भाषाविज्ञान के अनुप्रयुक्त पक्ष में तकनीकी

डॉ. धनजी प्रसाद     
      (Technology in the Applied Aspect of Linguistics)
भाषाविज्ञान भाषा का वैज्ञानिक अध्ययन कर इसकी संरचना को विभिन्न स्तरों पर पाई जाने वाली व्यवस्था के रूप में वर्णित करता है। बढ़ते हुए क्रम में भाषिक स्तर इस प्रकार हैं:
     स्वनिम       रूपिम         शब्द       पदबंध      उपवाक्य        वाक्य       प्रोक्ति
उपर्युक्त इकाइयों में प्रत्येक बड़ी इकाई एक से अधिक छोटी इकाइयों (या कम से कम एक) के परस्पर मिलने से बनी होती है। भाषावैज्ञानिक उन नियमों और स्थितियों को खोजने का प्रयास करते हैं जिनमें छोटी इकाइयों को मिलाकर बड़ी इकाई का निर्माण किया जाता है और व्यवहार में लाया जाता है। सामान्य भाषिक व्यवहार में स्वनभाषा की सबसे छोटी इकाई है। जब स्वनों का प्रयोग वाक्यात्मक और अर्थपूर्ण ढंग से किया जाता है तब ये संप्रेषणात्मक हो जाते हैं और इनका प्रयोग अर्थ’ (अर्थपूर्ण विचारों) के प्रेषण और ग्रहण हेतु किया जाता है। यहाँ पर एक बात महत्वपूर्ण है कि न तो स्वनभाषा हैं और न ही अर्थ। भाषा एक व्यवस्था है जो स्वनों को अर्थ से जोड़ती है। यह अमूर्त होती है और मानव मस्तिष्क में पाई जाती है। भाषावैज्ञानिक इस व्यवस्था को समझने का प्रयास करते हैं और व्याकरणके रूप में इसे प्रस्तुत करने का प्रयास करते हैं। जैसे : चॉम्स्की का रूपांतरक प्रजनक व्याकरण, हैलिडे का व्यवस्थापरक व्याकरण, लैम्ब का स्ट्रैटीफिकेशनल व्याकरण और फिल्मोर का कारक व्याकरण आदि। इन व्याकरणों में ये सभी भाषावैज्ञानिक भाषा की संरचना को समझने के लिए कुछ इकाइयाँ, स्तर और विधियाँ प्रदान करते हैं।
भाषाविज्ञान के अनुप्रयुक्त क्षेत्र (Applied Areas Of Linguistics):
प्रत्येक सैद्धांतिक विज्ञान के कुछ अनुप्रयोग क्षेत्र होते हैं; क्योंकि अनुप्रयोगों के माध्यम से सिद्धांत वास्तविक जीवन में व्यवहृत होते हैं। भाषाविज्ञान उनमें से एक है। इसके अनेक अनुप्रयुक्त क्षेत्र हैं। रवींद्रनाथ श्रीवास्तव ने अपनी पुस्तक अनुप्रयुक्त भाषाविज्ञान’ (1995)  में संदर्भ के आधार पर इनके तीन वर्ग किए हैं जो निम्नलिखित हैं :
1.        ज्ञानक्षेत्र का संदर्भ
2.        विद्या-विशेष का संदर्भ
3.        भाषा शिक्षण का संदर्भ
आगे उन्होंने इनकी व्याख्या की है और विविध उपक्षेत्रों (जैसे : समाजभाषाविज्ञान, मनोभाषाविज्ञान, अनुवाद और कोशविज्ञान आदि) को इनमें वर्गीकृत किया है।
किंतु मेरा मानना है कि आधुनिक दृष्टि से भाषाविज्ञान के सभी अनुप्रयोगों की पूर्णत: व्याख्या इस वर्गीकरण द्वारा नहीं की जा सकती है। अत: भाषाविज्ञान के अनुप्रयोगों को उनके प्रयोग, रूप और प्रकृति के अनुसार निम्नलिखित तीन वर्गों में रखा जा रहा है :

1.         व्यावहारिक अनुप्रयोग (Practical Application)
2.         अंतरानुशासनिक अनुप्रयोग (Interdisciplinary Application)
3.         तकनीकी अनुप्रयोग (Technological Application)
1. व्यावहारिक अनुप्रयोग (Practical Application) : यहाँ पर व्यावहारिकका अर्थ है : वास्तविक जीवन में सीधा अनुप्रयोग। इसलिए वे सभी ज्ञानक्षेत्र जो भाषावैज्ञानिक ज्ञान का उपयोग करते हैं और हमारे व्यावहारिक जीवन के लिए सीधे-सीधे कुछ न कुछ प्रदान करते हैं, इसके अन्तर्गत आएंगे। इनमें भाषाशिक्षण, अनुवाद, कोशविज्ञान, भाषा-नियोजन और वाक्.दोष चिकित्सा आदि प्रमुख हैं। ये सभी ज्ञानक्षेत्र भाषावैज्ञानिक ज्ञान का उपयोग करते हैं और ऐसी चीजें प्रदान करते हैं जिन्हें वास्तविक जीवन में देखा जाता है और प्रयोग में लाया जाता है; जैसे :
Ø भाषा शिक्षण भाषावैज्ञानिक ज्ञान का उपयोग करता है और अध्येताओं को वास्तविक संसार में लक्ष्य भाषा में संप्रेषण के योग्य बनाता है।
Ø अनुवाद में दो भाषाओं के भाषावैज्ञानिक ज्ञान का उपयोग किया जाता है और इसके माध्यम से लक्ष्य भाषा में एक अनूदित पाठ प्राप्त होता है।
Ø कोशविज्ञान हमारे लिए कोश प्रदान करता है।                आदि।
2. अंतरानुशासनिक अनुप्रयोग (Interdisciplinary Application) : ऐसी बहुत सी विधाएँ हैं जिनमें भाषाविज्ञानऔर दूसरे विज्ञानएक साथ मिलकर अन्य क्षेत्रों से जुड़े हुए भाषा के विविध पक्षों का अध्ययन करते हैं। ये सभी विधाएँ इस वर्ग में आती हैं। इनमें समाजभाषाविज्ञान, मनोभाषाविज्ञान, न्यूरोभाषाविज्ञान और शैलीविज्ञान आदि सर्वाधिक प्रचलित हैं :
Ø समाजभाषाविज्ञान में सामाजिक विज्ञानऔर भाषाविज्ञानमिले हुए हैं। इसमें भाषाऔर समाजके बीच संबंधों का अध्ययन किया जाता है।
Ø मनोभाषाविज्ञान भाषाऔर मानव मनके बीच संबंधों का अध्ययन करता है। इसमें भाषा के संज्ञान और उत्पादन के सभी पक्षों को देखा जाता है।
Ø न्यूरोभाषाविज्ञान में मानव मस्तिष्क के न्यूरॉनतंत्र’ (neural schema of human brain) और भाषाके बीच संबंधों का अध्ययन किया जाता है।
Ø शैलीविज्ञान उन तत्वों की खोज करता है जो किसी भाषिक उक्ति या रचना को साहित्यबना देते हैं। अत: इसमें भाषाविज्ञानऔर साहित्यका सम्मिलन होता है।             आदि।
यहाँ पर हम देख सकते हैं कि उपर्युक्त सभी विधाओं में एक से अधिक विज्ञान मिले हुए हैं। किंतु इनमें भाषाविज्ञानसबमें है। अत: यहाँ पर भाषाविज्ञान का अंतरानुशासनिक अनुप्रयोग प्राप्त होता है।
3. तकनीकी अनुप्रयोग (Technological Application) : तकनीकी वह क्षेत्र है जहाँ प्रत्येक वैज्ञानिक सिद्धांत व्यवहार में आता है। इसका पारम्परिक अर्थ बहुत व्यापक है। सामान्य रूप से तकनीकीशब्द का प्रयोग सभी प्रकार के औजारों, विधियों और शिल्प के लिए किया जाता है जिनका किसी भी वस्तु (artifact) के निर्माण में प्रयोग हुआ हो। इसलिए यह एक प्रक्रिया है जिसके माध्यम से भौतिक पदार्थों को, उनके बारे में प्राप्त वैज्ञानिक ज्ञान की सहायता से उपयोगी उत्पादों में बदल दिया जाता है। इसे निम्नलिखित आरेख की सहायता से समझ सकते हैं :




 
किंतु आजकल तकनीकीशब्द का अर्थ केवल विद्युतिक औजारों तथा मशीनों के निर्माण में लगी विधि एवं कौशल पर केंद्रित हो गया है। वर्तमान में विद्युतीय परिवेश (electrical phenomenon) का विस्तार हमारे दैनिक जीवन के सभी क्षेत्रों में हो गया है। किंतु इनके निर्माण के लिए विज्ञान ही सैद्धांतिक ज्ञान प्रदान करते हैं। यहीं कारण है कि सभी विज्ञान अपने सैद्धांतिक ज्ञान का तकनीकी अनुप्रयोग इसी विशेष अर्थ (specific sense) में ढूढ़ रहे हैं। भाषावैज्ञानिक ज्ञान के भी इस प्रकार के अनेक अनुप्रयोग हैं।
तकनीकी अनुप्रयोग की विधाएँ (Disciplines For Technological Applications):
भाषाविज्ञान का तकनीकी अनुप्रयोग डिजिटल मशीनों मुख्यत: संगणक (computer) से जुड़ा हुआ है। आज अनेक साफ्टवेयरों और अनुप्रयोग प्रणालियों’ (softwares and application systems) का विकास संगणक द्वारा किया जा रहा है। ये हमारे जीवन के सभी क्षेत्रों से जुड़े हुए हैं। इनका प्रयोग करते हुए आज हम पहले की अपेक्षा अधिक सरलता से और तेजी से अपने दैनिक, कार्यालयी, व्यावसायिक कार्यों को कर रहे हैं। किंतु यह सत्य है कि लगभग हमारे सभी कार्य (किसी न किसी रूप में) भाषा से जुड़े हुए हैं। इसलिए संगणक को और अधिक उपयोगी और संप्रेषणात्मक बनाने के लिए भाषिक ज्ञान को स्थापित करना आवश्यक है। यहीं कारण है कि संपूर्ण विश्व में भाषा से जुड़े साफ्टवेयरों का तेजी से विकास किया जा रहा है। इस कार्य के लिए पिछले पाँच दशकों में अनेक विधाएँ उभरकर सामने आईं हैं। इनमें तीन सर्वाधिक महत्वपूर्ण और प्रसिद्ध विधाएँ इस प्रकार हैं :
(क)   संगणकीय भाषाविज्ञान (Computational Linguistics)
(ख)   भाषा प्रौद्योगिकी (Language Technology)
(ग)     भाषा अभियांत्रिकी (Language Engineering)
यहाँ पर एक बात ध्यान देने योग्य है कि ये तीनों विधाएँ पूर्णत: एक दूसरे से अलग नहीं हैं। ये परस्पर सहसंबंधित हैं और कई क्षेत्रों में एक दूसरे का अतिक्रमण (overlap) करती हैं। इन तीनों का संक्षिप्त परिचय इस प्रकार है :
(क) संगणकीय भाषाविज्ञान (Computational Linguistics) : जैसा कि इसके नाम से ही स्पष्ट है; यह संगणकविज्ञानऔर भाषाविज्ञानसे मिलकर बना हुआ अंतरानुशासनिक विषय है। राल्फ ग्रिसमैन ने ‘Computational Linguistics’ (1994)  में कहा है, “Computational Linguistics is the study of computer systems for understanding and generating Natural Language.”
संगणक में तीव्र संसाधन गति और विशाल स्मृति क्षमता होती है। यदि किसी संगणक को ठीक से क्रमादेशित (well-programmed) किया गया हो तो यह मनुष्य से हजारों गुना अधिक गति से कार्य करता है और क्षणमात्र में संदेश आदि को विश्व के किसी भी कोने में भेजता और प्राप्त करता है। इसीलिए संगणक या संगणकीय मशीनों की सहायता से किए जाने वाले सभी कार्य आज हाई-टेकहो गए हैं। यहीं कारण है कि शोधकर्ता प्राकृतिक भाषाओं के ज्ञान को तेजी से संगणक में स्थापित करते जा रहे हैं। आज यह कार्य विश्व की सभी भाषाओं के लिए किया जा रहा है और इस प्रकार संगणकीय भाषाविज्ञान का संभावनाओं से भरपूर शोधक्षेत्र के रूप में उदय हो रहा है।
(ख) भाषा-प्रौद्योगिकी (Language Technology): भाषा-प्रौद्योगिकी भाषावैज्ञानिक ज्ञान के तकनीकी अनुप्रयोग की एक संगणकीय भाषाविज्ञान से विस्तृत क्षेत्रों से युक्त विधा है। इसमें भाषा से जुड़ी साफ्टवेयर प्रणालियों का विकास न केवल संगणक के लिए किया जाता है बल्कि अन्य प्लेटफॉर्मों जैसे, मोबाइल, कृत्रिम बुद्धि से जुड़े औजार एवं भाषा आधारित अन्य मशीनों के लिए किया जाता है। संगणकीय भाषाविज्ञान और भाषा-प्रौद्योगिकी दोनों एक ही कार्य करते हैं किंतु जहाँ संगणकीय भाषाविज्ञान केवल संगणकों तक ही सीमित है वहीं भाषा-प्रौद्योगिकी अन्य प्लेटफॉर्मों को भी सम्मिलित करता है।
प्राकृतिक भाषा संसाधनभाषा-प्रौद्योगिकी और संगणकीय भाषाविज्ञान की आधारभूत विधि है। इसके द्वारा ही प्राकृतिक भाषाओं से जुड़े कार्यों को करने के लिए साफ्टवेयरों का विकास किया जाता है। प्राकृतिक भाषाएँ अपनी प्रकृति और संरचना में बहुत ही जटिल और संदिग्ध (complex and ambiguous) होती हैं। इन भाषाओं को रूपात्मक व्याकरणों जैसे : LFG, HPSG, GPSG, TAG आदि का प्रयोग करते हुए संसाधित किया जाता है। रूपात्मक व्याकरण भाषा के नियमों को तार्किक अभिव्यक्तियों के रूप में प्रतिपादित करते हैं।
(ग) भाषा अभियांत्रिकी (Language Engineering): भाषा अभियांत्रिकी विद्वानों के बीच एक नवीनतम अवधारणा (recent concept) है। इसकी आवश्यक्ता पड़ने का कारण यह है कि प्राकृतिक भाषा बोधन’ (Natural Language Understanding) और प्राकृतिक भाषा उत्पादन’ (Natural Language Production) का कार्य ठीक से और पूर्णत: सामान्य प्रणालियों द्वारा कर पाना संभव नहीं है। इस संदर्भ में राल्फ ग्रिसमैन का कहना है, “Constructing a fluent, robust natural language interface is a difficult and complex task. Perhaps our understanding of the language improves, we will be able to construct simpler natural language systems. For the present, however, much of the challenges of building such a system lies in integrating many different types of knowledge – syntactic knowledge, semantic knowledge, knowledge of domain of discourse – and using them effectively in language processing. In this respect, the building of natural language systems – like other large computer systems – is a major task of engineering.”
अत: यह भाषा से संबंधित औजारों और प्रणालियों की डिजाइनिंग, निर्माण, प्रयोग और सुधार पर बल देता है। इस कार्य को पूर्ण करने के लिए भाषा अभियांत्रिकी का उदय हुआ है और यह तेजी से विकसित हो रहा है।
तकनीकी अनुप्रयोग के क्षेत्र (Areas/ Fields Of Technological Application) :
इस प्रकार स्पष्ट है कि भाषाविज्ञान के तकनीकी अनुप्रयोग का अर्थ है, भाषावैज्ञानिक ज्ञान का इलेक्ट्रानिक मशीनों और औजारों (electronic machines and tools) के निर्माण में प्रयोग, जिससे कि वे भाषा से संबंधित कार्यों को संपन्न कर सकें। बहुत सारे क्षेत्रों में यह कार्य हो रहा है; उनमें से कुछ प्रमुख क्षेत्र निम्नलिखित हैं:
1.     मशीनी अनुवाद (Machine Translation)
2.     प्रकाशिक अक्षर पहचान (Optical Character Recognition)
3.     पाठ से वाक् और वाक् से पाठ (Speech-to-Text and Text-to-Speech)
4.     सूचना प्रत्ययन (Information Extraction and Information Retrieval)
5.     पाठ सारांशीकरण (Text Summarization)
6.     संगणकीय कोशकला और संगणकीय कोशविज्ञान (Computational Lexicography and Computational Lexicology)
7.     संगणक साधित भाषा अधिगम (Computer Assisted Language Learning)
8.     प्रश्न उत्तर प्रणालियाँ (Question Answer Systems)
9.     भाषा पठन और लेखन सहयोग (Language Reading and Writing Adds)
10. वाक् संज्ञानक (Voice Recognizer)
1. मशीनी अनुवाद (Machine Translation-MT) : संगणकीय भाषाविज्ञान और भाषा प्रौद्योगिकी के अनुप्रयुक्त क्षेत्र के रूप में मशीनी अनुवादसर्वाधिक प्रसिद्ध क्षेत्र है। यह ऐसी साफ्टवेयर प्रणालियों  का विकास से संबंधित है जिनके माध्यम से किसी एक प्राकृतिक भाषा के पाठ का अनुवाद दूसरी भाषा में स्वचलित रूप से किया जा सके। इन साफ्टवेयर प्रणालियों में भाषिक ज्ञान को
 वाक्यात्मक नियमों और कोश (syntactic rules and lexicon) के अंतर्गत या विशाल संग्रह जैसे : कार्पस (corpus) आदि में रखा जाता है। मशीनी अनुवाद प्रणालियों के विकास हेतु मुख्यत: चार प्रकार के उपागम अपनाए गए हैं जो निम्नलिखित हैं :
(क)        नियम आधारित (Rule based)
(ख)        सांख्यिकीय (Statistical )
(ग)         उदाहरण आधारित (Example-based)
(घ)         संकर  (Hybrid)
2. प्रकाशिक अक्षर पहचान (Optical Character Recognition-OCR) : इसके अंतर्गत मुद्रित, टंकित या लिखित पाठ की स्कैन की हुई प्रतियों को स्वचलित रूप से मशीन द्वारा पठनीय पाठों में बदल दिया जाता है जिससे कि आवश्यक्तानुसार उनमें परिवर्तन सुधार और संसोधन किया जा सके।
3. पाठ से वाक् और वाक् से पाठ (Text-to-Speech-TTS & Speech-to-Text- STT) : इस प्रकार की अनुप्रयोग प्रणालियों का विकास वाक् अभिज्ञान और वाक् संश्लेषण का अनुप्रयोगिक पक्ष है। इसमें  लिखित भाषा में उपलब्ध सामग्री को वाचिक भाषा और वाचिक भाषा में उपलब्ध सामग्री को लिखित भाषा में बदलने वाली साफ्टवेयर प्रणालियों का विकास किया जाता है।
4. सूचना प्रत्ययन (Information Retrieval-) : इस क्षेत्र में खोज इंजनों’ (Search Engines) का विकास किया जाता है। उदाहरण के लिए 'गूगल' एक खोज इंजन है जिसमें हम कोई भी शब्द, पदबंध या वाक्य डालकर उससे संबंधित सूचनाएँ इंंटरनेट से प्राप्त करते हैं।
5. पाठ सारांशीकरण  (Text Summarization) : इसके अंतर्गत ऐसी संगणक प्रणालियों का विकास किया जाता है जो किसी पाठ की मुख्य और महत्वपूर्ण बातों का संज्ञान करते हुए उसका सारांश निर्मित कर सके।
6. संगणकीय कोशकला और संगणकीय कोशविज्ञान (Computational Lexicography and Computational Lexicology) : इनमें संगणकीय कोशकला का संबंध कोशों के निर्माण में संगणक के प्रयोग या संगणक के अंतर्गत कोश के निर्माण से है। इसकी जगह संगणकीय कोशविज्ञान का संबंध कोशों या संगणक के अंतर्गत निर्मित कोशों के अध्ययन में संगणक के प्रयोग से है।
7. संगणक साधित भाषा अधिगम (Computer Assisted Language Learning) : इसमें भाषा अधिगम और भाषा शिक्षण हेतु सहायक सामग्री के निर्माण में संगणक का प्रयोग किया जाता है।
8. प्रश्न उत्तर प्रणालियाँ (Question Answer Systems) : इस क्षेत्र में ऐसी प्रणालियों का विकास किया जाता है जो प्राकृतिक भाषाओं में पूछे गए प्रश्नों का स्वचलित रूप से उत्तर दे सकें।
9. भाषा पठन और लेखन सहयोग (Language Reading and Writing Adds) : इस कार्य के लिए अनुप्रयोग साफ्टवेयर प्रणालियों का विकास भी किया जा रहा है।
10. वाक् संज्ञानक (Voice Recognizer) : अनेक कार्यों के लिए आज वाक् संज्ञानकों का विकास किया जा चुका है और उन्हें सुधारने, परिष्कृत करने का प्रयास किया जा रहा है।
11. कृत्रिम बुद्धि (Artificial Intelligence) : बुद्धिमान मशीनें बनाने का कार्य।
इस प्रकार हम देखते हैं कि किसी भी भाषा का वैज्ञानिक ज्ञान हमारे जीवन के विविध कार्यों में बहुत महत्वपूर्ण है। भाषावैज्ञानिक ज्ञान का प्रयोग कहीं तो हम अपने जीवन में सीधे-सीधे कर रहे हैं तो कहीं पर इस ज्ञान का प्रयोग भाषा के विविध पक्षों के संदर्भ में और अधिक ज्ञान प्राप्त करने के लिए किया जा रहा है। अत: भाषाविज्ञान के अनेक अनुप्रयोग हैं।
आज तकनीकी हमारे तीव्रऔर बेहतरजीवन की आवश्यक्ता है। इसने हमारे दैनिक जीवन में बहुत तेजी से स्थान बनाया है। इसलिए सभी विज्ञानों के सैद्धांतिक ज्ञान का तकनीकी क्षेत्रों से व्यापक रूप से अनुप्रयोग किया गया है। भाषाविज्ञान के तकनीकी अनुप्रयोगों के भी बहुत सारे क्षेत्रों का उदय हुआ है और ये क्षेत्र वैश्विक स्तर पर महत्वपूर्ण साबित हुए हैं।
संदर्भ‌-सूची
1.      श्रीनिवास, रविंद्रनाथ और अन्य (1995) अनुप्रयुक्त भाषाविज्ञान, नई दिल्ली : आलेख प्रकाशन
2.      प्रसाद, धनजी (2011) भाषाविज्ञान का सैद्धांतिक, अनुप्रयुक्त एवं तकनीकी पक्ष, नई  दिल्ली : प्रकाशन संस्थान।
3.      मल्होत्रा, विजय कुमार (2002) कम्प्यूटर के भाषिक अनुप्रयोग, नई दिल्ली: वाणी प्रकाशन।
4.      Bolshakov, Igor A., Gelbuk Alexader (2004) Computational Linguistics: Models, Resources, Applications, Instituto Politecnico Nacional
5.      Chaitnya, Vineet, Sangal, Rajeev (2000) Natural Language Processing: A Paninian Perspective, New Delhi : Prentice-Hall of India Private Limited
6.      Grishman, Ralph (1994) Computational Linguistics: An Introduction, Cambridge University Press
वेबसाइटें
1.      http://www.tdil.mit.gov.in/news.htm
2.      http://www.dfki.de/~hansu/LT.pdf
3.      http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-035-computer-language-engineering-sma-5502-fall-2005/
4.      http://www.google.co.in/#q=applied+linguistics&hl=en&biw=613&bih=390&prmd=b&source=lnt&tbs=ctr:countryIN&cr=countryIN&sa=X&ei=1jvtTOKdFISXce27wcQP&ved=0CAcQpwU&fp=172c164806d905ff

5.      http://www.dcs.shef.ac.uk/~hamish/LeIntro.html



6 comments: