Total Pageviews

Friday, August 31, 2018

भाषा प्रौद्योगिकी : परिप्रेक्ष्यप और अभिगम -01


                     भाषा प्रौद्योगिकी
मनुष्य                                   प्रौद्योगिकी (मशीन/कंप्यूटर)
भाषा                                          मशीनी/बाइनरी
भाषाविज्ञान                               कंप्यूटरविज्ञान
भाषा का अध्ययन-विश्लेषण         प्रोग्रामिंग + डाटाबेस
  
प्राकृतिक भाषा संसाधन (Natural Language Processing- NLP)

......................................................................................................................................................
इकाई - 1 भाषा प्रौद्योगिकी के परिप्रेक्ष्य
......................................................................................................................................................
1.1 भाषा प्रौद्योगिकी : सैद्धांतिक परिप्रेक्ष्य
भाषा प्रौद्योगिकी के सैद्धांतिक परिप्रेक्ष्य में भाषा के अध्ययन-विश्लेषण संबंधी बातें आती हैं, जो भाषाविज्ञान से संबंधित हैं। इसमें भाषा की संरचना का अध्ययन, भाषा में प्राप्त होने वाले विविध स्तरों का विश्लेषण और विभिन्न परिवेशों में भाषा प्रयोगों का अध्ययन आदि आते हैं।
मुख्य कार्य
·       एक भाषा का विश्लेषणात्मक अध्ययन, जैसे- हिंदी का अध्ययन।
·       एक से अधिक भाषाओं का तुलनात्मक/व्यतिरेकी अध्ययन, जैसे- हिंदी-मराठी, या हिंदी-अंग्रेजी का अध्ययन।
अन्य कार्य
·       एक भाषा के विविध सामाजिक प्रयोगों/संदर्भों का अध्ययन, जैसे- हिंदी या लोथा का उनके सामाजिक परिवेश में अध्ययन। या लोथा भाषी समाज में हिंदी/अंग्रेजी की स्थिति का अध्ययन = समाजभाषिक अध्ययन
·       साहित्यिक कृतियों का शैलीवैज्ञानिक अध्ययन

प्रोक्ति
वाक्य
उपवाक्य
पदबंध
शब्द/पद
रूपिम
स्वनिम

अर्थ

प्रोक्तिविज्ञान

वाक्यविज्ञान

रूपविज्ञान

स्वनिमविज्ञान
1.1.1 भाषा में प्राप्त होने वाले विविध स्तर



इन स्तरों में से किसी भी स्तर पर भाषा का सैद्धांतिक अध्ययन किया जा सकता है।
1.1.2 स्वनिमिक अध्ययन के मुख्य बिंदु
·       स्वनिमों का वर्गीकरण
·       स्वनिमों का वितरण
·       स्वनिमों और संस्वनों (allophone) का निर्धारण
1.1.3 रूपिमिक अध्ययन (रूपिम और शब्द/पद) के मुख्य बिंदु
·       रूपिमों का वर्गीकरण
·       मूल शब्दों/धातुओं और उपसर्ग/प्रत्यय आदि का अध्ययन
·       उपसर्ग/प्रत्यय योग प्रक्रिया का अध्ययन
·       व्युत्पादन और रूपसाधन (Derivation and Inflection)
·       संधि और समास आदि का अध्ययन
·       शब्दवर्गों (Parts of Speech) का निर्धारण/अध्ययन
·       व्याकरणिक कोटियों का अध्ययन
·       एकाधिक भाषाओं की शब्द-संरचना का तुलनात्मक/व्यतिरेकी विश्लेषण
·       एकाधिक भाषाओं की पद-रचना का तुलनात्मक/व्यतिरेकी विश्लेषण
1.1.4 पदबंध स्तरीय अध्ययन के मुख्य बिंदु
·       पदबंधों का वर्गीकरण
·       पदबंध साँचों का निर्धारण
·       एकाधिक भाषाओं में पदबंध रचनाओं का तुलनात्मक/व्यतिरेकी विश्लेषण
1.1.5 उपवाक्य स्तरीय अध्ययन के मुख्य बिंदु
·       उपवाक्यों का वर्गीकरण
·       उपवाक्य साँचों का निर्धारण
·       एकाधिक भाषाओं में उपवाक्य रचनाओं का तुलनात्मक/व्यतिरेकी विश्लेषण
1.1.6 वाक्य स्तरीय अध्ययन के मुख्य बिंदु
·       वाक्यों का वर्गीकरण
·       वाक्य साँचों का निर्धारण
·       एकाधिक भाषाओं में वाक्य रचनाओं का व्यतिरेकी विश्लेषण
1.1.7 प्रोक्ति स्तरीय अध्ययन के मुख्य बिंदु
·       अन्वादेश (anaphora),
·       पूर्वादेश (cataphora)
·       संदर्भ अभिव्यक्तियाँ (referential expressions)  
1.1.8 अर्थ स्तरीय अध्ययन के मुख्य बिंदु
·       पर्याय, विलोम, समानार्थी शब्दों का विश्लेषण
·       अधिनामी (hypernym), अवनामी (hyponym) शब्दों का विश्लेषण
·       लक्षण संरचना (feature structure) का अध्ययन
......................................................................................................................................................
1.2. भाषा प्रौद्योगिकी : अनुप्रयुक्त परिप्रेक्ष्य
भाषा प्रौद्योगिकी के अनुप्रयुक्त परिप्रेक्ष्य में भाषा के सैद्धांतिक अध्ययन से प्राप्त भाषायी ज्ञान को मशीन में संसाधित करने से संबंधित बातें आती हैं। इन्हें निम्नलिखित उपशीर्षकों के अंतर्गत समझ सकते हैं-
1.2.1 अनुप्रयोग प्रक्रिया : प्राकृतिक भाषा संसाधन
1.2.2 प्राकृतिक भाषा संसाधन : प्रकार
·       पाठ संसाधन (Text Processing)
भाषा के लिखित रूप के संसाधन से संबंधित।
·       वाक् संसाधन (Speech Processing)
भाषा के वाचिक रूप के संसाधन से संबंधित।
1.2.3 प्राकृतिक भाषा संसाधन :स्तर
·       शब्द संसाधन (Word-processing)
·       वाक्य संसाधन (Sentence Processing)
·       पाठ संसाधन (Text Processing)
1.2.4 प्राकृतिक भाषा संसाधन : उपागम
·       नियम आधारित (Rule Based)
भाषावैज्ञानिक/व्याकरणिक नियम + शब्दकोश
·       कार्पस आधारित (Corpus Based)
सांख्यिकीय नियम + कार्पस
·       संकर (Hybrid)-
(क) नियम + सांख्यिकी   (ख) सांख्यिकी + नियम
1.2.5 प्राकृतिक भाषा संसाधन : दिशाएँ
·       विश्लेषण (Analysis)
बड़ी भाषिक इकाई का इनपुट मिलने पर उसमें लगी छोटी इकाइयों और उनकी व्यवस्था प्राप्त करना।
·       प्रजनन (Generation)
छोटी-छोटी भाषिक इकाई को जोड़कर बड़ी भाषिक इकाई का निर्माण करना।

1.2.6 मशीनी पक्ष
·       डाटाबेस + प्रोग्रामिंग
·       प्रोग्राम की प्रक्रिया
एल्गोरिद्म, फ्लोचार्ट, कथन, ऑपरेटर, चर/अचर, भाषा संसाधन संबंधी मेथड और प्रक्रियाएँ।
1.2.7 अनुप्रयोग क्षेत्र
·      मशीनी अनुवाद (Machine Translation)
·      पाठ से वाक् और वाक् से पाठ  (TTS & STT)
·      ओ.सी.आर. (OCR)
·      संगणकीय कोश (Computational lexicon)
·      लिप्यंतरण (Transliteration)
·      सूचना प्रत्यानयन (Information Retrieval)
·      पाठ सारांशीकरण (Text Summarization)
·      संगणक साधित भाषा अधिगम/शिक्षण (CAL Learning/Teaching)
·      प्रश्न उत्तर प्रणालियाँ (Question Answering Systems)
·      कृत्रिम बुद्धि (Artificial Intelligence)
 ......................................................................................................................................................

No comments:

Post a Comment