भाषा
प्रौद्योगिकी
मनुष्य प्रौद्योगिकी
(मशीन/कंप्यूटर)
भाषा मशीनी/बाइनरी
भाषाविज्ञान कंप्यूटरविज्ञान
भाषा का अध्ययन-विश्लेषण प्रोग्रामिंग + डाटाबेस
प्राकृतिक
भाषा संसाधन (Natural
Language Processing- NLP)
......................................................................................................................................................
इकाई - 1
भाषा
प्रौद्योगिकी के परिप्रेक्ष्य
......................................................................................................................................................
1.1 भाषा
प्रौद्योगिकी
: सैद्धांतिक परिप्रेक्ष्य
भाषा प्रौद्योगिकी के
सैद्धांतिक परिप्रेक्ष्य में ‘भाषा’ के
अध्ययन-विश्लेषण संबंधी बातें आती हैं, जो भाषाविज्ञान से
संबंधित हैं। इसमें भाषा की संरचना का अध्ययन, भाषा में प्राप्त होने वाले विविध स्तरों
का विश्लेषण और विभिन्न परिवेशों में भाषा प्रयोगों का अध्ययन
आदि आते हैं।
मुख्य कार्य
· एक भाषा का विश्लेषणात्मक
अध्ययन, जैसे- हिंदी का अध्ययन।
· एक से अधिक
भाषाओं का तुलनात्मक/व्यतिरेकी अध्ययन, जैसे- हिंदी-मराठी, या हिंदी-अंग्रेजी का अध्ययन।
अन्य कार्य
· एक भाषा के
विविध सामाजिक प्रयोगों/संदर्भों का अध्ययन, जैसे- हिंदी या लोथा
का उनके सामाजिक परिवेश में अध्ययन। या लोथा भाषी समाज में हिंदी/अंग्रेजी की
स्थिति का अध्ययन = समाजभाषिक अध्ययन।
·
साहित्यिक कृतियों का शैलीवैज्ञानिक अध्ययन
प्रोक्ति
वाक्य
उपवाक्य
पदबंध
शब्द/पद
रूपिम
स्वनिम
|
अर्थ
|
प्रोक्तिविज्ञान
|
वाक्यविज्ञान
|
रूपविज्ञान
|
स्वनिमविज्ञान
|
इन स्तरों
में से किसी भी स्तर पर भाषा का सैद्धांतिक अध्ययन किया जा सकता है।
1.1.2 स्वनिमिक
अध्ययन के मुख्य बिंदु
·
स्वनिमों का वर्गीकरण
·
स्वनिमों का वितरण
·
स्वनिमों और संस्वनों (allophone) का निर्धारण
1.1.3
रूपिमिक अध्ययन (रूपिम और शब्द/पद) के मुख्य बिंदु
·
रूपिमों का वर्गीकरण
·
मूल शब्दों/धातुओं और उपसर्ग/प्रत्यय आदि का
अध्ययन
·
उपसर्ग/प्रत्यय योग प्रक्रिया का अध्ययन
·
व्युत्पादन और रूपसाधन (Derivation and
Inflection)
·
संधि और समास आदि का अध्ययन
·
शब्दवर्गों (Parts of Speech) का
निर्धारण/अध्ययन
·
व्याकरणिक कोटियों का अध्ययन
·
एकाधिक भाषाओं की शब्द-संरचना का तुलनात्मक/व्यतिरेकी
विश्लेषण
·
एकाधिक भाषाओं की पद-रचना का तुलनात्मक/व्यतिरेकी
विश्लेषण
1.1.4 पदबंध
स्तरीय अध्ययन के मुख्य बिंदु
·
पदबंधों का वर्गीकरण
·
पदबंध साँचों का निर्धारण
·
एकाधिक भाषाओं में पदबंध रचनाओं का तुलनात्मक/व्यतिरेकी
विश्लेषण
1.1.5 उपवाक्य
स्तरीय अध्ययन के मुख्य बिंदु
·
उपवाक्यों का वर्गीकरण
·
उपवाक्य साँचों का निर्धारण
·
एकाधिक भाषाओं में उपवाक्य रचनाओं का तुलनात्मक/व्यतिरेकी
विश्लेषण
1.1.6 वाक्य
स्तरीय अध्ययन के मुख्य बिंदु
·
वाक्यों का वर्गीकरण
·
वाक्य साँचों का निर्धारण
·
एकाधिक भाषाओं में वाक्य रचनाओं का व्यतिरेकी
विश्लेषण
1.1.7 प्रोक्ति
स्तरीय अध्ययन के मुख्य बिंदु
·
अन्वादेश (anaphora),
·
पूर्वादेश (cataphora)
·
संदर्भ अभिव्यक्तियाँ (referential
expressions)
1.1.8
अर्थ स्तरीय अध्ययन के मुख्य बिंदु
·
पर्याय, विलोम,
समानार्थी शब्दों का विश्लेषण
·
अधिनामी (hypernym), अवनामी
(hyponym) शब्दों का विश्लेषण
·
लक्षण संरचना (feature structure) का
अध्ययन
......................................................................................................................................................
1.2.
भाषा प्रौद्योगिकी
: अनुप्रयुक्त परिप्रेक्ष्य
भाषा
प्रौद्योगिकी के अनुप्रयुक्त परिप्रेक्ष्य में ‘भाषा’ के सैद्धांतिक अध्ययन से प्राप्त भाषायी ज्ञान को मशीन में संसाधित करने
से संबंधित बातें आती हैं। इन्हें निम्नलिखित उपशीर्षकों के अंतर्गत समझ सकते हैं-
1.2.1 अनुप्रयोग
प्रक्रिया : प्राकृतिक भाषा संसाधन
1.2.2 प्राकृतिक भाषा
संसाधन : प्रकार
· पाठ संसाधन (Text Processing)
भाषा
के लिखित रूप के संसाधन से संबंधित।
· वाक् संसाधन
(Speech
Processing)
भाषा
के वाचिक रूप के संसाधन से संबंधित।
1.2.3 प्राकृतिक भाषा
संसाधन :स्तर
· शब्द संसाधन
(Word-processing)
· वाक्य संसाधन
(Sentence
Processing)
· पाठ संसाधन (Text Processing)
1.2.4 प्राकृतिक भाषा
संसाधन : उपागम
· नियम आधारित
(Rule
Based)
भाषावैज्ञानिक/व्याकरणिक
नियम + शब्दकोश
· कार्पस आधारित
(Corpus
Based)
सांख्यिकीय
नियम + कार्पस
· संकर (Hybrid)-
(क)
नियम + सांख्यिकी (ख) सांख्यिकी + नियम
1.2.5 प्राकृतिक भाषा
संसाधन : दिशाएँ
· विश्लेषण (Analysis)
बड़ी
भाषिक इकाई का इनपुट मिलने पर उसमें लगी छोटी इकाइयों और उनकी व्यवस्था प्राप्त करना।
· प्रजनन (Generation)
छोटी-छोटी
भाषिक इकाई को जोड़कर बड़ी भाषिक इकाई का निर्माण करना।
1.2.6 मशीनी पक्ष
· डाटाबेस +
प्रोग्रामिंग
· प्रोग्राम की
प्रक्रिया
एल्गोरिद्म, फ्लोचार्ट, कथन, ऑपरेटर, चर/अचर, भाषा संसाधन संबंधी मेथड और प्रक्रियाएँ।
1.2.7 अनुप्रयोग
क्षेत्र
·
मशीनी अनुवाद (Machine Translation)
·
पाठ से वाक् और वाक् से पाठ (TTS & STT)
·
ओ.सी.आर. (OCR)
·
संगणकीय कोश (Computational lexicon)
·
लिप्यंतरण (Transliteration)
·
सूचना प्रत्यानयन (Information
Retrieval)
·
पाठ सारांशीकरण (Text Summarization)
·
संगणक साधित भाषा अधिगम/शिक्षण (CAL
Learning/Teaching)
·
प्रश्न उत्तर प्रणालियाँ (Question Answering
Systems)
·
कृत्रिम बुद्धि (Artificial
Intelligence)
......................................................................................................................................................
No comments:
Post a Comment