भाषा प्रौद्योगिकी और प्राकृतिक भाषा संसाधन (LT and NLP)
मानव भाषाओं के ज्ञान को तार्किक
नियमों में ढालते हुए मशीन में संसाधित करने की प्रक्रिया प्राकृतिक भाषा संसाधन
है। अर्थात प्राकृतिक भाषा संसाधन वह प्रक्रिया है जिसके माध्यम से मानव भाषाओं के
ज्ञान को मशीन में इस प्रकार से स्थापित किया जाता है कि उसके द्वारा मानव भाषाओं
से संबंधित कार्य कराए जा सकें। अतः भाषा प्रौद्योगिकी और प्राकृतिक भाषा संसाधन
दोनों का लक्ष्य एक ही है। दोनों में अंतर यह है कि भाषा प्रौद्योगिकी एक
ज्ञानानुशासन (विषय) है, जबकि प्राकृतिक भाषा संसाधन एक प्रक्रिया है। अतः दोनों को एक साथ रखते हुए
कहा जा सकता है कि भाषा प्रौद्योगिकी एक ज्ञानानुशासन (विषय) है, जिसमें प्राकृतिक भाषा संसाधन का कार्य किया जाता है और उसका
अध्ययन-अध्यापन किया जाता है।
प्राकृतिक भाषा संसाधन से तात्पर्य
है- मानव भाषाओं का मशीन का संसाधन। अतः इसे प्राकृतिक भाषा संसाधन न कहकर मानव
भाषा संसाधन भी कह सकते हैं। अंग्रेजी में कहीं-कहीं Natural Language Processing की जगह Human Language
Processing शब्द भी प्राप्त होता है। किंतु प्राकृतिक भाषा संसाधन (Natural
Language Processing) शब्द अधिक प्रचलित हो चुका है। इसलिए इसे ‘प्राकृतिक भाषा संसाधन’ कहना ही अधिक उचित होगा। यह
शब्द कंप्यूटर वैज्ञानिकों द्वारा दिया हुआ है। उनके सामने पहले कंप्यूटर आता है
और उसकी भाषा ‘बाइनरी भाषा’ एक कृत्रिम
भाषा है। इसका विकास मनुष्यों द्वारा किया जाता है। इसलिए यह कृत्रिम भाषा है।
इसके विपरीत मानव भाषाओं को ‘प्राकृतिक भाषा’ इसलिए कहा गया है, क्योंकि इनका विकास स्वाभाविक या
प्राकृतिक रूप से हुआ है।
भाषा प्रौद्योगिकी के सापेक्ष
प्राकृतिक भाषा संसाधन की स्थिति को निम्नलिखित चित्र में देखा जा सकता है-
No comments:
Post a Comment