Total Pageviews

Tuesday, January 1, 2019

मराठी क्रिया और अर्थीय भूमिका


.........................................................................................................................


आभ्यंतर (Aabhyantar)      SCONLI-12  विशेषांक         ISSN : 2348-7771

.........................................................................................................................
17.  मराठी क्रिया और अर्थीय भूमिका
प्रीती लोखंडे : पी-एच. डी. (ILE)  म.गा.अ.हि.वि. वर्धा
सारांश
अर्थीय भूमिका नामपत्रन Semantic Role Labelling यह प्राकृतिक भाषा संसाधन NLP के अंतर्गत एक कार्य है जो वाक्य के विधेय या क्रिया से संबंधित तर्कों के नामपत्र को खोजने का कार्य करता है और उनकी विशेष भूमिकाओं का वर्गीकरण करता है। पाठ में - अर्थीय भूमिका नामपत्रन , संगणकीय पहचानक ( Computational Identification) और तर्कों का नमपत्रण (Labeling of Argument)संगणकीय भाषाविज्ञान के क्षेत्र में आज एक महत्वपूर्ण कार्य माना जाता है। SRL को Shallow Sementic Parsing भी कहा जाता है। इस मुद्दे पर दशकों से अध्ययन किया जा रहा है।
पाठ का वाक्यस्तरीय अर्थ विश्लेषण वाक्य की प्रकृति से जुड़ा होता है। जैसे- ये  निर्धारित करता है कि किसने’‘किसके’, ‘क्या किया, कहां, कब और कैसे। वाक्यांश (clause) का एक विधेय predicate (आमतौर पर एक क्रिया, verb) बताता है कि क्या (what ???) हुआ और वाक्य के अन्य घटकों  को व्यक्त करते हैं (जैसे- किसने’,और कहां’)  साथ ही अन्य शामिल घटकों को भी बताता हैं।
मुख्य शब्द:वाक्य विश्लेषण, अर्थ विश्लेषण, नैसर्गिक भाषा, अर्थिय भूमिका।
प्रस्तावना:
Semantic Role Labeling- अर्थीय भूमिका नामपत्रन  का प्राथमिक कार्य विधेय (अर्थ) और इसके साथ शामिल अन्य घटकों के मध्य मौजूद अर्थीय संबंध (semantic relations) को दर्शाना होता है। इनके संबंधो के साथ विधेय (predicate) की सभी संभावित अर्थिय भूमिकाओं की पूर्वनिर्धारित सूची तैयार की जाती है। इस सूची को पूरा करने के लिए वाक्यांश  में अर्थ के व्यवहार की भूमिका निभाने वाले घटकों की पहचान आवश्यक रूप से करनी होती है और उन्हें उनकी सही अर्थीय भूमिका चिन्हांकित करना होता हैं।
SRL में प्रयोग होने वाले मुख्य  नामपत्र (Lables) इस प्रकार हैं- अभिकर्ता (Agent), कारक (patient) और घटकों की स्थिति जो किसी घटना में सहभागी होते है, एवं अन्य घटक जो वाक्यांश के साथ सहभागी होते हैं और अन्य पक्षों की प्रकृति के घटकों के तौर तरीके । इस प्रकार की अर्थिय भूमिका पाठ के एक प्रथम स्तरीय अर्थीय प्रतिपादन को जन्म देती है । जो वाक्य में व्यक्त किए जाने वाले संबधित घटकों के मध्य और आधारभूत घटकों की और इशारा करती है।
संगणकीय भाषाविज्ञान (Computational Linguistics) का यह विशेष बिंदु SRL पर आधारित कई अत्याधुनिक कार्यो को प्रस्तुत करता है । इस अवलोकन का उद्देश्य इस कार्य के विस्तृत संदर्भ को दिखाना है।
सबसे पहले संक्षेप में कुछ भाषावैज्ञानिक दृष्टिकोण से इस पर चर्चा की जाएगी । ये दृष्टिकोण SRL और संबंधित प्राकृतिक भाषा संसाधन कार्यों के अर्थ की भूमिका का संगणकीय दृष्टिकोण पर पड़ने वाले महत्वपूर्ण प्रभावों पर आधारित होंगे।
हालांकि SRL प्रणाली का प्रयोग सीमित किया गया है। प्राकृतिक भाषा संसाधनों में विभिन्न प्रयोग जिनमें Semantic Interpretation (अर्थीय व्याख्या विवेचन) के कुछ स्तरों की आवश्यकता होती है इस प्रकार के विश्लेषण हेतु बहुत संभावनाएं हैं।
अर्थिय भूमिका का इतिहास:
अर्थिय संबंध को 1960 के मध्य और 1970 के शुरूआत में (प्रजनक व्याकरण) के साथ ही आरंभ किया गया(Fillmore1968, Jackendoff 1972, Gruber T. R. 1967) Sementic role labeling की प्रकृति पर सबसे पहले Filmore का मूलभूत कार्य (1968), Semantic Roles की प्रकृति पर समर्पित एक महत्वपूर्ण भाषावैज्ञानिक शोधकार्य था। हालांकि कुछ Sementic Role जैसे- agent और theme पर पर्याप्त प्रकृति बनी, किन्तु अर्थ की भूमिकाओं की निश्चित सूची पर प्रकृति नहीं बन पाई। इस सूची के अंतर्गत स्थिति-विशिष्ट भूमिकाएं (Situation-SpecificRoles) का एक विशाल समूह (set) जैसे संदिग्ध (suspect), प्राधिकारी (Authorities)को शामिल किया गया है। (Fillmore, Ruppenhofer, Baker 2004)
अर्थिय संबंध का विश्लेषण यह क्रिया के विधेय की स्थिति यह क्रिया के प्रयोग पर आधारित होती है। अर्थिय भूमिका का प्रयोग  वाक्य में शामिल अन्य घटकों को विशेष से सामान्य रखने का संकेत करता है ।
अर्थिय भूमिका नमपत्रण (Semanticroles)निम्न प्रकार के होते हैं-


·        AGENT
·        THEME
·        PATIENT
·        INSTRUMENT
·        BENEFICIARY
·        SOURCE
·        EXPERIENCER
·        LOCATION
·        GOAL

अर्थिय भूमिका बहुदा वाक्य की स्थिति को सूचित करता है-
AGENT: subject- who perform some action
PATIENT: direct object
INSTRUMENT: object of with
BENEFICIARY: object of for- who prayed early in the morning for Dipti (Benificiary)
SOURCE: object of from
1.       राम (agent) ने (case) श्यामला (Beneficiary/Profit) पुस्तक (theme) दिले (verb)
2.       श्वेता [agent] आंबा [theme] खाते [verb].
3.       मुले [agent] शाळेत [goal] जातात [verb].
4.       त्यांनी [agent] मुलांना [experiencer] रागावले [verb]
5.       ट्रेन [agent] मुंबई [Source] वरुण येत आहे.
6.       पुस्तक [theme] टेबलावर[location] आहे.
 उपयुक्त पहले वाक्य में राम और श्याम दोनों संज्ञा है, किन्तु राम यह मुख्य agent तथा श्याम Beneficiary/Profit का कार्य कर रहा है, दूसरे वाक्य में भी श्वेता और आंबा संज्ञा है लेकिन श्वेता agent और आंबा theme का कार्य कर रहा है। मुले, शाळेत यह gole का कार्य कर रहा है, उसीप्रकार त्यांनी सर्वनाम है, मुले संज्ञा वाक्य में experiencer अनुभवकर्ता का कार्य कर रहे है। मुंबई [source], टेबलावर [location] बता रहा है। english की वाक्य संरचना SVO है, मराठी भाषा की SOV है, वाक्य में आये विधेय किसप्रकार अपना रूप बदलते है तथा उनका SRL पे क्या प्रभाव पड़ता है यह  इस शोधपत्र के माध्यम से बताने का प्रयास किया जाएगा। कर्ता के साथ और भी कई सारे घटक जुड़ते है, मशीन को समझने में होने वाली कठिनाई को दूर करने के लिए इस शोध कार्य का प्रयोग किया जाएगा।
अर्थिय सैधान्तिक स्थिति भाषाशास्त्र में आज भी एक बहस का मुद्दा बना हुवा हैं। इसपर कई संदेह होते है की अर्थ विन्यासमक घटक में भाषाविज्ञान की मौलिक धारणा एक खुली बहस का मुद्दा है। यदपि अधिकतर अर्थिय भूमिकाए भाषाविज्ञान के ज्ञानभंडार का एक अभिन्न अंग है। इस अंगों से अर्थिय विधेय स्पष्ट होने की संभावनाए बढती है। जिसके द्वारा सैधान्तिक संबंध (Thematic Relation)स्पष्ट होते है। इसप्रकार शब्द निरूपण के द्वारा एक सकर्मक क्रिया को भी संज्ञा की श्रेणी में NP1-Agent-NP2-Theme को स्पष्ट किया जाता है।
स्वचालित अर्थिय नमपत्रण अभिगम: (Approaches to Automatic SRL)
कार्य के विस्तृत संभाव्य वर्णक्रम (Spectrum) और मशीन लर्निंग उपागमों को SRL पर आधारित कार्य के अंतर्गत शामिल किया जाता है। अधिकतर SRL शोध role-Annotated-data पर प्रशिक्षण के लिए उपागम के प्रयोग की आवश्यकता है। Automatic SRL के मुख्य उपागमों और उपयोग होने वाले Learning Features (अधिगम विशेषताओं) के प्रकार का सर्वे किया जाएगा।
शोध समस्या:
नैसर्गिक भाषा के लिए एक शुद्ध संरचना का निर्माण करना।
अर्थिय भूमिका सूची के बारे में वास्तविक सहमती नहीं है।
प्राकृतिक भाषा संसाधन औपचारिक भाषा के लिए एक समस्याओ का समाधान करती है।
आज भी मशीन के लिए प्राकृतिक भाषा को समझना काफी जटिल कार्य है, जो सूचना पुन: प्राप्ति एक चुनौतीपूर्ण कार्य है।
SRL प्रणाली विकास द्वारा एक question/answering प्रणाली का निर्माण करना संभावित है। वाक्य में मौजूद घटकों की भूमिका प्रकार की परिभाषा तैयार करना मुश्किल कार्य है।
[Fillmore 1968-1977]
प्राकृतिक भाषा में कोई निश्चित वैज्ञानिक संरचना नहीं है, इसलिए मशीन के माध्यम से अनुवाद कठिन कार्य है, भाषा इंजीनियरों ने अनेक तकनीकों का उपयोग किया है, यह कार्य प्रतिनिधित्व और सूचना पुनः प्राप्ति प्रक्रिया को अस्पष्ट करता है।
1.       अर्थिय भूमिका नामांकन SRL सुचना पुन: प्राप्ति एवं प्रश्न उत्तरी प्रणाली निर्माण में उपयोग किया जाएगा।
2.       क्रिया विश्लेषक एवं सर्जक की परिशुद्धता की सीमा की जाँच करना एवं मराठी के लिए पर्याप्त परिशुद्धता निर्धारित करना।   
3.       क्रिया रूप विश्लेषक एवं सर्जक के बीच संबंध को एक इकाई के रूप में स्थापित करना।

परिणाम एवं विचारणीय तथ्य:
हालांकि SRL प्रणाली का Real World Application में सीमित उपयोग किया गया है। विभिन्न applications में जिनमें Semantic Interpretation (अर्थीय व्याख्या विवेचन) के कुछ स्तरों की आवश्यकता होती है इस प्रकार के विश्लेषण हेतु बहुत संभावनाएँ हैं। पाठ के विभिन्न घटकों के मध्य अर्थीय संबंधों को प्राप्त करने तथा उनका लाभ उठाने हेतु SRL बहुत उत्कृष्ट ढांचा प्रस्तुत करता है जिसे संगणकीय तकनीक (Computational Technique) पर शोध हेतु निष्पादित किया जाता है।

संदर्भ ग्रंथ सूची:
1.       Chomsky, Noam (1956) ‘’Three models for the description of language’’. IRE Transactions on Information Theory (2)
2.       http://en.wikipedia.org/wiki/Natural Language Processing
3.       Baker, C. Fillmore, and J. Lowe. 1998. The
4.       berkeley framenet project. In Proceedings of
5.       COLING-ACL, Singapore.
6.       Xavier Carreras and Lluis Marquez. 2004. In-
7.       troduction to the CoNLL-2004 Shared Task:
8.       Semantic Role Labeling. In Proceedings of CoNLL 2004
9.       http: http://www.ilc.cnr.it
10.   //cognet.mit.edu
12.   Fillmore, Charles. 1968. The Case for Case. In Universals in Linguistic Theory,
eds. Emmon Bach and R.T. Harms. New York: Holt, Rinehart and Winston  

No comments:

Post a Comment