.........................................................................................................................
आभ्यंतर (Aabhyantar)
SCONLI-12
विशेषांक ISSN : 2348-7771
.........................................................................................................................
17. मराठी क्रिया और
अर्थीय भूमिका
प्रीती लोखंडे : पी-एच. डी. (ILE) म.गा.अ.हि.वि.
वर्धा
सारांश
अर्थीय भूमिका नामपत्रन Semantic Role Labelling यह प्राकृतिक भाषा संसाधन NLP के अंतर्गत एक कार्य है जो वाक्य के विधेय या क्रिया से संबंधित तर्कों के
नामपत्र को खोजने का कार्य करता है और उनकी विशेष भूमिकाओं का वर्गीकरण करता है। पाठ में -
अर्थीय भूमिका नामपत्रन , संगणकीय पहचानक ( Computational Identification) और तर्कों का नमपत्रण (Labeling of Argument)संगणकीय भाषाविज्ञान के क्षेत्र में आज एक महत्वपूर्ण कार्य माना जाता है। SRL को Shallow
Sementic Parsing भी कहा जाता है। इस मुद्दे पर दशकों से अध्ययन किया जा रहा है।
पाठ का वाक्यस्तरीय अर्थ विश्लेषण
वाक्य की प्रकृति से जुड़ा होता है। जैसे-
ये निर्धारित करता
है कि ‘किसने’‘किसके’,
‘क्या’ किया, कहां,
कब और कैसे। वाक्यांश (clause)
का एक विधेय predicate (आमतौर पर एक क्रिया, verb) बताता है कि क्या
(what
???) हुआ और वाक्य के अन्य घटकों को व्यक्त करते हैं (जैसे-
किसने’,और ‘कहां’) साथ ही अन्य
शामिल घटकों को भी बताता हैं।
मुख्य शब्द:वाक्य विश्लेषण,
अर्थ विश्लेषण, नैसर्गिक भाषा, अर्थिय भूमिका।
प्रस्तावना:
Semantic
Role Labeling- अर्थीय भूमिका नामपत्रन
का प्राथमिक कार्य विधेय (अर्थ) और इसके साथ शामिल अन्य घटकों के मध्य मौजूद अर्थीय संबंध (semantic relations)
को दर्शाना होता है। इनके संबंधो के साथ विधेय (predicate) की सभी संभावित अर्थिय
भूमिकाओं की पूर्वनिर्धारित सूची तैयार की जाती है। इस सूची को पूरा करने के लिए वाक्यांश
में अर्थ के व्यवहार की भूमिका निभाने वाले घटकों की पहचान आवश्यक रूप से
करनी होती है और उन्हें उनकी सही अर्थीय भूमिका चिन्हांकित करना होता हैं।
SRL
में प्रयोग होने वाले मुख्य नामपत्र (Lables) इस प्रकार हैं-
अभिकर्ता (Agent), कारक (patient) और घटकों की स्थिति जो किसी घटना में सहभागी होते है, एवं अन्य घटक जो वाक्यांश के साथ सहभागी होते हैं और अन्य पक्षों की प्रकृति
के घटकों के तौर तरीके । इस प्रकार की अर्थिय
भूमिका पाठ के एक प्रथम स्तरीय अर्थीय प्रतिपादन को जन्म देती है । जो वाक्य में व्यक्त किए जाने वाले संबधित घटकों के मध्य और आधारभूत घटकों की
और इशारा करती है।
संगणकीय भाषाविज्ञान (Computational Linguistics) का यह विशेष बिंदु SRL पर आधारित कई अत्याधुनिक कार्यो को प्रस्तुत करता है । इस अवलोकन का उद्देश्य इस कार्य के विस्तृत संदर्भ को दिखाना है।
सबसे पहले संक्षेप में कुछ
भाषावैज्ञानिक दृष्टिकोण से इस पर चर्चा की जाएगी । ये दृष्टिकोण SRL
और संबंधित प्राकृतिक भाषा संसाधन कार्यों के अर्थ की
भूमिका का संगणकीय दृष्टिकोण पर पड़ने वाले महत्वपूर्ण प्रभावों पर आधारित होंगे।
हालांकि SRL प्रणाली का प्रयोग सीमित किया गया है। प्राकृतिक भाषा संसाधनों में विभिन्न प्रयोग जिनमें Semantic
Interpretation (अर्थीय व्याख्या विवेचन)
के कुछ स्तरों की आवश्यकता होती है इस प्रकार के विश्लेषण
हेतु बहुत संभावनाएं हैं।
अर्थिय भूमिका का इतिहास:
अर्थिय संबंध को 1960 के मध्य और 1970
के शुरूआत में (प्रजनक व्याकरण) के साथ ही आरंभ किया गया(Fillmore1968, Jackendoff 1972, Gruber T. R.
1967)। Sementic
role labeling की प्रकृति पर सबसे पहले Filmore का मूलभूत कार्य (1968),
Semantic Roles की प्रकृति पर समर्पित एक महत्वपूर्ण भाषावैज्ञानिक
शोधकार्य था।
हालांकि कुछ Sementic Role जैसे-
agent और theme
पर पर्याप्त प्रकृति बनी, किन्तु अर्थ की भूमिकाओं की निश्चित सूची पर प्रकृति नहीं बन पाई। इस सूची के अंतर्गत स्थिति-विशिष्ट भूमिकाएं (Situation-SpecificRoles)
का एक विशाल समूह (set) जैसे संदिग्ध (suspect), प्राधिकारी (Authorities)को शामिल किया गया है।
(Fillmore, Ruppenhofer, Baker 2004)।
अर्थिय संबंध का विश्लेषण यह क्रिया
के विधेय की स्थिति यह क्रिया के प्रयोग पर आधारित होती है। अर्थिय भूमिका का प्रयोग वाक्य में
शामिल अन्य घटकों को विशेष से सामान्य रखने का संकेत करता है ।
अर्थिय भूमिका नमपत्रण (Semanticroles)निम्न
प्रकार के होते हैं-
·
AGENT
·
THEME
·
PATIENT
·
INSTRUMENT
·
BENEFICIARY
·
SOURCE
·
EXPERIENCER
·
LOCATION
·
GOAL
अर्थिय भूमिका बहुदा वाक्य की स्थिति को सूचित
करता है-
AGENT: subject- who
perform some action
PATIENT: direct object
INSTRUMENT: object of
with
BENEFICIARY: object of
for- who prayed early in the morning for Dipti (Benificiary)
SOURCE: object of from
1.
राम (agent) ने (case)
श्यामला (Beneficiary/Profit) पुस्तक
(theme) दिले (verb)
2.
श्वेता [agent] आंबा
[theme] खाते [verb].
3.
मुले [agent] शाळेत
[goal] जातात [verb].
4.
त्यांनी [agent] मुलांना
[experiencer] रागावले [verb]
5.
ट्रेन [agent] मुंबई [Source] वरुण येत आहे.
6.
पुस्तक [theme] टेबलावर[location] आहे.
उपयुक्त पहले वाक्य में राम और श्याम
दोनों संज्ञा है,
किन्तु राम यह मुख्य agent तथा श्याम Beneficiary/Profit का कार्य कर रहा है,
दूसरे वाक्य में भी श्वेता और आंबा संज्ञा है लेकिन श्वेता agent और आंबा theme
का कार्य कर रहा है। मुले,
शाळेत यह gole का कार्य कर रहा है, उसीप्रकार त्यांनी सर्वनाम है, मुले संज्ञा
वाक्य में experiencer अनुभवकर्ता का कार्य कर रहे है। मुंबई [source], टेबलावर [location] बता रहा है।
english की वाक्य संरचना SVO है, मराठी भाषा की SOV
है,
वाक्य में आये विधेय किसप्रकार अपना रूप बदलते है तथा उनका SRL पे क्या प्रभाव पड़ता है यह इस शोधपत्र
के माध्यम से बताने का प्रयास किया जाएगा। कर्ता के साथ और भी कई सारे घटक जुड़ते है, मशीन को समझने
में होने वाली कठिनाई को दूर करने के लिए इस शोध कार्य का प्रयोग किया जाएगा।
अर्थिय सैधान्तिक स्थिति भाषाशास्त्र में आज भी एक बहस का मुद्दा बना हुवा हैं। इसपर कई संदेह होते है की अर्थ विन्यासमक घटक में भाषाविज्ञान की मौलिक धारणा
एक खुली बहस का मुद्दा है। यदपि अधिकतर अर्थिय
भूमिकाए भाषाविज्ञान के ज्ञानभंडार का एक अभिन्न अंग है। इस अंगों से अर्थिय विधेय स्पष्ट होने की संभावनाए बढती है। जिसके द्वारा सैधान्तिक संबंध (Thematic Relation)स्पष्ट होते है। इसप्रकार शब्द निरूपण के
द्वारा एक सकर्मक क्रिया को भी संज्ञा की श्रेणी में NP1-Agent-NP2-Theme को स्पष्ट किया जाता है।
स्वचालित अर्थिय नमपत्रण अभिगम: (Approaches to Automatic SRL)
कार्य के विस्तृत संभाव्य वर्णक्रम (Spectrum) और मशीन लर्निंग उपागमों को SRL पर आधारित कार्य के
अंतर्गत शामिल किया जाता है। अधिकतर SRL शोध role-Annotated-data
पर प्रशिक्षण के लिए उपागम के प्रयोग की आवश्यकता है। Automatic SRL के मुख्य उपागमों और उपयोग होने वाले Learning Features (अधिगम विशेषताओं)
के प्रकार का सर्वे किया जाएगा।
शोध समस्या:
नैसर्गिक भाषा के लिए एक शुद्ध
संरचना का निर्माण करना।
अर्थिय भूमिका सूची के बारे में वास्तविक सहमती नहीं है।
प्राकृतिक भाषा संसाधन औपचारिक भाषा के लिए एक समस्याओ का
समाधान करती है।
आज भी मशीन के लिए प्राकृतिक भाषा को समझना काफी जटिल कार्य
है, जो सूचना पुन: प्राप्ति एक चुनौतीपूर्ण कार्य है।
SRL प्रणाली विकास द्वारा एक question/answering प्रणाली का निर्माण करना संभावित है। वाक्य में मौजूद घटकों की भूमिका प्रकार की परिभाषा तैयार करना मुश्किल कार्य
है।
[Fillmore
1968-1977]
प्राकृतिक भाषा में कोई निश्चित वैज्ञानिक संरचना नहीं है, इसलिए मशीन के माध्यम से अनुवाद कठिन कार्य है, भाषा इंजीनियरों ने अनेक तकनीकों का उपयोग किया है, यह कार्य प्रतिनिधित्व और सूचना पुनः प्राप्ति प्रक्रिया को अस्पष्ट करता है।
1.
अर्थिय भूमिका नामांकन SRL सुचना पुन: प्राप्ति एवं प्रश्न उत्तरी प्रणाली निर्माण में उपयोग किया जाएगा।
2.
क्रिया विश्लेषक एवं
सर्जक की परिशुद्धता की सीमा की जाँच करना एवं मराठी के लिए पर्याप्त परिशुद्धता
निर्धारित करना।
3.
क्रिया रूप विश्लेषक एवं
सर्जक के बीच संबंध को एक इकाई के रूप में स्थापित करना।
परिणाम एवं विचारणीय तथ्य:
हालांकि SRL प्रणाली का Real
World Application में सीमित उपयोग किया गया है। विभिन्न applications
में जिनमें Semantic Interpretation (अर्थीय व्याख्या विवेचन)
के कुछ स्तरों की आवश्यकता होती है इस प्रकार के विश्लेषण
हेतु बहुत संभावनाएँ हैं। पाठ के विभिन्न घटकों के
मध्य अर्थीय संबंधों को
प्राप्त करने तथा उनका लाभ उठाने हेतु SRL बहुत उत्कृष्ट
ढांचा प्रस्तुत करता है जिसे संगणकीय तकनीक (Computational Technique) पर शोध हेतु निष्पादित किया जाता है।
संदर्भ ग्रंथ सूची:
1.
Chomsky,
Noam (1956) ‘’Three models for the description of language’’. IRE Transactions
on Information Theory (2)
3.
Baker,
C. Fillmore, and J. Lowe. 1998. The
4.
berkeley
framenet project. In Proceedings of
5.
COLING-ACL,
Singapore.
6.
Xavier
Carreras and Lluis Marquez. 2004. In-
7.
troduction
to the CoNLL-2004 Shared Task:
8.
Semantic
Role Labeling. In Proceedings of CoNLL 2004
10.
//cognet.mit.edu
12. Fillmore, Charles.
1968. The Case for Case. In Universals in Linguistic Theory,
eds. Emmon Bach and R.T. Harms. New York: Holt, Rinehart and
Winston
No comments:
Post a Comment