.........................................................................................................................
आभ्यंतर (Aabhyantar)
SCONLI-12
विशेषांक ISSN : 2348-7771
.........................................................................................................................
19. हिंदी मुहावरों का भाषिक अध्ययन: प्राकृतिक भाषा संसाधन के संदर्भ में
प्रितेन्द्र कुमार मालाकार : पी-एच. डी. (ILE) म.गा.अ.हि.वि. वर्धा
सारांश (Summary)
किसी
भीभाषा में मुहावरों का महत्वपूर्ण स्थान होता है क्योंकि ये भाषा को अतिरिक्त संचार
शक्ति प्रदान करते हैं। इनके प्रयोग से भाषा और भी संप्रेषणीय तथा प्रभावशाली हो
जाती है। इन्हीं विशेषताओं के कारण मानव जीवन में मुहावरों का प्रयोग निरंतर बढ़ता
ही जा रहा है। मानवीय दृष्टिकोण से भाषा में प्रयुक्त मुहावरों की पहचान करना, उनका वर्गीकरण करना तथा उनके सामान्य एवं लाक्षणिक अर्थों में भेद करना
सरल है किंतु संगणकीय दृष्टिकोण से यह अपेक्षाकृत कठिन कार्य है। मुहावरों का
संसाधन भाषाविज्ञान के विविध अनुप्रयुक्त क्षेत्रों (मशीनी अनुवाद, भाषा-शिक्षण, संगणकीय भाषाविज्ञान आदि) के लिए अभी
भी चुनौतीपूर्ण समस्या है। इसी समस्या को दृष्टिगत रखते हुए प्रस्तुत शोधपत्र के
अंतर्गत एक संगणकीय मॉडल या प्रणाली की परिकल्पना की गई है जिसके द्वारा भाषा
(वाक्य) में प्रयुक्त मुहावरों की पहचान करने के साथ-साथ विविध आधारों पर उनका
विश्लेषण तथा वर्गीकरण किया जा सके। प्रणाली के निर्माण हेतु आवश्यक संसाधन के रूप
में डाटाबेस एवं कार्पस का निर्माण भी किया गया है। डाटाबेस निर्माण के लिए
विभिन्न स्रोतों से हिंदी मुहावरों का संकलन किया गया है। संकलित मुहावरों का
विभिन्न भाषावैज्ञानिक सिद्धांतों के आधार पर विश्लेषण एवं वर्गीकरण किया गया है
तथा डाटाबेस के रूप में संग्रहित किया गया है। संगणकीय प्रणाली की अभिकल्पना एवं
विकास हेतु सॉफ्टवेयर अभियांत्रिकी की प्रविधियों का प्रयोग किया गया है। संगणकीय
प्रणाली की संपूर्ण कार्यविधि प्राकृतिक भाषा संसाधन आधारित प्रक्रियाओं एवं
अभिगमों पर आधारित होगी। कुछ पूर्व-परिभाषित नियमों का निदर्शन भी किया गया है
जिनके आधार पर उक्त प्रणाली क्रियान्वित होगी। अनुप्रयुक्त भाषाविज्ञान के क्षेत्र
में प्रस्तावित प्रणाली उपयोगी सिद्ध होगी।
मूलशब्द (Keywords) :मुहावरा, प्राकृतिक भाषा संसाधन, संगणकीय मॉडल, डाटाबेस।
1. भूमिका (Preface)
प्राकृतिक भाषाएं (NaturalLanguages) विभिन्न प्रकार की आंतरिक एवं अप्रत्यक्ष अभिव्यक्तियों (Implicit&IndirectExpressions) से परिपूर्ण एवं समृद्ध होती हैं जिनमें से मुहावरे (Idioms) प्रमुख हैं। मुहावरों के प्रयोग से कोई भाषा और भी अधिक प्रभावशाली हो
जाती है। इनके प्रयोग से भाषा में सहजता एवं स्वाभाविकता आती है। उपर्युक्त सभी
विशेषताओं एवं गुणों के कारण दैनिक जीवन के वार्तालाप में मुहावरों का प्रयोग सतत
रूप से बढ़ता ही जा रहा है। इसलिए प्रस्तुत शोध में मुहावरों का भाषिक अध्ययन किया
गया है जिससे मुहावरों के विभिन्न संरचनाओं, अर्थों एवं
भावों को समझने में सहायता मिल सके।
2. मुहावरेदार
अभिव्यक्तियां (IdiomaticExpressions)
ऐसी
अभिव्यक्तियां या वाक्यांश जिनका शाब्दिक या सामान्य अर्थ तो अलग होता है लेकिन
इनका प्रयोग भिन्न भावार्थ प्रकट करने के लिए किया जाता है, मुहावरेदार अभिव्यक्तियां कहलाती हैं। मुहावरेदार अभिव्यक्तियों को
मुहावरा भी कहा जाता है। उदाहरण के लिए“काठ का उल्लू”एक मुहावरा है जिसका शाब्दिक या सामान्य अर्थ “लकड़ी
का उल्लू” है किंतु इसका प्रयोग किसी व्यक्ति को ‘महामूर्ख’ दर्शाने हेतु किया जाता है।
2.1.
मुहावरों की उत्पत्ति
(OriginofIdioms)
‘मुहावरा’ मूल रूप से अरबी भाषा का शब्द
है जिसका अर्थ होता है ‘अभ्यास होना’।
यह एक संज्ञा (पुल्लिंग) शब्द है। इसे अरबी लिपि में ‘मुहावर:’ लिखते हैं, जो हिंदी भाषा में ‘मुहावरा’ हो जाता है। ‘मुहावरा’
को अंग्रेजी में ‘Idiom’
कहा जाता है। लेटिन और फ्रेंच से होता हुआ यह शब्द अंग्रेजी में आया
है। साहित्य में इसके महाविरा, मुहाविरा, मुहावरा, आदि कई रूप मिलते हैं। प्राचीन अर्थ के
आधार पर मुहावरे से तात्पर्य था ‘‘आपस में बातचीत’’। उर्दू में इसे ‘तर्ज़ेकलाम’ तथा
‘इस्तलाह’ भी कहा जाता है। संस्कृत में
मुहावरा शब्द के वाग्रीति, वाग्व्यापार,
वाग्शरा, वाग्व्यवहार, विशिष्ट
वचनं, विशिष्ट वाक्यं तथा भाषा-विशेषण आदि कई पर्याय मिलते
हैं। वास्तव में आज के प्रचलित अर्थ में ‘‘मुहावरा’’ शब्द जिस निहित अर्थ का द्योतक है उस अर्थ का द्योतक कोई भी अन्य नहीं।
इसके वास्तविक अर्थ का जो बोध ‘मुहावरा’ शब्द से होता है वह हिंदी के अन्य पर्याय ‘वाग्धरा’,‘भाषा-सम्प्रदाय’ या ‘वाक्-सम्प्रदाय’
आदि प्रयोगों से नहीं हो पाता।
2.2. मुहावरों
की विभिन्न परिभाषाएं (VariousDefinitionsofIdioms)
Ø “किसी भाषा में पायी जाने वाली असाधारण
शब्द-योजना अथवा विलक्षण प्रयोग को मुहावरा कहते हैं”।
-डॉ.
पृथ्वीनाथ पाण्डेय
Ø “मुहावरा
भाषा-विशेष में प्रचलित उस अभिव्यक्ति की इकाई को कहते हैं, जिसका प्रयोग प्रत्यक्षार्थ से अलग
रूढ़ि लक्ष्यार्थ के लिए किया जाता है”।
-डॉ.
भोलानाथ तिवारी
Ø “जो
वाक्यांश अपने सामान्य अर्थ को न बताकर, किसी
विशेष अर्थ को बतलाता है और प्राय: क्रिया का काम
देता है, उसे वाग्धारा या मुहावरा कहते हैं”।
-श्याम
चंद्र कपूर
2.3. मुहावरों
की विशेषताएं (CharacteristicsofIdioms)
मुहावरों
की कुछ प्रमुख विशेषताएं निम्न हैं:
1. मुहावरा
एक वाक्यांश होता है, इसलिए इसका प्रयोग केवल वाक्य के अंतर्गत
ही किया जा सकता है।
2.
मुहावरे के साथ जुड़े
शब्द कभी बदले नहीं जाते हैं यद्यपि उनके क्रम में आवश्यकतानुसार परिवर्तन किया जा
सकता है।
3.
मुहावरे का सामान्य
या शाब्दिक अर्थ विशेष महत्व का नहीं होता बल्कि उसके लक्ष्यार्थ पर ध्यान
केंद्रित किया जाता है।
4.
मुहावरे का प्रयोग
स्वतंत्र रूप में नहीं होता बल्कि वाक्य में प्रसंग के अनुसार होता है एवं ये
प्रसंग के अनुरूपअर्थ देते हैं ।
5.
मुहावरे समाज की
रीति-रिवाजों और परंपराओं के निर्माण में सहायक होते हैं तथा इनका निर्माण देश, काल तथा समाज के विकास और परिवर्तन के अनुरूप होता रहता है।
2.4. महत्व
एवं उपयोगिताएं (Importance&Utilizations)
किसी
भी भाषा में मुहावरेदार अभिव्यक्तियों का विशेष स्थान होता है जो न केवल भाषा के
सौंदर्य एवं प्रभाव शक्ति को बढ़ाते है अपितु भाषा को रोचक, सहज एवं दृश्यात्मक बनाने में महत्वपूर्ण भूमिका निभाते हैं। इसलिए आज
मानव जीवन के विभिन्न क्षेत्रों जैसे- सोशल मीडिया, अध्ययन, लेखन, वार्ता, साक्षात्कार, भाषण, वार्तालाप आदि सभी में मुहावरेदार
अभिव्यक्तियों का प्रयोग बढ़ता ही जा रहा है क्योंकि ये वक्ता के विचार में
अतिरिक्त संचार शक्ति प्रदान करते हैं तथा लोगों का ध्यान किसी विशेष विषय की ओर
आकृष्ट कराने में सहायक होते हैं। मुहावरों के प्रयोग से भाषा और अधिक प्रभावशाली
हो जाती है।
3. शोध-प्रविधि (ResearchMethodology)
प्रस्तुत शोधकार्य को
पूर्ण करने हेतु एक रूपरेखा प्रस्तावित की गई है जो वैज्ञानिक एवं विश्लेषणात्मक
शोध-प्रविधि पर आधारित है। इस रूपरेखा में कुछ पूर्व-निर्धारित चरणों का उल्लेख
किया गया है जिनका अनुपालन कर शोधकार्य संपन्न किया गया है। ये चरण निम्नलिखित
हैं:
3.1. मुहावरों
का संकलन (CollectionofIdioms)
हिंदी
के मुहावरेदार अभिव्यक्तियों के भाषिक अध्ययन हेतु निम्न तालिका में वर्णित कोशों
का संदर्भ लेते हुए कुल 2000 मुहावरों का संकलन किया गया है
क्रं.
|
शीर्षक
|
लेखक
|
प्रकाशक
|
ISBN
|
1.
|
मानक सामान्य हिंदी
|
डॉ. पृथ्वीनाथ पांडेय
|
अरिहंत पब्लिकेशंस (इ) प्रा. लि.
|
978-81-8348-695-8
|
2.
|
मानक हिंदी मुहावरा लोकोक्ति कोश
|
आचार्य डॉ. हरिवंश तरुण
|
प्रकाशन संस्थान
|
81-7714-161-9
|
3.
|
सरस्वती मुहावरा कोश
|
राजवीर सिंह
|
सरस्वती विहार
|
978-81-216-1705-5
|
तालिका
1: हिंदी मुहावरों के संकलन हेतु प्राथमिक स्रोत
3.2.
मुहावरों का भाषिक
विश्लेषण(LinguisticsAnalysisofIdioms)
हिंदी के संकलित मुहावरों का विभिन्न भाषिक
सिद्धांतों के आधार पर विश्लेषण किया गया है जिससे मुहावरों के प्रदर्शन (Representation) एवं सामान्यीकरण (Normalization) में सरलता हो।
मुहावरों का विश्लेषण निम्न आधार पर किया गया है:
3.1.1. निर्माण
के आधार पर
मुहावरों
के विश्लेषण से यह स्पष्ट हुआ है कि:
1.
हिंदी के अधिकांश
मुहावरे शरीर से विभिन्न अंगों (जैसे- आंख, नाक, कमर, सीना, पैर, हाथ, गर्दन आदि) से संबंधित हैं।
उदाहरण- आंख
का अंधा, नाक कटाना, कमर कसना, पैर पटकना, हाथ उठाना, गर्दन
झुकना आदि।
2.
कई मुहावरे विभिन्न
पशु-पक्षी तथा जंतुओं पर आधारित हैं।
उदाहरण- गधा बनाना, बैल की तरह जुतना, बाज की तरह झपटना, कीड़ा बनना आदि।
3.
कुछ मुहावरे ऐसे भी
हैं जो दैनिक जीवन के रिश्तों या संबंधों (बाप, दादा, मामा, चाचा आदि) से बने हुए हैं।
उदाहरण- बाप निकलना, मामा बनाना, मौसी का घर होना आदि ।
4. किसी
देवता, प्रसिद्ध व्यक्ति,
स्थान तथा पदार्थ के नाम पर भी मुहावरे
प्राप्त हुए हैं।
उदाहरण- इंद्र का वज्र, हनुमान की गदा, गांधी के रास्ते पर चलना, हिटलरशाही, नर्क में जाना,
मिट्टी में मिलना, लोहा लेना आदि ।
5. संख्याओं
से भी कुछ मुहावरे निर्मित हुए हैं।
उदाहरण- एक-और-एक ग्यारह होना, नौ-दो ग्यारह होना, तीन-तेरह करना, चार-सौ-बीसी करना, आठ-आठ आंसू रोना, दस घाट का पानी पीना आदि ।
6. शब्दों
की पुनरावृत्ति से भी कुछ मुहावरे निर्मित हुए हैं।
उदाहरण- थू-थू करना, थोड़ा-थोड़ा करना आदि ।
7. हिन्दी
के एक शब्द के साथ उर्दू के दूसरे शब्द के योग से बने मुहावरे भी हैं।
उदाहरण- मेल मुहब्बत होना, मेल-मुलाकात रखना, दिशा-मैदान जाना आदि।
8. अलंकारों
के प्रयोग से से बने मुहावरे भी हैं। अनेक मुहावरे
में अलंकारों का प्रयोग हुआ रहता है। किंतु इसका यह अर्थ नहीं है कि प्रत्येक
मुहावरा अलंकार होता है अथवा प्रत्येक अलंकारयुक्त वाक्यांश मुहावरा होता है। उदाहरण-
लाल अंगारा होना,अंगार बरसाना आदि।
9. कथानकों, धर्म-कथाओं आदि पर आधारित मुहावरे भी हैं।
उदाहरण- बीड़ा उठाना, टेढ़ी खीर होना, ढपोरशंख होना, सोने का मृग होना, बीरबल की खिचड़ी पकाना, आदि।
10. व्यक्तिवाचक
संज्ञाओं का जातिवाचक संज्ञाओं की भांति प्रयोग से बने मुहावरे भी हैं।
उदाहरण- कुंभकरण की नींद, द्रौपदी का चीर, जयचंद होना, युधिष्ठिर
बनना, विभीषण होनाआदि।
11. ध्वनियों
पर आधारित मुहावरे भी हैं।
उदाहरण- वाह-वाह
करना, सी-सी करना, हाय-हाय
मचाना,टर-टर करना, भों-भों करना,
में-में करना।
12. शारीरिक
चेष्टाओं के आधार पर बने हुए मुहावरे भी हैं। शारीरिक चेष्टाएं मनोभाव प्रकट करती
हैं और उनके आधार पर कुछ मुहावरे बनते हैं।
उदाहरण- छाती
पीटना, दांत पीसना, पूंछ
हिलाना, आदि।
3.1.2. व्याकरणिक
संरचना के आधार पर
प्रत्येक मुहावरे की एक व्याकरणिक संरचना (GrammaticalStructure)
होती है। व्याकरणिक संरचना के अनुसार ही मुहावरों का निर्माण या सृजन होता है।
मुहावरों का अध्ययन, विश्लेषण,
वर्गीकरण एवं वाक्यों में प्रयोग करते समय उनकी संरचनाओं का बोध होना आवश्यक है।
किसी मुहावरे की व्याकरणिक संरचना में शब्द-भेद (संज्ञा,
सर्वनाम, विशेषण, क्रिया-विशेषण, परसर्ग आदि) एक निर्धारित क्रम में व्यवस्थित होते हैं। कभी-कभी वक्ताओं
के द्वारा वाक्य में प्रयोग करते समय मुहावरे की संरचना (शब्द-क्रम) को
आवश्यकतानुसार परिवर्तित भी कर लिया जाता है, किंतु यह
मुहावरे की मूल संरचना से ही प्रेरित (Motivated) अथवा बद्ध
(Bounded) होती है। मुहावरों की कुछ प्रमुख भाषिक संरचनाओं (LinguisticStructures) निम्न हैं:
1.
<संज्ञा> से
कुछ ऐसे मुहावरे हैं जो केवल एक संज्ञा से
निर्मित हुए हैं।उदाहरण- उल्लू, गधा, शेर।
2.
<क्रिया> से
कुछ ऐसे मुहावरे हैं जो केवल एक क्रिया से निर्मित
हुए हैं।उदाहरण- चटाना, मिमियाना।
3.
<विशेषण> से
कुछ ऐसे मुहावरे हैं जो केवल एक विशेषण से
बने हैं।उदाहरण- मक्खीचूस, जंगलराज, अंधेरगर्दी, अंधेरनगरी, रामराज।
4.
<संज्ञा>+<क्रिया> के प्रयोग से
कुछ
ऐसे मुहावरे हैं जो संज्ञा के साथ क्रिया मिलने से निर्मित हुए हैंउदाहरण- टांग खींचना, सिर पकड़ना, माथा पकड़ना।
5.
<क्रिया>+<क्रिया> के संयोजन से
कुछ
ऐसे मुहावरे हैं जो क्रिया के क्रिया के संयोजन से बनते हैं।उदाहरण- उठना-बैठना,खाना-पीना।
6.
<विशेषण>+<क्रिया> के प्रयोग से
कुछ
ऐसे मुहावरे हैं जो विशेषण के साथ क्रिया मिलने से निर्मित हुए हैं। उदाहरण-
अंधा बनाना, मूर्ख बनाना।
7.
<सर्वनाम>+<क्रिया> के प्रयोग से
कुछ
ऐसे मुहावरे हैं जो सर्वनाम के साथ क्रिया मिलने से निर्मित हुए हैं। उदाहरण-
अपना बनाना, पराया करना।
8.
<विशेषण>+<संज्ञा> के प्रयोग से
कुछ
ऐसे मुहावरे हैं जो विशेषण के साथ संज्ञा मिलने से निर्मित हुए हैं। मुहावरों में अद्वितीयता की प्रविष्टि एवं अनूठेपन के संयोजन के लिए विशेषणों का भी
प्रयोग किया जाता है।उदाहरण- अंधा कुआं , किताबी कीड़ा।
9.
<संज्ञा>+<परसर्ग>+<संज्ञा> के प्रयोग से
कुछ
ऐसे मुहावरे हैं जो संज्ञा के साथ परसर्ग (का, के, की, ने, से, आदि) तत्पश्चात एक और संज्ञा मिलने से बनते हैं।उदाहरण- काठ का उल्लू, आंख का तारा, कुत्ते की दुम।
10.
<संज्ञा>+<परसर्ग>+<विशेषण> के प्रयोग से
कुछ
ऐसे मुहावरे हैं जो संज्ञा के साथ परसर्ग (का, के, की, ने, से) तत्पश्चात विशेषण मिलने से निर्मित हुए हैं। उदाहरण-
आंख का अंधा, जबान का पक्का।
11.
<विशेषण>+<संज्ञा>+<क्रिया> के योग से
कुछ
ऐसे मुहावरे हैं जो विशेषण के साथ संज्ञा तत्पश्चात क्रिया मिलने से निर्मित हुए
हैं। उदाहरण- उल्टी गंगा बहाना, उल्टी माला
फेरना।
12.
<संज्ञा>+<विशेषण>+<क्रिया> के प्रयोग से
कुछ
ऐसे मुहावरे हैं जो संज्ञा के साथ विशेषण तत्पश्चात क्रिया मिलने से निर्मित हुए
हैं। उदाहरण- उल्लू सीधा करना, खून सफ़ेद होना।
13.
<विशेषण>+<परसर्ग>+<संज्ञा>+<संज्ञा>के प्रयोग से
कुछ
ऐसे मुहावरे हैं जो विशेषण के साथ परसर्ग (का, के, की, ने, से, आदि) फिर संज्ञा
तत्पश्चात एक और संज्ञा मिलने से निर्मित हुए हैं। उदाहरण- अंधे के हाथ बटेर, अंधे
के हाथ आईना।
3.1.3. मुहावरों
का अर्थीय विश्लेषण (SemanticAnalysisofIdioms)
1. अनेकार्थकता
(Polysemy): किसी भी मुहावरे के दो अर्थ होते
हैं:
(1) शाब्दिक
अर्थ: शाब्दिक अर्थ से अभिप्राय है मुहावरों का सामान्य अर्थ।
मुहावरों के अंतर्गत प्रयुक्त शब्दों का अर्थ ही मुहावरों का शाब्दिक अर्थ कहलाता
है। इसे मुख्यार्थया प्रत्यार्थ भी कहा जाता है।उदाहरण के लिए“काठ का उल्लू” एक मुहावरा है जिसका शाब्दिक या सामान्य अर्थ “लकड़ी का उल्लू” है।
(2) लक्ष्यार्थ:
मुहावरों का प्रयोग जिस लक्ष्य की प्राप्ति के लिए किया
जाता है, उसे लक्ष्यार्थ कहा जाता है। इसे
व्यंग्यार्थ भी कहा जाता है।उदाहरण के लिए“काठ का उल्लू” एक मुहावरा है प्रयोग किसी व्यक्ति को ‘महामूर्ख’ दर्शाने हेतु किया जाता है।
कुछ ऐसे मुहावरे भी हैं जिनका प्रयोग
शाब्दिक एवं लक्ष्य दोनों प्रकार के अर्थोंमें किया जाता है, जैसे:
(i)
अंडे सेना
शाब्दिक अर्थ- पक्षियों
का अपने अंडों पर बैठना, बैठकर गर्मी प्रदान करना आदि।
लक्ष्यार्थ –घर
में बैठे रहना, बाहर न निकलना, काम न
करना आदि।
(ii)
आग लगाना
शाब्दिक अर्थ- किसी
वस्तु को जलाना।
लक्ष्यार्थ –किसी व्यक्ति को भड़काना, झगड़ा लगाना आदि।
2. समानांतरता (Parallelism)
कई मुहावरे अर्थ एवं भाव की
दृष्टि से समान होते हैं। मुहावरों के इस गुण या विशेषता को समानांतरता कहा जाता
है।उदाहरण-
जानबूझकर
मृत्यु के निकट जाना =
कफ़न सिर से बांधना
कफ़न बांधे फिरना
मौत को दावत देना
कफ़न लपेटना
मौत को गले लगाना
मौत के मुंह में जाना
मौत को बुलाना
उपर्युक्त सभी मुहावरों का समान (अर्थ एवं
भाव की दृष्टि से) समान अर्थ है। इनका अर्थीय जाल भी निर्मित किया जा सकता है।
मौत को गले लगाना
|
जानबूझकर मृत्यु के निकट जाना
|
मौत को दावत देना
|
कफ़न बांधे फिरना
|
कफ़न सिर से बांधना
|
मौत के
मुंह मेंजाना
|
कफ़न
लपेटना
|
चित्र
1: अर्थीय-जाल(SemanticNet)
3.3.
संगणकीय प्रणाली
विकास (DevelopmentofComputationalSystem)
इस
प्रणाली को ‘भाव-विश्लेषक’का
नाम दिया गया है। यह प्रणाली यूनिकोड आधारित देवनागरी लिपि अनूदित पाठ पर ही
क्रियान्वित होगी। विंडो आधारित इस प्रणाली को मुख्यत: हिंदी भाषा के मुहावरेदार
अभिव्यक्तियों के भाव-विश्लेषण हेतु विकसित किया गया है। इस प्रणाली की निम्नलिखित
विशेषताएं हैं:
Ø द्विभाषी
अंतरापृष्ठ (Bi-LingualInterface)।
Ø निवेशित
पाठ का वाक्यस्तरीय भाव-विश्लेषण।
Ø डाटाबेस
प्रबंधन की सुविधा।
3.3.1.
संसाधन-निर्माण(ResourceGeneration)
भाव-विश्लेषण के दृष्टिकोण से हिंदी को अल्प-संसाधनीय भाषा
(ScarceResourceLanguage) कहा जाता है [1] क्योंकि हिंदी भाषा के
भाव-विश्लेषण संबंधित किए जा रहे शोधकार्य विकासशील अवस्था में है इसलिए प्रस्तुत
शोधकार्य हेतु संसाधनों का संग्रहण या निर्माण किया जाना आवश्यक है। इस शोधकार्य
में निम्न संसाधनों का निर्माण किया गया है:
1.
हिंदी मुहावरा भावकोश
(LexiconofHindiIdioms)
हिंदी
के संग्रहित मुहावरों में से प्रत्येक का शाब्दिक अर्थ, मुख्य शब्द एवं रूप देते हुए एनोटेशन पद्धति के द्वारा सकारात्मक, नकारात्मक तथा
निष्पक्ष के रूप में वर्गीकृत किया गया है।
क्रं
|
मुहावरा
|
शाब्दिक_अर्थ
|
मुख्य शब्द
|
रूप
|
ध्रुवणता
|
1
|
कमर कसना
|
तैयार होना
|
कमर
|
कमर कस;
|
सकारात्मक
|
2
|
आंख का अंधा
|
मूर्ख होना
|
आंख
|
आंख का अंधा,
आंख की अंधी
|
नकारात्मक
|
तालिका
2: हिंदी मुहावरा भावकोश की संरचना
2.
नियम-निदर्शन (RuleDerivation)
अभिव्यक्तियों
की ध्रुवणता निर्धारित करने हेतु नियमों का निदर्शन किया गया है। कुछ परिस्थितियों
में अभिव्यक्तियों की ध्रुवणता ना, नही आदि शब्दों के कारण परिवर्तित (सकारात्मक से
नकारात्मक या विपरीत) हो जाती है इसलिए
ऐसे समस्या पर नियंत्रण हेतु कुछ पूर्व-परिभाषित नियमों का विकास किया गया है
जिसके आधार पर हमारी प्रस्तावित प्रणाली क्रियान्वित होगी।
क्रं
|
नियम
|
उदाहरण
|
1
|
यदि (<मुहावरा_नकारात्मक> हो तब ध्रुवणता=नकारात्मक;
|
किशोर आंख का अंधा है।
|
2
|
यदि (<मुहावरा_सकारात्मक> हो तब ध्रुवणता=सकारात्मक;
|
किशोर आंख का तारा है।
|
3
|
यदि (<मुहावरा_नकारात्मक> + <नकारात्मक_पद>) तब ध्रुवणता= सकारात्मक;
|
किशोर आंख का अंधानहीं है।
|
4
|
यदि <मुहावरा_सकारात्मक> + <नकारात्मक_पद> तब ध्रुवणता= नकारात्मक;
|
ईशांत आंख का तारा नहीं है।
|
तालिका
3: नियम समूह
3.3.2.
कार्यविधि (WorkingProcedure)
प्रस्तावित संगणकीय
प्रणाली निम्न चरणों में क्रियान्वित होगा :
चरण
1: पाठ निवेशन (Data
Input)
प्रथम
चरण में भाव-विश्लेषण किये जाने वाले अभिव्यक्ति का प्रणाली में निवेश किया जाएगा।
चरण
2: डाटा पूर्व-प्रक्रमण (Data
Preprocessing)
निवेशित
पाठ को वाक्य के स्तर पर पृथक किया जाएगा क्योंकि प्रणाली द्वारा पाठ का वाक्य
स्तरीय भाव-विश्लेषण किया जाएगा। तत्पश्चात प्रत्येक वाक्य में से अवांछनीय तत्वों
(जैसे- विशेष अक्षर, चिन्ह, प्रतीकों,
इमोटिकोंस आदि) को विलोपित किया जाएगा।
चरण
3: भाव-विश्लेषण (Sentiment
Analysis)
यह
प्रणाली का सबसे महत्वपूर्ण चरण है। इस चरण में सर्वप्रथम वाक्य में से मुख्य शब्द
(Keyword) की पहचान की जाएगी जो कि तालिका 2
के अनुसार कोश में उपस्थित होगा। इसके पश्चात उस मुख्य शब्द से बनने वाले मुहावरों
के सभी संभव रूपों (Inflections) को प्राप्त किया जाएगा तथा
पाठ में उपस्थित मुहावरे से मिलान करने के
पश्चात मुहावरे को चिन्हित किया जाएगा तथा परिभाषित नियमों के अनुसार विश्लेषित
किया जाएगा।
चरण
4: परिणाम (Result)
अंतिम
चरण में प्रणाली द्वारा परिणाम प्रदर्शित किया जाएगा।
3.3.3.
मूल्यांकन एवं
परीक्षण (Evaluation & Testing)
प्रस्तुत
संगणकीय प्रणाली की मुहावरा अभिज्ञान (IdiomsRecognition) की क्षमता उपलब्ध डाटाबेस के अनुसार शत-प्रतिशत है। प्रणाली के मूल्यांकन
हेतु हिंदी के कुल 1050 साधारण वाक्यों का कार्पस बनाया गया है एवं कुल 8 नियमों
का प्रतिपादन किया गया है जिसके आधार पर प्रणाली की शुद्धता लगभग 65 % मापी गई है।
चित्र 2: भाव-विश्लेषक
(संगणकीय प्रणाली) का अंतरापृष्ठ
4.निष्कर्ष (Conclusion)
प्रस्तावित
संगणकीय प्रणाली हिंदी मुहावरेदार अभिव्यक्तियों के प्राकृतिक भाषा ससाधन के
क्षेत्र में हेतु उपयोगी सिद्ध होगी। हिंदी भाषा की रुपिमिक विशेषता, मुक्त शब्दक्रम एवं विभिन्न वाक्य संरचना भाव-विश्लेषण को जटिल बनाती है।
इस शोधकार्य के अंतर्गत भावयुक्त अभिलक्षणों की श्रेणी में केवल मुहावरों को
सम्मिलित किया गया है जो इस शोधकार्य की सीमा है। अभिलक्षणों, नियम-समूह एवं भाव-कोश में विस्तार से अपेक्षाकृत बेहतर परिणाम के
साथ-साथ प्रणाली की गुणवत्ता एवं शुद्धता में वृद्धि हो सकती है।
5.संदर्भ-सूची (References)
·
गुप्त, ओमप्रकाश. (1960). मुहावरा मीमांसा. पटना: बिहार-राष्ट्रभाषा-परिषद.
·
पाण्डेय, पृथ्वीनाथ. (2015). मानक सामान्य हिंदी. मेरठ: अरिहंत पब्लिकेशंस (इ) प्रा. लि..
·
पचौरी, पुनीता. (2006). मुहावरे: आर्थी संरचना एवं मनोभाषिकता. उ.प्र.:
वैज्ञानिक तथा तकनीकी शब्दावली आयोग.
·
ओझा, त्रिभुवन. (1994). हिंदी में अनेकार्थकता का अनुशीलन. वाराणसी:
विश्वविद्यालय प्रकाशन.
·
Rentoumi, Vassiliki. Sentiment Analysis of
Metaphorical Language. PhDThesis. University of the
Aegean.
हिन्दी मुहावरों की अच्छी जानकारी। और अधिक जानकारी के लिए यह पोस्ट पढ़ें
ReplyDelete