Total Pageviews

Tuesday, January 1, 2019

हिंदी मुहावरों का भाषिक अध्ययन: प्राकृतिक भाषा संसाधन के संदर्भ में


.........................................................................................................................


आभ्यंतर (Aabhyantar)      SCONLI-12  विशेषांक         ISSN : 2348-7771

.........................................................................................................................

19. हिंदी मुहावरों का भाषिक अध्ययन: प्राकृतिक भाषा संसाधन के संदर्भ में
प्रितेन्द्र कुमार मालाकार : पी-एच. डी. (ILE)  म.गा.अ.हि.वि. वर्धा

सारांश (Summary)
 किसी भीभाषा में मुहावरों का महत्वपूर्ण स्थान होता है क्योंकि ये भाषा को अतिरिक्त संचार शक्ति प्रदान करते हैं। इनके प्रयोग से भाषा और भी संप्रेषणीय तथा प्रभावशाली हो जाती है। इन्हीं विशेषताओं के कारण मानव जीवन में मुहावरों का प्रयोग निरंतर बढ़ता ही जा रहा है। मानवीय दृष्टिकोण से भाषा में प्रयुक्त मुहावरों की पहचान करना, उनका वर्गीकरण करना तथा उनके सामान्य एवं लाक्षणिक अर्थों में भेद करना सरल है किंतु संगणकीय दृष्टिकोण से यह अपेक्षाकृत कठिन कार्य है। मुहावरों का संसाधन भाषाविज्ञान के विविध अनुप्रयुक्त क्षेत्रों (मशीनी अनुवाद, भाषा-शिक्षण, संगणकीय भाषाविज्ञान आदि) के लिए अभी भी चुनौतीपूर्ण समस्या है। इसी समस्या को दृष्टिगत रखते हुए प्रस्तुत शोधपत्र के अंतर्गत एक संगणकीय मॉडल या प्रणाली की परिकल्पना की गई है जिसके द्वारा भाषा (वाक्य) में प्रयुक्त मुहावरों की पहचान करने के साथ-साथ विविध आधारों पर उनका विश्लेषण तथा वर्गीकरण किया जा सके। प्रणाली के निर्माण हेतु आवश्यक संसाधन के रूप में डाटाबेस एवं कार्पस का निर्माण भी किया गया है। डाटाबेस निर्माण के लिए विभिन्न स्रोतों से हिंदी मुहावरों का संकलन किया गया है। संकलित मुहावरों का विभिन्न भाषावैज्ञानिक सिद्धांतों के आधार पर विश्लेषण एवं वर्गीकरण किया गया है तथा डाटाबेस के रूप में संग्रहित किया गया है। संगणकीय प्रणाली की अभिकल्पना एवं विकास हेतु सॉफ्टवेयर अभियांत्रिकी की प्रविधियों का प्रयोग किया गया है। संगणकीय प्रणाली की संपूर्ण कार्यविधि प्राकृतिक भाषा संसाधन आधारित प्रक्रियाओं एवं अभिगमों पर आधारित होगी। कुछ पूर्व-परिभाषित नियमों का निदर्शन भी किया गया है जिनके आधार पर उक्त प्रणाली क्रियान्वित होगी। अनुप्रयुक्त भाषाविज्ञान के क्षेत्र में प्रस्तावित प्रणाली उपयोगी सिद्ध होगी।
मूलशब्द (Keywords) :मुहावरा, प्राकृतिक भाषा संसाधन, संगणकीय मॉडल, डाटाबेस।
     
1.       भूमिका (Preface)
प्राकृतिक भाषाएं (NaturalLanguages) विभिन्न प्रकार की आंतरिक एवं अप्रत्यक्ष अभिव्यक्तियों (Implicit&IndirectExpressions) से परिपूर्ण एवं समृद्ध होती हैं जिनमें से मुहावरे (Idioms) प्रमुख हैं। मुहावरों के प्रयोग से कोई भाषा और भी अधिक प्रभावशाली हो जाती है। इनके प्रयोग से भाषा में सहजता एवं स्वाभाविकता आती है। उपर्युक्त सभी विशेषताओं एवं गुणों के कारण दैनिक जीवन के वार्तालाप में मुहावरों का प्रयोग सतत रूप से बढ़ता ही जा रहा है। इसलिए प्रस्तुत शोध में मुहावरों का भाषिक अध्ययन किया गया है जिससे मुहावरों के विभिन्न संरचनाओं, अर्थों एवं भावों को समझने में सहायता मिल सके।
2.       मुहावरेदार अभिव्यक्तियां (IdiomaticExpressions)
ऐसी अभिव्यक्तियां या वाक्यांश जिनका शाब्दिक या सामान्य अर्थ तो अलग होता है लेकिन इनका प्रयोग भिन्न भावार्थ प्रकट करने के लिए किया जाता है, मुहावरेदार अभिव्यक्तियां कहलाती हैं। मुहावरेदार अभिव्यक्तियों को मुहावरा भी कहा जाता है। उदाहरण के लिएकाठ का उल्लू”एक मुहावरा है जिसका शाब्दिक या सामान्य अर्थ लकड़ी का उल्लूहै किंतु इसका प्रयोग किसी व्यक्ति को महामूर्खदर्शाने हेतु किया जाता है।
2.1.        मुहावरों की उत्पत्ति (OriginofIdioms)
मुहावरा मूल रूप से अरबी भाषा का शब्द है जिसका अर्थ होता है अभ्यास होना। यह एक संज्ञा (पुल्लिंग) शब्द है। इसे अरबी लिपि में मुहावर: लिखते हैं, जो हिंदी भाषा में मुहावरा हो जाता है। मुहावराको अंग्रेजी में  ‘Idiom’ कहा जाता है। लेटिन और फ्रेंच से होता हुआ यह शब्द अंग्रेजी में आया है। साहित्य में इसके महाविरा, मुहाविरा, मुहावरा, आदि कई रूप मिलते हैं। प्राचीन अर्थ के आधार पर मुहावरे से तात्पर्य था ‘‘आपस में बातचीत’’। उर्दू में इसे तर्ज़ेकलामतथा इस्तलाहभी कहा जाता है। संस्कृत में मुहावरा शब्द के  वाग्रीति, वाग्व्यापार, वाग्शरा, वाग्व्यवहार, विशिष्ट वचनं, विशिष्ट वाक्यं तथा भाषा-विशेषण आदि कई पर्याय मिलते हैं। वास्तव में आज के प्रचलित अर्थ में ‘‘मुहावरा’’ शब्द जिस निहित अर्थ का द्योतक है उस अर्थ का द्योतक कोई भी अन्य नहीं। इसके वास्तविक अर्थ का जो बोध मुहावराशब्द से होता है वह हिंदी के अन्य पर्याय वाग्धरा’,‘भाषा-सम्प्रदायया वाक्-सम्प्रदायआदि प्रयोगों से नहीं हो पाता।
2.2.  मुहावरों की विभिन्न परिभाषाएं (VariousDefinitionsofIdioms)
Ø  “किसी भाषा में पायी जाने वाली असाधारण शब्द-योजना अथवा विलक्षण प्रयोग को मुहावरा कहते हैं”।
-डॉ. पृथ्वीनाथ पाण्डेय
Ø “मुहावरा भाषा-विशेष में प्रचलित उस अभिव्यक्ति की इकाई को कहते हैं, जिसका प्रयोग प्रत्यक्षार्थ से           अलग रूढ़ि लक्ष्यार्थ के लिए किया जाता है”।
-डॉ. भोलानाथ तिवारी
Ø “जो वाक्यांश अपने सामान्य अर्थ को न बताकर, किसी विशेष अर्थ को बतलाता है और प्राय: क्रिया का        काम देता है, उसे वाग्धारा या मुहावरा कहते हैं
-श्याम चंद्र कपूर
2.3.  मुहावरों की विशेषताएं (CharacteristicsofIdioms)
मुहावरों की कुछ प्रमुख विशेषताएं निम्न हैं:
1.       मुहावरा एक वाक्यांश होता है, इसलिए इसका प्रयोग केवल वाक्य के अंतर्गत ही किया जा सकता है।
2.       मुहावरे के साथ जुड़े शब्द कभी बदले नहीं जाते हैं यद्यपि उनके क्रम में आवश्यकतानुसार परिवर्तन किया जा सकता है।
3.       मुहावरे का सामान्य या शाब्दिक अर्थ विशेष महत्व का नहीं होता बल्कि उसके लक्ष्यार्थ पर ध्यान केंद्रित किया जाता है।
4.       मुहावरे का प्रयोग स्वतंत्र रूप में नहीं होता बल्कि वाक्य में प्रसंग के अनुसार होता है एवं ये प्रसंग के   अनुरूपअर्थ देते हैं ।
5.       मुहावरे समाज की रीति-रिवाजों और परंपराओं के निर्माण में सहायक होते हैं तथा इनका निर्माण देश, काल तथा समाज के विकास और परिवर्तन के अनुरूप होता रहता है।
2.4.  महत्व एवं उपयोगिताएं (Importance&Utilizations)
किसी भी भाषा में मुहावरेदार अभिव्यक्तियों का विशेष स्थान होता है जो न केवल भाषा के सौंदर्य एवं प्रभाव शक्ति को बढ़ाते है अपितु भाषा को रोचक, सहज एवं दृश्यात्मक बनाने में महत्वपूर्ण भूमिका निभाते हैं। इसलिए आज मानव जीवन के विभिन्न क्षेत्रों जैसे- सोशल मीडिया, अध्ययन, लेखन, वार्ता, साक्षात्कार, भाषण, वार्तालाप आदि सभी में मुहावरेदार अभिव्यक्तियों का प्रयोग बढ़ता ही जा रहा है क्योंकि ये वक्ता के विचार में अतिरिक्त संचार शक्ति प्रदान करते हैं तथा लोगों का ध्यान किसी विशेष विषय की ओर आकृष्ट कराने में सहायक होते हैं। मुहावरों के प्रयोग से भाषा और अधिक प्रभावशाली हो जाती है।
3.       शोध-प्रविधि (ResearchMethodology)
प्रस्तुत शोधकार्य को पूर्ण करने हेतु एक रूपरेखा प्रस्तावित की गई है जो वैज्ञानिक एवं विश्लेषणात्मक शोध-प्रविधि पर आधारित है। इस रूपरेखा में कुछ पूर्व-निर्धारित चरणों का उल्लेख किया गया है जिनका अनुपालन कर शोधकार्य संपन्न किया गया है। ये चरण निम्नलिखित हैं:
3.1.     मुहावरों का संकलन (CollectionofIdioms)
हिंदी के मुहावरेदार अभिव्यक्तियों के भाषिक अध्ययन हेतु निम्न तालिका में वर्णित कोशों का संदर्भ लेते हुए कुल 2000 मुहावरों का संकलन किया गया है
क्रं.
शीर्षक
लेखक
प्रकाशक
ISBN
1.               
मानक सामान्य हिंदी
डॉ. पृथ्वीनाथ पांडेय
अरिहंत पब्लिकेशंस (इ) प्रा. लि.
978-81-8348-695-8
2.               
मानक हिंदी मुहावरा लोकोक्ति कोश
आचार्य डॉ. हरिवंश तरुण
प्रकाशन संस्थान
81-7714-161-9
3.               
सरस्वती मुहावरा कोश
राजवीर सिंह
सरस्वती विहार
978-81-216-1705-5
तालिका 1: हिंदी मुहावरों के संकलन हेतु प्राथमिक स्रोत
3.2.        मुहावरों का भाषिक विश्लेषण(LinguisticsAnalysisofIdioms)
हिंदी के संकलित मुहावरों का विभिन्न भाषिक सिद्धांतों के आधार पर विश्लेषण किया गया है जिससे मुहावरों के प्रदर्शन (Representation) एवं सामान्यीकरण (Normalization) में सरलता हो। मुहावरों का विश्लेषण निम्न आधार पर किया गया है:
3.1.1.   निर्माण के आधार पर
मुहावरों के विश्लेषण से यह स्पष्ट हुआ है कि:
1.       हिंदी के अधिकांश मुहावरे शरीर से विभिन्न अंगों (जैसे- आंख, नाक, कमर, सीना, पैर, हाथ, गर्दन आदि) से संबंधित हैं।
उदाहरण- आंख का अंधा, नाक कटाना, कमर कसना, पैर पटकना, हाथ उठाना, गर्दन झुकना आदि।
2.       कई मुहावरे विभिन्न पशु-पक्षी तथा जंतुओं पर आधारित हैं।
उदाहरण- गधा बनाना, बैल की तरह जुतना, बाज की तरह झपटना, कीड़ा बनना आदि।
3.       कुछ मुहावरे ऐसे भी हैं जो दैनिक जीवन के रिश्तों या संबंधों (बाप, दादा, मामा, चाचा आदि) से बने हुए हैं।
उदाहरण- बाप निकलना, मामा बनाना, मौसी का घर होना आदि ।
4.       किसी देवता, प्रसिद्ध व्यक्ति, स्थान तथा पदार्थ के नाम  पर भी मुहावरे प्राप्त हुए हैं।
उदाहरण- इंद्र का वज्र, हनुमान की गदा, गांधी के रास्ते पर चलना, हिटलरशाही, नर्क में जाना, मिट्टी में मिलना, लोहा लेना आदि ।
5.       संख्याओं से भी कुछ मुहावरे निर्मित हुए हैं।
उदाहरण- एक-और-एक ग्यारह होना, नौ-दो ग्यारह होना, तीन-तेरह करना, चार-सौ-बीसी करना, आठ-आठ आंसू रोना, दस घाट का पानी पीना आदि ।
6.       शब्दों की पुनरावृत्ति से भी कुछ मुहावरे निर्मित हुए हैं।
उदाहरण- थू-थू करना, थोड़ा-थोड़ा करना आदि ।
7.       हिन्दी के एक शब्द के साथ उर्दू के दूसरे शब्द के योग से बने मुहावरे भी हैं।
उदाहरण- मेल मुहब्बत होना, मेल-मुलाकात रखना, दिशा-मैदान जाना आदि।
8.       अलंकारों के प्रयोग से से बने मुहावरे भी हैं। अनेक मुहावरे में अलंकारों का प्रयोग हुआ रहता है। किंतु इसका यह अर्थ नहीं है कि प्रत्येक मुहावरा अलंकार होता है अथवा प्रत्येक अलंकारयुक्त वाक्यांश मुहावरा होता है। उदाहरण- लाल अंगारा होना,अंगार बरसाना आदि।
9.       कथानकों, धर्म-कथाओं आदि पर आधारित मुहावरे भी हैं।
उदाहरण- बीड़ा उठाना, टेढ़ी खीर होना, ढपोरशंख होना, सोने का मृग होना, बीरबल की खिचड़ी पकाना, आदि।
10.   व्यक्तिवाचक संज्ञाओं का जातिवाचक संज्ञाओं की भांति प्रयोग से बने मुहावरे भी हैं।
उदाहरण- कुंभकरण की नींद, द्रौपदी का चीर, जयचंद होना, युधिष्ठिर बनना, विभीषण होनाआदि।
11.   ध्वनियों पर आधारित मुहावरे भी हैं।
उदाहरण- वाह-वाह करना, सी-सी करना, हाय-हाय मचाना,टर-टर करना, भों-भों करना, में-में करना।
12.   शारीरिक चेष्टाओं के आधार पर बने हुए मुहावरे भी हैं। शारीरिक चेष्टाएं मनोभाव प्रकट करती हैं और उनके आधार पर कुछ मुहावरे बनते हैं।
उदाहरण- छाती पीटना, दांत पीसना, पूंछ हिलाना, आदि।
3.1.2.   व्याकरणिक संरचना के आधार पर
प्रत्येक मुहावरे की एक व्याकरणिक संरचना (GrammaticalStructure) होती है। व्याकरणिक संरचना के अनुसार ही मुहावरों का निर्माण या सृजन होता है। मुहावरों का अध्ययन, विश्लेषण, वर्गीकरण एवं वाक्यों में प्रयोग करते समय उनकी संरचनाओं का बोध होना आवश्यक है। किसी मुहावरे की व्याकरणिक संरचना में शब्द-भेद (संज्ञा, सर्वनाम, विशेषण, क्रिया-विशेषण, परसर्ग आदि) एक निर्धारित क्रम में व्यवस्थित होते हैं। कभी-कभी वक्ताओं के द्वारा वाक्य में प्रयोग करते समय मुहावरे की संरचना (शब्द-क्रम) को आवश्यकतानुसार परिवर्तित भी कर लिया जाता है, किंतु यह मुहावरे की मूल संरचना से ही प्रेरित (Motivated) अथवा बद्ध (Bounded) होती है। मुहावरों की कुछ प्रमुख भाषिक संरचनाओं (LinguisticStructures) निम्न हैं:
1.       <संज्ञा> से
      कुछ ऐसे मुहावरे हैं जो केवल एक संज्ञा से निर्मित हुए हैं।उदाहरण- उल्लू, गधा, शेर।
2.       <क्रिया> से
      कुछ ऐसे मुहावरे हैं जो केवल एक क्रिया से निर्मित हुए हैं।उदाहरण- चटाना, मिमियाना।
3.       <विशेषण> से
      कुछ ऐसे मुहावरे हैं जो केवल एक विशेषण से बने हैं।उदाहरण- मक्खीचूस, जंगलराज, अंधेरगर्दी,           अंधेरनगरी, रामराज।
4.       <संज्ञा>+<क्रिया> के प्रयोग से
                  कुछ ऐसे मुहावरे हैं जो संज्ञा के साथ क्रिया मिलने से निर्मित हुए हैंउदाहरण- टांग खींचना, सिर पकड़ना,                                                   माथा पकड़ना।
5.       <क्रिया>+<क्रिया> के संयोजन से
                  कुछ ऐसे मुहावरे हैं जो क्रिया के क्रिया के संयोजन से बनते हैं।उदाहरण- उठना-बैठना,खाना-पीना
6.       <विशेषण>+<क्रिया> के प्रयोग से
                  कुछ ऐसे मुहावरे हैं जो विशेषण के साथ क्रिया मिलने से निर्मित हुए हैं। उदाहरण- अंधा बनाना, मूर्ख बनाना।
7.       <सर्वनाम>+<क्रिया> के प्रयोग से
                  कुछ ऐसे मुहावरे हैं जो सर्वनाम के साथ क्रिया मिलने से निर्मित हुए हैं। उदाहरण- अपना बनाना, पराया                                                    करना।
8.       <विशेषण>+<संज्ञा> के प्रयोग से
                  कुछ ऐसे मुहावरे हैं जो विशेषण के साथ संज्ञा मिलने से निर्मित हुए हैं। मुहावरों में अद्वितीयता की प्रविष्टि एवं                                               अनूठेपन के संयोजन के लिए विशेषणों का भी प्रयोग किया जाता है।उदाहरण- अंधा कुआं , किताबी कीड़ा।
9.       <संज्ञा>+<परसर्ग>+<संज्ञा> के प्रयोग से
                  कुछ ऐसे मुहावरे हैं जो संज्ञा के साथ परसर्ग (का, के, की, ने, से, आदि) तत्पश्चात            एक और संज्ञा मिलने से                                         बनते हैं।उदाहरण- काठ का उल्लू, आंख का तारा, कुत्ते की दुम।
10.   <संज्ञा>+<परसर्ग>+<विशेषण> के प्रयोग से
                  कुछ ऐसे मुहावरे हैं जो संज्ञा के साथ परसर्ग (का, के, की, ने, से) तत्पश्चात                                                                                       विशेषण मिलने से निर्मित हुए हैं। उदाहरण- आंख का अंधा, जबान का पक्का।
11.   <विशेषण>+<संज्ञा>+<क्रिया> के योग से
                  कुछ ऐसे मुहावरे हैं जो विशेषण के साथ संज्ञा तत्पश्चात क्रिया मिलने से निर्मित हुए हैं। उदाहरण- उल्टी गंगा                                              बहाना, उल्टी माला फेरना।
12.   <संज्ञा>+<विशेषण>+<क्रिया> के प्रयोग से
                  कुछ ऐसे मुहावरे हैं जो संज्ञा के साथ विशेषण तत्पश्चात क्रिया मिलने से निर्मित हुए हैं। उदाहरण- उल्लू सीधा                                 करना, खून सफ़ेद होना।
13.   <विशेषण>+<परसर्ग>+<संज्ञा>+<संज्ञा>के प्रयोग से
                  कुछ ऐसे मुहावरे हैं जो विशेषण के साथ परसर्ग (का, के, की, ने, से, आदि) फिर संज्ञा तत्पश्चात एक और संज्ञा                                मिलने से निर्मित हुए हैं। उदाहरण- अंधे के हाथ बटेर, अंधे के हाथ आईना।
3.1.3.   मुहावरों का अर्थीय विश्लेषण (SemanticAnalysisofIdioms)
1.      अनेकार्थकता (Polysemy): किसी भी मुहावरे के दो अर्थ होते हैं:
(1)    शाब्दिक अर्थ: शाब्दिक अर्थ से अभिप्राय है मुहावरों का सामान्य अर्थ। मुहावरों के अंतर्गत प्रयुक्त शब्दों का अर्थ ही मुहावरों का शाब्दिक अर्थ कहलाता है। इसे मुख्यार्थया प्रत्यार्थ भी कहा जाता है।उदाहरण के लिएकाठ का उल्लू” एक मुहावरा है जिसका शाब्दिक या सामान्य अर्थ लकड़ी का उल्लू है।
(2)    लक्ष्यार्थ: मुहावरों का प्रयोग जिस लक्ष्य की प्राप्ति के लिए किया जाता है, उसे लक्ष्यार्थ कहा जाता है। इसे व्यंग्यार्थ भी कहा जाता है।उदाहरण के लिएकाठ का उल्लू एक मुहावरा है प्रयोग किसी व्यक्ति को महामूर्ख दर्शाने हेतु किया जाता है।
      कुछ ऐसे मुहावरे भी हैं जिनका प्रयोग शाब्दिक एवं लक्ष्य दोनों प्रकार के अर्थोंमें किया जाता है, जैसे:
(i)           अंडे सेना
                  शाब्दिक अर्थ- पक्षियों का अपने अंडों पर बैठना, बैठकर गर्मी प्रदान करना आदि।
                  लक्ष्यार्थ घर में बैठे रहना, बाहर न निकलना, काम न करना आदि।
(ii)         आग लगाना
                  शाब्दिक अर्थ- किसी वस्तु को जलाना।
                  लक्ष्यार्थ किसी व्यक्ति को भड़काना, झगड़ा लगाना आदि।
2.      समानांतरता (Parallelism)
कई मुहावरे अर्थ एवं भाव की दृष्टि से समान होते हैं। मुहावरों के इस गुण या विशेषता को समानांतरता कहा जाता है।उदाहरण-
      जानबूझकर मृत्यु के निकट जाना =
                                       कफ़न सिर से बांधना
                                       कफ़न बांधे फिरना
                                       मौत को दावत देना
                                       कफ़न लपेटना
                                       मौत को गले लगाना
                                       मौत के मुंह में जाना
                                       मौत को बुलाना
उपर्युक्त सभी मुहावरों का समान (अर्थ एवं भाव की दृष्टि से) समान अर्थ है। इनका अर्थीय जाल भी निर्मित किया जा सकता है।
मौत को गले लगाना
जानबूझकर मृत्यु के निकट जाना
मौत को दावत देना

कफ़न बांधे फिरना


कफ़न सिर से बांधना
मौत के मुंह मेंजाना
कफ़न लपेटना
 






चित्र 1: अर्थीय-जाल(SemanticNet)



3.3.         संगणकीय प्रणाली विकास (DevelopmentofComputationalSystem)
इस प्रणाली को भाव-विश्लेषकका नाम दिया गया है। यह प्रणाली यूनिकोड आधारित देवनागरी लिपि अनूदित पाठ पर ही क्रियान्वित होगी। विंडो आधारित इस प्रणाली को मुख्यत: हिंदी भाषा के मुहावरेदार अभिव्यक्तियों के भाव-विश्लेषण हेतु विकसित किया गया है। इस प्रणाली की निम्नलिखित विशेषताएं हैं:
Ø द्विभाषी अंतरापृष्ठ (Bi-LingualInterface)
Ø निवेशित पाठ का वाक्यस्तरीय भाव-विश्लेषण।
Ø डाटाबेस प्रबंधन की सुविधा।
3.3.1. संसाधन-निर्माण(ResourceGeneration)
भाव-विश्लेषण के दृष्टिकोण से हिंदी को अल्प-संसाधनीय भाषा (ScarceResourceLanguage) कहा जाता है [1] क्योंकि हिंदी भाषा के भाव-विश्लेषण संबंधित किए जा रहे शोधकार्य विकासशील अवस्था में है इसलिए प्रस्तुत शोधकार्य हेतु संसाधनों का संग्रहण या निर्माण किया जाना आवश्यक है। इस शोधकार्य में निम्न संसाधनों का निर्माण किया गया है:
1.   हिंदी मुहावरा भावकोश (LexiconofHindiIdioms)
      हिंदी के संग्रहित मुहावरों में से प्रत्येक का शाब्दिक अर्थ, मुख्य शब्द एवं रूप देते हुए एनोटेशन पद्धति के द्वारा   सकारात्मक, नकारात्मक तथा निष्पक्ष के रूप में वर्गीकृत किया गया है।
क्रं
मुहावरा
शाब्दिक_अर्थ
मुख्य शब्द
रूप
ध्रुवणता
1
कमर कसना
तैयार होना
कमर
कमर कस;
सकारात्मक
2
आंख का अंधा
मूर्ख होना
आंख
आंख का अंधा,
आंख की अंधी
नकारात्मक
तालिका 2: हिंदी मुहावरा भावकोश की संरचना
2.   नियम-निदर्शन (RuleDerivation)
      अभिव्यक्तियों की ध्रुवणता निर्धारित करने हेतु नियमों का निदर्शन किया गया है। कुछ परिस्थितियों में अभिव्यक्तियों की ध्रुवणता ना, नही आदि शब्दों के कारण परिवर्तित (सकारात्मक से नकारात्मक या    विपरीत) हो जाती है इसलिए ऐसे समस्या पर नियंत्रण हेतु कुछ पूर्व-परिभाषित नियमों का विकास किया गया है जिसके आधार पर हमारी प्रस्तावित प्रणाली क्रियान्वित होगी।
क्रं
नियम
उदाहरण
1
यदि (<मुहावरा_नकारात्मक> हो तब ध्रुवणता=नकारात्मक;
किशोर आंख का अंधा है।
2
यदि (<मुहावरा_सकारात्मक> हो तब ध्रुवणता=सकारात्मक;
किशोर आंख का तारा है।
3
यदि (<मुहावरा_नकारात्मक> + <नकारात्मक_पद>) तब ध्रुवणता= सकारात्मक;
किशोर आंख का अंधानहीं है।
4
यदि <मुहावरा_सकारात्मक> + <नकारात्मक_पद> तब ध्रुवणता= नकारात्मक;
ईशांत आंख का तारा नहीं है।
तालिका 3: नियम समूह
3.3.2.          कार्यविधि (WorkingProcedure)
प्रस्तावित संगणकीय प्रणाली निम्न चरणों में क्रियान्वित होगा :
चरण 1:  पाठ निवेशन (Data Input)
प्रथम चरण में भाव-विश्लेषण किये जाने वाले अभिव्यक्ति का प्रणाली में निवेश किया जाएगा।
चरण 2:  डाटा पूर्व-प्रक्रमण (Data Preprocessing)
निवेशित पाठ को वाक्य के स्तर पर पृथक किया जाएगा क्योंकि प्रणाली द्वारा पाठ का वाक्य स्तरीय भाव-विश्लेषण किया जाएगा। तत्पश्चात प्रत्येक वाक्य में से अवांछनीय तत्वों (जैसे- विशेष अक्षर, चिन्ह, प्रतीकों, इमोटिकोंस आदि) को विलोपित किया जाएगा।
चरण 3:  भाव-विश्लेषण (Sentiment Analysis)
यह प्रणाली का सबसे महत्वपूर्ण चरण है। इस चरण में सर्वप्रथम वाक्य में से मुख्य शब्द (Keyword) की पहचान की जाएगी जो कि तालिका 2 के अनुसार कोश में उपस्थित होगा। इसके पश्चात उस मुख्य शब्द से बनने वाले मुहावरों के सभी संभव रूपों (Inflections) को प्राप्त किया जाएगा तथा पाठ में उपस्थित  मुहावरे से मिलान करने के पश्चात मुहावरे को चिन्हित किया जाएगा तथा परिभाषित नियमों के अनुसार विश्लेषित किया जाएगा।
चरण 4:  परिणाम (Result)
अंतिम चरण में प्रणाली द्वारा परिणाम प्रदर्शित किया जाएगा।
3.3.3.          मूल्यांकन एवं परीक्षण (Evaluation & Testing)
प्रस्तुत संगणकीय प्रणाली की मुहावरा अभिज्ञान (IdiomsRecognition) की क्षमता उपलब्ध डाटाबेस के अनुसार शत-प्रतिशत है। प्रणाली के मूल्यांकन हेतु हिंदी के कुल 1050 साधारण वाक्यों का कार्पस बनाया गया है एवं कुल 8 नियमों का प्रतिपादन किया गया है जिसके आधार पर प्रणाली की शुद्धता लगभग 65 % मापी गई है।
चित्र 2: भाव-विश्लेषक (संगणकीय प्रणाली) का अंतरापृष्ठ
4.निष्कर्ष (Conclusion)
प्रस्तावित संगणकीय प्रणाली हिंदी मुहावरेदार अभिव्यक्तियों के प्राकृतिक भाषा ससाधन के क्षेत्र में हेतु उपयोगी सिद्ध होगी। हिंदी भाषा की रुपिमिक विशेषता, मुक्त शब्दक्रम एवं विभिन्न वाक्य संरचना भाव-विश्लेषण को जटिल बनाती है। इस शोधकार्य के अंतर्गत भावयुक्त अभिलक्षणों की श्रेणी में केवल मुहावरों को सम्मिलित किया गया है जो इस शोधकार्य की सीमा है। अभिलक्षणों, नियम-समूह एवं भाव-कोश में विस्तार से अपेक्षाकृत बेहतर परिणाम के साथ-साथ प्रणाली की गुणवत्ता एवं शुद्धता में वृद्धि हो सकती है।
5.संदर्भ-सूची (References)
·         गुप्त, ओमप्रकाश. (1960). मुहावरा मीमांसा. पटना: बिहार-राष्ट्रभाषा-परिषद.
·         पाण्डेय, पृथ्वीनाथ. (2015). मानक सामान्य हिंदी. मेरठ: अरिहंत पब्लिकेशंस (इ) प्रा. लि..
·         पचौरी, पुनीता. (2006). मुहावरे: आर्थी संरचना एवं मनोभाषिकता. उ.प्र.: वैज्ञानिक तथा तकनीकी शब्दावली आयोग.
·         ओझा, त्रिभुवन. (1994). हिंदी में अनेकार्थकता का अनुशीलन. वाराणसी: विश्वविद्यालय प्रकाशन.
·         Rentoumi, Vassiliki. Sentiment Analysis of Metaphorical Language. PhDThesis. University of the Aegean.

1 comment: