Total Pageviews

Thursday, February 21, 2019

रूपविश्लेषक और रूपसर्जक (Morph Analyzer and Morph Generator)



रूपविश्लेषक और रूपसर्जक
(Morph Analyzer and Morph Generator)
मानव भाषाओं में शब्द के स्तर पर रूपिमिक दृष्टि से दो क्रियाएँ की जाती हैं- रूपविश्लेषण और रूपसर्जन। रूपविश्लेषण का संबंध किसी पद या शब्दरूप का विश्लेषण करते हुए मूल शब्द तथा रूपसाधक रूपिम या व्याकरणिक सूचनाएँ प्रदान करने से है।
रूपसर्जन का संबंध किसी मूल शब्द के सभी रूपों (पदों) का निर्माण करने से है।
रूपिमिक विश्लेषण और सर्जन की दृष्टि से किसी भाषा में प्राप्त होने वाले शब्दों के दो वर्ग किए जा सकते हैं-
(क) विकारी – वे शब्द जिनके शब्दरूप बनते हैं।
(ख) अविकारी – वे शब्द जिनके शब्दरूप नहीं बनते।
रूपविश्लेषण और रूपसर्जन का संबंध इनमें से विकारी शब्दों से है।
प्राकृतिक भाषा संसाधन के क्षेत्र में उक्त कार्यों को संपन्न करने वाली प्रणालियों को रूपविश्लेषक (Morph Analyzer) और रूपसर्जक (Morph Generator) कहते हैं। इन्हें संक्षेप में इस प्रकार देख सकते हैं-
(1) रूपविश्लेषक (Morph Analyzer)
रूपविश्लेषक वह प्रणाली है जो किसी पाठ में आए शब्दों (पदों) में लगे हुए मूल रूप (Stem) और संबंधतत्व- प्रत्यय (suffix) आदि को अलग करती है।
हिंदी में संज्ञासर्वनामविशेषणक्रिया शब्दवर्गों के शब्दों के रूप बनते हैं। अतः हिंदी रूपविश्लेषक इन शब्दों में आए हुए मूल शब्दों और उनके साथ जुड़ने वाले प्रत्ययों को अलग-अलग चिह्नित करता है। यदि शब्द अपने मूल रूप में ही वाक्य में आया हुआ हो तो रूपविश्लेषक द्वारा उसकी भी सूचना दी जाती है। रूपविश्लेषक द्वारा आउटपुट के रूप में चार प्रकार से सूचनाएँ दी जा सकती हैं-
·       शब्दरूप और मूलशब्द
·       शब्दरूप और मूलशब्द तथा व्याकरणिक सूचनाएँ
·       शब्दरूपमूलशब्द और प्रत्यय
·       शब्दरूपमूलशब्दप्रत्यय तथा व्याकरणिक सूचनाएँ
इसके लिए दो चीजों की आवश्यकता पड़ती है-
रूपविश्लेषण नियम + डाटाबेस
हिंदी में प्रयुक्त कुछ शब्दरूपों के विश्लेषण नियम इस प्रकार हैं-
1. संज्ञा शब्द
शब्दरूप इनपुट                          विश्लेषित आउटपुट
लड़का                                       लड़का (लड़का, Ø) : एकवचनपुल्लिंग
लड़के                                        लड़के (लड़का > े) : बहुवचनपुल्लिंग
लड़कों                                       लड़कों (लड़का) : बहुवचनपुल्लिंगपरसर्गीय
लड़की                                       लड़की (लड़की) : एकवचनस्त्रीलिंग
लड़कियाँ                                    लड़कियाँ (लड़की) : बहुवचनस्त्रीलिंग
लड़कियों                                    लड़कियों (लड़की) : बहुवचनस्त्रीलिंगपरसर्गीय
2. सर्वनाम शब्द
मैं                                  मैं (मैं, Ø) : उत्तमपुरुषएकवचन
मैंने                                मैंने (मैंने) : उत्तमपुरुषएकवचनपरसर्गीय
मुझको                           मुझको (मैं)>मुझको) : उत्तमपुरुषएकवचनपरसर्गीय

(2) रूपसर्जक (Morph Generator)
रूपसर्जक ऐसी प्रणाली हैजो किसी मूल शब्द का इनपुट देने पर उसके सभी रूप निर्मित कर दे। हिंदी में संज्ञासर्वनामविशेषणक्रिया शब्दवर्गों के शब्दों के रूप बनते हैं। इसके लिए दो चीजों की आवश्यकता पड़ती है-
रूपसर्जन नियम + डाटाबेस (मूल शब्द + प्रत्यय)
हिंदी के कुछ शब्दों के शब्दरूप निर्माण के उदाहरण इस प्रकार हैं-
1. संज्ञा शब्द
मूलशब्द इनपुट                         आउटपुट शब्दरूप
लड़का                                       लड़कालड़केलड़कों
लड़का : एकवचनपुल्लिंग
लड़के : एकवचनपरसर्गीय
लड़के : बहुवचनपुल्लिंग
लड़कों : बहुवचनपुल्लिंगपरसर्गीय



No comments:

Post a Comment