रूपविश्लेषक और रूपसर्जक
मानव भाषाओं में शब्द के स्तर पर रूपिमिक दृष्टि
से दो क्रियाएँ की जाती हैं- रूपविश्लेषण और रूपसर्जन। रूपविश्लेषण का संबंध किसी पद
या शब्दरूप का विश्लेषण करते हुए ‘मूल शब्द’ तथा ‘रूपसाधक रूपिम या व्याकरणिक सूचनाएँ’ प्रदान करने से है।
रूपसर्जन का संबंध किसी मूल शब्द के सभी रूपों
(पदों) का निर्माण करने से है।
रूपिमिक विश्लेषण और सर्जन की दृष्टि से किसी भाषा
में प्राप्त होने वाले शब्दों के दो वर्ग किए जा सकते हैं-
(क) विकारी – वे शब्द जिनके शब्दरूप
बनते हैं।
(ख) अविकारी – वे शब्द जिनके शब्दरूप
नहीं बनते।
रूपविश्लेषण और रूपसर्जन का संबंध इनमें से ‘विकारी’ शब्दों से है।
प्राकृतिक भाषा संसाधन के क्षेत्र में उक्त कार्यों
को संपन्न करने वाली प्रणालियों को रूपविश्लेषक (Morph Analyzer) और रूपसर्जक (Morph Generator) कहते हैं। इन्हें संक्षेप में इस प्रकार देख सकते हैं-
(1) रूपविश्लेषक
(Morph Analyzer)
रूपविश्लेषक वह प्रणाली है जो किसी पाठ में आए
शब्दों (पदों) में लगे हुए मूल रूप (Stem) और
संबंधतत्व- प्रत्यय (suffix) आदि को अलग करती है।
हिंदी में संज्ञा, सर्वनाम, विशेषण, क्रिया
शब्दवर्गों के शब्दों के रूप बनते हैं। अतः हिंदी रूपविश्लेषक इन शब्दों में आए
हुए मूल शब्दों और उनके साथ जुड़ने वाले प्रत्ययों को अलग-अलग चिह्नित करता है। यदि
शब्द अपने मूल रूप में ही वाक्य में आया हुआ हो तो रूपविश्लेषक द्वारा उसकी भी
सूचना दी जाती है। रूपविश्लेषक द्वारा आउटपुट के रूप में चार प्रकार से सूचनाएँ दी
जा सकती हैं-
· शब्दरूप और
मूलशब्द
· शब्दरूप और
मूलशब्द तथा व्याकरणिक सूचनाएँ
· शब्दरूप, मूलशब्द और प्रत्यय
· शब्दरूप, मूलशब्द, प्रत्यय तथा व्याकरणिक सूचनाएँ
इसके लिए दो चीजों की आवश्यकता पड़ती है-
रूपविश्लेषण नियम + डाटाबेस
हिंदी में प्रयुक्त कुछ शब्दरूपों के विश्लेषण
नियम इस प्रकार हैं-
1. संज्ञा शब्द
शब्दरूप इनपुट विश्लेषित आउटपुट
लड़का लड़का (लड़का, Ø) : एकवचन, पुल्लिंग
लड़के लड़के (लड़का, ा > े) : बहुवचन, पुल्लिंग
लड़कों लड़कों (लड़का) : बहुवचन, पुल्लिंग, परसर्गीय
लड़की लड़की (लड़की) : एकवचन, स्त्रीलिंग
लड़कियाँ लड़कियाँ (लड़की) : बहुवचन, स्त्रीलिंग
लड़कियों लड़कियों (लड़की) : बहुवचन, स्त्रीलिंग, परसर्गीय
2. सर्वनाम शब्द
मैं मैं (मैं, Ø) : उत्तमपुरुष, एकवचन
मैंने मैंने (मैं, ने) : उत्तमपुरुष, एकवचन, परसर्गीय
मुझको मुझको (मैं)>मुझ, को) : उत्तमपुरुष, एकवचन, परसर्गीय
(2) रूपसर्जक
(Morph Generator)
रूपसर्जक ऐसी प्रणाली है, जो किसी मूल शब्द का इनपुट देने पर उसके सभी रूप निर्मित कर दे। हिंदी में
संज्ञा, सर्वनाम, विशेषण, क्रिया शब्दवर्गों के शब्दों के रूप बनते हैं। इसके लिए दो चीजों की
आवश्यकता पड़ती है-
रूपसर्जन नियम + डाटाबेस (मूल शब्द + प्रत्यय)
हिंदी के कुछ शब्दों के शब्दरूप निर्माण के
उदाहरण इस प्रकार हैं-
1. संज्ञा शब्द
मूलशब्द इनपुट आउटपुट शब्दरूप
लड़का लड़का, लड़के, लड़कों
लड़का : एकवचन, पुल्लिंग
लड़के : एकवचन, परसर्गीय
लड़के : बहुवचन, पुल्लिंग
लड़कों : बहुवचन, पुल्लिंग, परसर्गीय
No comments:
Post a Comment