पद-विच्छेदन और पद-विच्छेदन की प्रक्रिया
पद-विच्छेदन (Parsing)
पद-विच्छेदन (Parsing) वह प्रक्रिया है, जिसके माध्यम से किसी पाठ में आए प्रत्येक वाक्य
की संरचनात्मक इकाइयों की मशीन द्वारा स्वचलित पहचान की जाती है, तथा उसे निरूपित (represent) किया जाता है।
अपने सामान्य स्वरूप में प्रत्येक वाक्य
शब्दों का एक समूह होता है, जैसे-
राम अपने कमरे
में खाना खाता है। वह एक बहुत अच्छा लड़का है।
कंप्यूटर एक डमी
मशीन है। पाठ में टाइपिंग संबंधी अक्षरों और चिन्हों की पहचान के माध्यम से वह
इनपुट पाठ को पैराग्राफ, वाक्य और शब्द में तोड़ सकती है-
इनपुट पाठ-
राम अपने कमरे
में खाना खाता है। वह एक बहुत अच्छा लड़का है।
खंडीकरण (पाठ से
(पैराग्राफ) से वाक्य)-
1. राम अपने कमरे में खाना खाता है।
2. वह एक बहुत अच्छा लड़का है।
खंडीकरण (वाक्य
से शब्द)-
वाक्य-1
राम
अपने
कमरे
में
खाना
खाता
है।
वाक्य-2
वह
एक
बहुत
अच्छा
लड़का
है।
खंडीकरण के
पश्चात प्रत्येक शब्द को पहचानने की आवश्यकता होती है, जो 'रूपिमिक विश्लेषण' (Morph. Analysis) और 'टैगिंग'
(Tagging) के माध्यम से
किया जाता है। इससे मशीन प्रत्येक शब्द को पहचानने में सक्षम हो जाती है। किंतु उन
शब्दों के किस प्रकार के योग से वह वाक्य बना है?
इसका ज्ञान मशीन
को नहीं हो पाता।
इसी पहचान के
लिए पदबंध चिह्नन (Phrase Marking/Chunking) के साथ-साथ
संपूर्ण वाक्य संरचना को निरूपित (Represent)
करने की जो
प्रक्रिया की जाती है, उसे पद-विच्छेदन (Parsing) कहते हैं।
पद-विच्छेदन की प्रक्रिया
इसे दो भागों में
विभक्त करके समझ सकते हैं-
(क) पद-विच्छेदन
के लिए पूर्व आवश्यकता
खंडीकरण, 'रूपिमिक विश्लेषण', टैगिंग
(ख) पद विच्छेदन के
अंतर्गत होने वाली प्रक्रियाएँ-
पदबंध चिह्नन (Phrase Marking/Chunking)
संपूर्ण वाक्य संरचना का निरूपण (Representation)
पद-विच्छेदन मूलतः
‘संपूर्ण
वाक्य संरचना का निरूपण’ (Representation) ही है, किंतु इसके लिए उसमें उपर्युक्त सभी प्रक्रियाओं को संपन्न करना
होता है।
पद-विच्छेदन के
प्रकार (Types of Parsing) हेतु निम्नलिखित
लिंक पर जाएँ-
No comments:
Post a Comment