पद-विच्छेदन (Parsing)
किसी वाक्य को उसकी संरचना के अनुसार विश्लेषित करने की प्रक्रिया
पद-विच्छेदन है। पद-विच्छेदन के लिए सर्वप्रथम वाक्य की टैगिंग करना आवश्यक होता है।
टैगिंग के बाद चंकिंग (पदबंध-चिह्नन) का कार्य किया जाता है। इसके पश्चात पद-विच्छेदित
वाक्य निर्मित होता है। अतः इसे क्रमानुसार निम्नलिखित प्रकार से देखा जा सकता है-
वाक्य इनपुट
टैगिंग
चंकिंग
पार्सिंग (पद-विच्छेदन)
चंकिंग वाक्य में पदबंधों को चिह्नित करने की प्रक्रिया है। पदबंधों
के अलग-अलग चिह्नित होते ही वाक्य का स्वरूप स्पष्ट होने लगता है। इसी कारण चंकिंग
को शैलो-पार्सिंग (सतही पद-विच्छेदन) भी कहा गया है।
पद-विच्छेदन के लिए वाक्य से लेकर टैग तक के नियम सभी स्तरों पर
देने होते हैं। जिसे क्रमिक रूप से दर्शाया जाता है। एक पद-विच्छेदित वाक्य को
ट्री-डायग्राम के माध्यम से सरलतापूर्वक समझा जा सकता है।
टैग्ड कोड के रूप में इसकी
प्रस्तुति इस प्रकार होगी-
पद-विच्छेदन (पार्सिंग) के प्रकार
निम्नलिखित तीन आधारों पर पद-विच्छेदन के प्रकार किए जाते हैं-
(1) दिशा के आधार पर
1.1 बाएँ-से-दाँए पद-विच्छेदन (Left to right-LR Parsing)
1.1 दाँए-से-बाएँ पद-विच्छेदन (Right to Left -RL Parsing)
(2) स्तर/क्रम के आधार
1.1 ऊपर-से-नीचे पद-विच्छेदन (Top Down Parsing)
1.1 नीचे-से-ऊपर पद-विच्छेदन (Bottom-Up Parsing)
(3) गहनता के आधार
1.1 सतही पद-विच्छेदन (Shallow Parsing)
1.1 गहन पद-विच्छेदन (Deep Parsing)
No comments:
Post a Comment