Total Pageviews

Wednesday, September 27, 2017

NLP में विसंरचन और पुनरसंरचन (Deformation and reformation in NLP)


विसंरचन (Deformation) : एक इनपुट पाठ का विश्लेषण करते हुए उसमें भाषिक इकाइयों और भाषेतर इकाइयों को अलग-अलग करना।
·       भाषिक इकाइयाँ - वर्ण, अंक, सूत्र, विशेष संकेत आदि।
·       भाषेतर इकाइयाँ- चित्र, लोगोग्राम, ग्राफ, डायग्राम आदि।
टंकित पाठ की रूपरचना, जैसे- बोल्ड, इटैलिक, अंडरलाइन और रंग प्रयोग आदि को चिह्नित करना और उन्हें अलगाते हुए मशीनी संसाधन हेतु केवल पाठ प्राप्त करना।
पुनरसंरचन (Reformation) : इनपुट पाठ की तरह आउटपुट पाठ पुनःसंरचित करना।
अनुप्रयोग : मशीनी अनुवाद (Machine Translation), लिप्यंतरण (Transliteration), पाठ सारांशीकरण (Text Summerrization) आदि क्षेत्रों में।




No comments:

Post a Comment