विसंरचन (Deformation)
:
एक इनपुट पाठ का विश्लेषण करते हुए उसमें भाषिक इकाइयों और भाषेतर
इकाइयों को अलग-अलग करना।
·
भाषिक इकाइयाँ - वर्ण, अंक, सूत्र, विशेष संकेत आदि।
·
भाषेतर
इकाइयाँ- चित्र, लोगोग्राम, ग्राफ, डायग्राम आदि।
टंकित पाठ की रूपरचना, जैसे- बोल्ड, इटैलिक, अंडरलाइन और रंग प्रयोग आदि को चिह्नित करना
और उन्हें अलगाते हुए मशीनी संसाधन हेतु केवल पाठ प्राप्त करना।
पुनरसंरचन (Reformation)
:
इनपुट पाठ की तरह आउटपुट पाठ पुनःसंरचित करना।
अनुप्रयोग : मशीनी अनुवाद (Machine
Translation), लिप्यंतरण (Transliteration), पाठ सारांशीकरण (Text Summerrization) आदि क्षेत्रों में।
No comments:
Post a Comment