खंडीकरण (Segmentation)
किसी बड़ी भाषिक इकाई का
इनपुट प्राप्त होने पर उसे छोटी इकाइयों में खंडित करने की प्रक्रिया खंडीकरण है। पाठ
संबंधी अनुप्रयोगों में सामान्यतः पाठ का ही इनपुट प्राप्त होता है। एक पाठ के निम्नलिखित
खंड किए जा सकते हैं-
इस प्रकार का खंडीकरण
किसी प्रोग्रामिंग भाषा में स्ट्रिंग मैनीपुलेशन संबंधी निर्देशों के माध्यम से किया
जा सकता है, क्योंकि टंकित पाठ में मशीन इन्हें अलग-अलग पहचान सकती है।
इनके अलावा अन्य खंड, जैसे- उपवाक्य, पदबंध, रूपिम (मुक्त और बद्ध) भाषायी नियमों के माध्यम
से प्राप्त किए जाते हैं।
No comments:
Post a Comment