कार्पस निर्माण प्रक्रिया (Process of Building Corpus)
इसे तीन भागों में बाँटकर समझा जा सकता है-
§ पूर्व-नियोजन
(अ)
आकार-प्रकार का निर्धारण : आकार-प्रकार का निर्धारण
निम्नलिखित आधारों पर किया जाता है-
v उद्देश्य
: क्यों कर रहे हैं? किस प्रकार की प्रणाली के लिए?
v समयावधि
: कितने दिनों/वर्षों में करना है?
v मानव-संसाधन
: कितने लोग है?
v अन्य
संसाधन : कंप्यूटर/लैपटॉप, स्मार्टफोन, रिकार्डर आदि
v ..............
आदि
(आ)
पाठ स्रोतों का चयन
इसमें कार्पस निर्माणकर्ता द्वारा यह निर्धारित
किया जाता है कि कहाँ-कहाँ से और किस-किस प्रकार के पाठ लिए जाएँगे-
v वाचिक
कार्पस के लिए- भौगोलिक क्षेत्रों और सूचकों (Informants) का निर्धारण, सामग्री के रूपों का निर्धारण, जैसे- वार्ता, गीत, कथा आदि।
v लिखित
कार्पस के लिए- डाटा स्रोतों का चयन- पुस्तकें, पत्रिकाएँ, समाचार-पत्र, पांडुलिपियाँ, हस्तलिखित
प्राचीन सामग्री आदि।
(इ) पाठ-सामग्री का चयन
जो
स्रोत निर्धारित हो चुके हैं, उनमें से एक निश्चित पाठ
या खंड को चिह्नित करना, जैसे- 10 पृष्ठ की कहानी में से पहले
‘1000 शब्द’ या बीच के ‘1000 शब्द’ या अंत के ‘1000 शब्द’ आदि। यह बात ‘वाचिक कार्पस’ और
‘लिखित कार्पस’ दोनों के लिए लागू होती
है।
§ कार्पस-निर्माण
(अ)
सामग्री का संकलन
(आ)
उपयुक्त इनकोडिंग प्रणाली का चयन
(इ)
उस प्रणाली का प्रयोग करते हुए कार्पस का निर्माण
(ई)
कार्पस एनोटेशन
§ कार्पस-अनुरक्षण
(Maintenance)
(अ)
कार्पस का ठीक तरीके से संग्रहण
No comments:
Post a Comment