Total Pageviews

Tuesday, March 12, 2019

 विवरण
1.कार्पस-1. परिचय 2.विशेषताएँ 3.प्रकार
2.कार्पस निर्माण प्रक्रिया
3.कार्पस हेतु प्रयुक्त डाटा प्रकार (प्रमुख कार्पसों की सामग्री के आधार पर)
4.कार्पस संग्रह एवं इनकोडिंग
कार्पस टैगिंग एवं एनोटेशन
कार्पस : परिचय

vकार्पस
vकई विषयों, जैसे- भाषाविज्ञान अर्थशास्त्र, चिकित्साविज्ञान और शरीर रचना शास्त्र (anatomy) में प्रयुक्त शब्द।
vभाषाविज्ञान : परिभाषा
v“कार्पस विभिन्न प्रकार के व्याकरणिक वाक्यों से युक्त, भाषा व्यवहार के अधिकाधिक क्षेत्रों से संकलित पाठों का विशाल संग्रह है जो लिखित या वाचिक (written or spoken) रूप में अथवा दोनों रूपों में हो सकता है।”

¢“A Collection of Linguistic Data, either written texts or a transcription of recorded speech, which can be used as a starting-point of linguistic description or as a means of verifying hypotheses about a Language.”
¢David Crystal, A Dictionary of Linguistics and Phonetics
कार्पस : विशेषताएँ


¢प्रतिनिधित्व (Representativeness)
¢आकार (Size)
¢डाटा वैविध्य (Data Variety)
¢निदर्शन-आधारित(Sample-based)
¢मशीन-पठनीय रूप (Machine-readable form)
¢मानक संदर्भ (Standard reference)
1.प्रतिनिधित्व (Representativeness)
¢भाषाई रूपाकार (language format) का प्रतिनिधि।

¢भाषा के अधिकाधिक व्यावहारिक रूपों का प्रतिनिधित्व।
2.आकार (Size)

¢विशाल।
¢सीमित/असीमित।
¢सीमित : शब्दों, वाक्यों, पाठों आदि की संख्या।
¢असीमित : ऐसे कार्पस निर्माण की भी योजनाएँ, जैसे- वार्मिंघम विश्वविद्यालय के कोव्यूल्ड (COBUILD) कार्पस में शब्द सीमा निर्धारित नहीं। निदर्शनों को निरंतर जोड़ने की व्यवस्था।
¢


No comments:

Post a Comment