विवरण
कार्पस : परिचय
1.कार्पस-1. परिचय 2.विशेषताएँ
3.प्रकार
2.कार्पस
निर्माण प्रक्रिया
3.कार्पस
हेतु प्रयुक्त डाटा प्रकार (प्रमुख कार्पसों की सामग्री के आधार पर)
4.कार्पस
संग्रह एवं इनकोडिंग
कार्पस
टैगिंग एवं एनोटेशनकार्पस : परिचय
v‘कार्पस’
vकई विषयों, जैसे- भाषाविज्ञान अर्थशास्त्र,
चिकित्साविज्ञान और शरीर रचना शास्त्र (anatomy) में
प्रयुक्त शब्द।
vभाषाविज्ञान : परिभाषा
v“कार्पस विभिन्न प्रकार
के व्याकरणिक वाक्यों से युक्त, भाषा व्यवहार के अधिकाधिक क्षेत्रों से संकलित
पाठों का विशाल संग्रह है जो लिखित या वाचिक (written or spoken) रूप में
अथवा दोनों रूपों में हो सकता है।”
¢“A Collection of
Linguistic Data, either written texts or a transcription of recorded speech,
which can be used as a starting-point of linguistic description or as a means
of verifying hypotheses about a Language.”
¢David Crystal, A Dictionary of
Linguistics and Phonetics
कार्पस : विशेषताएँ
¢प्रतिनिधित्व
(Representativeness)
¢आकार (Size)
¢डाटा वैविध्य (Data
Variety)
¢निदर्शन-आधारित(Sample-based)
¢मशीन-पठनीय रूप
(Machine-readable form)
¢मानक संदर्भ
(Standard reference)
1.प्रतिनिधित्व (Representativeness)
¢भाषाई रूपाकार (language
format) का प्रतिनिधि।
¢भाषा के अधिकाधिक
व्यावहारिक रूपों का प्रतिनिधित्व।
2.आकार (Size)
¢विशाल।
¢सीमित/असीमित।
¢सीमित : शब्दों, वाक्यों, पाठों आदि की संख्या।
¢असीमित
: ऐसे कार्पस निर्माण की भी योजनाएँ, जैसे- वार्मिंघम विश्वविद्यालय
के कोव्यूल्ड (COBUILD) कार्पस में शब्द सीमा
निर्धारित नहीं। निदर्शनों को निरंतर जोड़ने की व्यवस्था।
¢
No comments:
Post a Comment