शाब्दिक संग्रह : क्विक, क्वैक (KWIC, KWAC)
KWIC =
Key-Word-In-Context
किसी शब्द को
वास्तविक प्रयोगों में उसके सभी संदर्भ शब्दों के साथ देखना ‘कीवर्ड
इन कॉन्टेक्स्ट’ (KWIC) कहलाता है। कार्पस में कोई भी शब्द भिन्न-भिन्न प्रकार के संदर्भ
में आता है। अर्थात अलग-अलग वाक्यों में उसका प्रयोग होता है,
जहाँ पर वह दूसरे शब्दों के साथ जुड़ा रहता है। अतः ‘कौन-से
तथा कितने प्रकार के अलग-अलग वाक्यों में कोई शब्द घटित हो रहा है?’
का विश्लेषण हम KWIC के माध्यम से करते हैं। यह CONCORDANCE
खोज के अंतर्गत किया जाने वाला एक कार्य है। इस कारण KWIC CONCORDANCE PROGRAM बनाए जाते हैं।
KWAC = Keyword
alongside Context
इसे “keyword and context” तथा “key-word
augmented-in-context” भी कहते हैं। इसमें
कीवर्ड के साथ मुख्य रूप से प्रयुक्त होने वाले कुछ अन्य कीवर्ड को जोड़कर भी खोज
की जाती है। उदाहरण के लिए ‘Natural
Language’ की खोज करने पर ‘Natural Language Processing’ की भी खोज कर लेना KWAC
के अंतर्गत आएगा|
KWOC = Keyword out of Context
जब किसी की वर्ड
के बारे में खोजते हुए उसका किसी वाक्य में प्रयोग देखने के बजाय उन पाठों को देखा
जाता है, जहाँ उसका प्रयोग हो सकता है,
तो ऐसी खोज को KWOC कहते हैं। इसके अंतर्गत पुस्तकों के शीर्षक,
उपशीर्षक जैसी खोजें आती हैं। उदाहरण के लिए ‘भाषा प्रौद्योगिकी’
शब्द की खोज ‘भाषा प्रौद्योगिकी’ ‘प्राकृतिक भाषा संसाधन’ नामक
या इनसे संबंधित पुस्तकों में की जा सकती है। इनमें ‘भाषा
प्रौद्योगिकी’ शब्द किस वाक्य में आया है?
यह नहीं देखा जाता है, बल्कि उससे संबंधित पाठ को देखा जाता है।
अतः यह खोज KWOC खोज कहलाएगी।
(चित्र संदर्भ- https://commons.wikimedia.org/wiki/File:KWOC.png)
किसी कार्पस में किसी
शब्द के लिए ये तीनों स्थितियाँ देखी जा सकती हैं।
और
पढ़ें-
1.
KWIC CONCORDANCE PROGRAM, “The KWIC Concordance
is a corpus analytical tool for making word frequency lists, concordances, and
collocation tables from electronic text files. This program offers the
capability of handling markup schemes, such as COCOA, SGML, the Helsinki
corpus, the Penn-Helsinki Parsed Corpus of Middle English (Phase 1) (Phase 2)
etc.”
2.
KWAC stands for “keyword
alongside context” and KWOC stands for “keyword out of context”. They
are modifications of KWIC. As defined by Birger Hjørland of the Lifeboat for Knowledge Organization of the
University of Copenhagen, just like KWIC they are “simple, mechanical term
extraction indexes for text (usually titles) which retain some of the context
(i.e. adjacent words).”
KWAC is also known as “keyword
and context” and “key-word augmented-in-context”. KWAC provides
additional keywords taken either from the abstract or from the original text of
the document and are inserted into the title to give further index entries, for
example:
indexes
in information retrieval. Standard
guidelines for
information
retrieval. Standard guidelines for indexes
in
retrieval
Standard guidelines for indexes in
information
3.
KWOC also
displays the access term on the left, but the word pairs are not preserved in
the alphanumeric sequence of keywords, for example:
information
guidelines for indexes in information retrieval
indexes in information retrieval. Standard
Standard guidelines for indexes in information retrieval.
(संदर्भ- http://inmyownterms.com/kwic-kwac-kwoc-not-knock-knock-joke/)
No comments:
Post a Comment