Total Pageviews

Sunday, October 27, 2019

The Collins Corpus

विस्तार से पढ़ने के लिए इस लिंक पर जाएँ-

The Collins Corpus


What's in the Collins Corpus?

The Collins Corpus is an analytical database of English with over 4.5 billion words. It contains written material from websites, newspapers, magazines and books published around the world, and spoken material from radio, TV and everyday conversations. New data is fed into the Corpus every month, to help the Collins dictionary editors identify new words and meanings from the moment they are first used.

What does the Corpus tell us?

All COBUILD dictionaries are based on the information we find in the Collins Corpus. The full Corpus contains 4.5 billion words. The Bank of English™ is a subset of 650 million words from a carefully chosen selection of sources, to give a balanced and accurate reflection of English as it is used today. Our lexicographers use the Bank of English™ every day, and they use the full Collins Corpus to check more widely for extra information.
Because the Collins Corpus is so large, we can look at lots of examples of how people really use the words. The data tells us how words are used, what they mean, which words are used together, and how often words are used. This information on frequency helps us decide which words to include in the COBUILD dictionaries.

How is the Corpus used?

When a dictionary editor wants to add a new word to COBUILD, they search the Corpus for every example of the word. The word appears on the computer screen in a long list of sentences and the editors can arrange the lines in different ways depending on what they want to look at. They can then analyze meaning and usage, frequency, and collocation of the word in question.
In addition, all of the examples in COBUILD dictionaries are examples of real English, taken from the Corpus. The Collins Corpus lies at the heart of our publishing for learners of English and you can be confident that COBUILD will show you what you need to know to be able to communicate easily and accurately in English.

COBUILD Collocations

COBUILD Collocations are examples of words that are often used together.

Thursday, October 24, 2019

Introduction to machine learning

Monday, October 21, 2019

तार्किक रचना निर्माण


डॉ. धनजी प्रसाद-
हिंदी संबंधवाची रचनाओं का आर्थी विश्लेषण
शोध प्रबंंध से...

प्रस्तुत शोधकार्य में प्रस्तावित आर्थी संबंध एवं उनके उपवर्ग निम्नलिखित हैं :
(1) स्वामित्व संबंध
    का    => स्वामी
(अ)                                               
            +मानव                             +जा.सं.
             +व्य./जा.सं.                       +वस्तु (ar)
                                                                 (ar = artifact)
उदाहरण :
Ø  राम का पैसा/बगीचा/घर/खेत
Ø  राम की कलम/कुर्सी/फसल
Ø  राम के कपड़े/मोबाइल/रुपये
Ø  लड़के की कमीज/कॉपी/छड़ी
Ø  लड़की की साइकिल/कुर्सी
नोट : जब के स्थान पर सांदर्भिक स्थिति सूचक शब्दों का प्रयोग होता है तब घटक शब्दों का क्रम पलट देने पर भी स्वामित्व संबंध निर्मित होता है किंतु स्वामित्व का क्रम बदलकर स्वामी हो जाता है।
उदाहरण :
Ø  मालिक का घर {स्वामित्व संबंध}     [ स्वामी ]
Ø  घर का मालिक {स्वामित्व संबंध}     [ स्वामी ]
Ø  दुकानदार की दुकान {स्वामित्व संबंध} [ स्वामी ]
Ø  दुकान का दुकानदार {स्वामित्व संबंध} [ स्वामी ]
(आ)                                                                 
                   +व्य./जा.सं.                       + जा.सं.
                   - मानव                             + वस्तु
      उदाहरण :
Ø  सरकार का पैसा
Ø  भारत का पैसा, भारत सरकार का पैसा
नोट : इस प्रकार की रचनाओं में संदर्भ आधारित संदिग्धार्थकता प्राप्त होती है, जैसे : यदि उत्तर प्रदेश का पैसा कहा जाए तो इसके दो अर्थ संभव हैंकेंद्र सरकार द्वारा उत्तर प्रदेश को दिया जाने वाला पैसा (=उद्देश्य/लाभग्राही) अथवा उत्तर प्रदेश के पास उपलब्ध/उत्तर प्रदेश द्वारा दिया गया पैसा (= स्वामित्व)
(इ)                                                                                                     
                +व्य./जा.सं.                          व्य./जा.सं.
  उदाहरण :
Ø  रामू का नौकर
Ø  कुलपति का पी..
Ø  राजा का मंत्री
इन उदाहरणों में एक महत्वपूर्ण बात यह है कि इनमें स्वामित्वबोध क्रमश: घटता जाता है।


      इन नियमों को तार्किक रचना में विभिन्न प्रतीकों के माध्यम से इस प्रकार से प्रस्तुत कर सकते हैं-


R.1.
If
                  X = ‘h10’ ‘h10(P)’ ‘ir4’               // ‘मानव मानव (P) पदनाम
&&            Y=  ‘a3’                                               // ‘वस्तु2’
But
                  Y != ‘m4’                                            //‘परिवर्तित स्थान
Then
                  “X स्वामी Y”
R.2.
If
                  X = ‘cn11’ ‘in3’                               //‘देश संस्थान/संगठन
&&            Y= ‘a3’                                                //‘वस्तु2’
But
                  Y != ‘m4’                                            //‘परिवर्तित स्थान
Then
                  “X स्वामी Y”
R.3.
If
                  X = ‘h10’ ‘h10(P)’ ‘ir4’               // ‘मानव मानव (P) पदनाम
&&            Y= ‘ir4’                                               //‘पदनाम
Then
                  “X स्वामी Y”