LTRC, IIIT-Hyderabad द्वारा विकसित कार्पोरा और टूल्स
LTRC, IIIT-Hyderabad द्वारा कार्पस के आधार पर विकसित Machine Translation तथा Natural Language Processing संबधी प्रणालियों को
इस लिंक पर देखा जा सकता है- 
 https://ltrc.iiit.ac.in/download.php 
यहाँ विकसित Multi
domain corpus for sentimental analysis को इस लिंक पर जाकर देख सकते
हैं- 
https://ltrc.iiit.ac.in/showfile.php?filename=downloads/sentiraama/ 
इस पर डेटा संबंधी निम्नलिखित विवरण दिया गया
है- 
Corpus Statistics :
| Dataset | Documents | Sentences | Words | 
| Song Lyrics | 339 | 13997 | 81798 | 
| Movie Reviews | 267 | 25278 | 164307 | 
| Product Reviews | 200 | 4357 | 37494 | 
| Book Reviews | 200 | 3340 | 15031 | 
| Total Corpus | 1006 | 46972 | 298630 | 
इसी प्रकार KCIS, DeiTY,
Govt. of India की फंडिंग से विकसित कुछ कार्पोरा और उपकरणों संबंधी
विवरण निम्नलिखित है- 
Corpus Statistics :
| Domain (More information - Language) | No. of Sentences | No. of Tokens | Word frequency list | 
| 1.5K | 37K | ||
| 3K | 50K | ||
| 12.5K | 155K | ||
| 13.1K | 152K | ||
| 14.4K | 168K | ||
| 15.1K | 217K | ||
| 3.6K | 78K | ||
| 3.5K | 77.6K | 
 
 
 
No comments:
Post a Comment