LTRC, IIIT-Hyderabad द्वारा विकसित कार्पोरा और टूल्स
LTRC, IIIT-Hyderabad द्वारा कार्पस के आधार पर विकसित Machine Translation तथा Natural Language Processing संबधी प्रणालियों को
इस लिंक पर देखा जा सकता है-
https://ltrc.iiit.ac.in/download.php
यहाँ विकसित Multi
domain corpus for sentimental analysis को इस लिंक पर जाकर देख सकते
हैं-
https://ltrc.iiit.ac.in/showfile.php?filename=downloads/sentiraama/
इस पर डेटा संबंधी निम्नलिखित विवरण दिया गया
है-
Corpus Statistics :
Dataset |
Documents |
Sentences |
Words |
Song Lyrics |
339 |
13997 |
81798 |
Movie Reviews |
267 |
25278 |
164307 |
Product Reviews |
200 |
4357 |
37494 |
Book Reviews |
200 |
3340 |
15031 |
Total Corpus |
1006 |
46972 |
298630 |
इसी प्रकार KCIS, DeiTY,
Govt. of India की फंडिंग से विकसित कुछ कार्पोरा और उपकरणों संबंधी
विवरण निम्नलिखित है-
Corpus Statistics :
Domain (More information - Language) |
No. of Sentences |
No. of Tokens |
Word frequency list |
1.5K |
37K |
||
3K |
50K |
||
12.5K |
155K |
||
13.1K |
152K |
||
14.4K |
168K |
||
15.1K |
217K |
||
3.6K |
78K |
||
3.5K |
77.6K |
No comments:
Post a Comment