Total Pageviews

Tuesday, March 22, 2022

LTRC, IIIT-Hyderabad द्वारा विकसित कार्पोरा और टूल्स

 LTRC, IIIT-Hyderabad द्वारा विकसित कार्पोरा और टूल्स

LTRC, IIIT-Hyderabad द्वारा कार्पस के आधार पर विकसित Machine Translation तथा Natural Language Processing संबधी प्रणालियों को इस लिंक पर देखा जा सकता है-

 https://ltrc.iiit.ac.in/download.php

यहाँ विकसित Multi domain corpus for sentimental analysis को इस लिंक पर जाकर देख सकते हैं-

https://ltrc.iiit.ac.in/showfile.php?filename=downloads/sentiraama/

इस पर डेटा संबंधी निम्नलिखित विवरण दिया गया है-

Corpus Statistics :

Dataset

Documents

Sentences

Words

Song Lyrics

339

13997

81798

Movie Reviews

267

25278

164307

Product Reviews

200

4357

37494

Book Reviews

200

3340

15031

Total Corpus

1006

46972

298630

इसी प्रकार KCIS, DeiTY, Govt. of India की फंडिंग से विकसित कुछ कार्पोरा और उपकरणों संबंधी विवरण निम्नलिखित है-

Corpus Statistics :

Domain (More information - Language)

No. of Sentences

No. of Tokens

Word frequency list

Health (Disease - Hindi)

1.5K

37K

File

Tourism ( Hindi )

3K

50K

File

Bengali

12.5K

155K

File

Kannada

13.1K

152K

File

Malayalam

14.4K

168K

File

Marathi

15.1K

217K

File

Coreference Anaphora Annotated Data (Hindi)

3.6K

78K

-

Coreference Annotated Data (Hindi)

3.5K

77.6K

-

 

 

No comments:

Post a Comment