Total Pageviews

Wednesday, January 29, 2020

कृत्रिम बुद्धि (AI)


कृत्रिम बुद्धि (AI)
मशीनों में परिस्थिति के आधार पर निर्णय लेकर कार्य करने की क्षमता का होना कृत्रिम बुद्धि है। मशीनों में प्रयुक्त बुद्धि को कृत्रिम बुद्धि इसलिए कहते हैं कि उनके अंदर आई हुई बुद्धि स्वाभाविक रूप से विकसित बुद्धि नहीं होती, बल्कि प्रोग्रामर या विकासकर्ता द्वारा विभिन्न प्रकार के एल्गोरिद्मों के माध्यम से डाली गई बुद्धि होती है।
एक ज्ञानक्षेत्र के रूप में कृत्रिम बुद्धि के अंतर्गत बुद्धिमान मशीनों के निर्माण की संपूर्ण प्रक्रिया आ जाती है। मशीन चाहे किसी भी प्रकार से किसी परिस्थिति के आधार पर निर्णय लेने में या कार्य करने में स्वयं से सक्षम हो जाए, तो उसे उस कार्य के लिए बुद्धिमान मशीन माना जाएगा। यह बात किसी भी प्रकार की मशीन पर लागू होती है। उदाहरण के लिए कुछ बुद्धिमान मशीनों को इस प्रकार समझ सकते हैं-
(1)   वर्तमान में कुछ ऐसे बुद्धिमान कीबोर्ड का विकास किया गया है, जो टाइपिंग के समय टाइप करने वाले की पहचान कर लेगा।
(2)   स्वचलित ड्रोन, स्वयं से शत्रु के स्थान या उसकी संपत्ति की भौगिलिक स्थिति का पता लगाकर उसे नष्ट कर देते हैं।
(3)   आज स्वचलित कारों पर बहुत तेजी से काम किया जा रहा है, और इसमें पर्याप्त सफलता भी मिली है।
(4)   कृत्रिम बुद्धि का सामान्य व्यक्ति के लिए सबसे अधिक प्रयोग विभिन्न प्रकार के खेलों के क्षेत्र में हुआ है। शतरंज के लिए विकसित सॉफ्टवेयर ने तो विश्व चैंपियन तक को हरा दिया है।
(5)   रोबोटिक्स कृत्रिम बुद्धि का सबसे विस्तृत अनुप्रयोग क्षेत्र है। इसके अंतर्गत अनेक चैटबॉट्स, ऑटोबॉट्क्स और रोबोट्स का विकास किया जा रहा है, जो अलग-अलग प्रकार के कार्यों को स्वयं की निर्णयशक्ति के आधार पर करने में सक्षम होते हैं।

और पढ़ें-



Monday, January 27, 2020

पदबंध चिह्नन (Phrase Marking) और चंकिंग (Chunking)


पदबंध चिह्नन (Phrase Marking) और चंकिंग (Chunking)
पदबंध चिह्नन (Phrase Marking) या चंकिंग (Chunking) पद-विच्छेदन स्तर की ही प्रक्रिया है। वाक्य में एक प्रकार्य को संपन्न करने वाले पद-समूहों को एक साथ चिह्नित करने की प्रक्रिया चंकिंग है। उस पद-समूह को चंक कहते हैं। यह कंप्यूटरविज्ञान से आई हुई अवधारणा है। कंप्यूटर की दृष्टि से परिभाषित करते हुए कहा गया है कि ‘चंक वह सबसे छोटी इकाई हैजिसे संसाधित किया जा सकता है। सतही पद-विच्छेदन (Shallow Parsing) में वाक्य में एक-एक चंक को ही अलग-अलग किया जाता है।
वाक्य में पदबंध ही चंक का कार्य करते हैं। इसलिए कहा जा सकता है कि चंकिंग के अंतर्गत पदबंध चिह्नन का कार्य किया जाता है। इसके लिए पदबंध स्तर के टैगों (Tags) की आवश्यकता पड़ती है, चंक टैग (chunk tags) कहते हैं, जैसे-
संज्ञा पदबंध               = NP
क्रिया पदबंध             = VP
परसर्गीय पदबंध         = PP
विशेषण पदबंध          = JJP
आदि।
पदबंध चिह्नन (Phrase Marking) या चंकिंग (Chunking) का कार्य टैगिंग के बाद किया जाता है, क्योंकि जब वाक्य के सभी शब्द टैग कर लिए जाते हैं तो उनके संयोजन के आधार पर ही पदबंध या चंक निर्धारित किए जाते हैं। उदाहरण के लिए निम्नलिखित हिंदी वाक्य को देखें-
इनपुट वाक्य-
बड़ा लड़का मीठे आम खाता है।
टैगिंग -
बड़ा<JJ> लड़का<NN> मीठे<JJ> आम<NN> खाता<VM> है<AUX> <PM>
पदबंध चिह्नन (Phrase Marking) या चंकिंग (Chunking)-
(NP बड़ा<JJ> लड़का<NN>)
(NP मीठे<JJ> आम<NN>)
(VP खाता<VM> है<AUX>)
(. <PM>)
पाइथन प्रोग्रामिंग भाषा में एन.एल.टी.के. (NLTK) का प्रयोग करते हुए एक वाक्य के पार्स्ड ट्री में बनाए गए चंक इस प्रकार हैं-

पाठ सारांशीकरण (Text Summarization)


पाठ सारांशीकरण  (Text Summarization) : 
पाठ सारांशीकरण  (Text Summarization) वह प्रक्रिया है, जिसके अंतर्गत किसी बड़े पाठ के मुख्य अंशों का संकलन करते हुए उसका सारांश प्रस्तुत किया जाता है। जब यह कार्य मशीन द्वारा किया जाता है, तो इसे स्वचलित पाठ सारांशीकरण  (Automatic Text Summarization) या स्वचलित सारांशीकरण  (Automatic Summarization) कहते हैं। यह प्राकृतिक भाषा संसाधन (NLP) का एक प्रमुख अनुप्रयोग क्षेत्र है। वर्तमान में इस दिशा में अनेक प्रकार के प्रयत्न किए जा रहे हैं। इसके अंतर्गत ऐसी संगणक प्रणालियों का विकास किया जाता है जो किसी पाठ की मुख्य और महत्वपूर्ण बातों का संज्ञान करते हुए उसका सारांश निर्मित कर सके।
तकनीकी क्षेत्र में स्वचलित पाठ सारांशीकरण  (Automatic Text Summarization) की आवश्यकता
वर्तमान समय में डिजिटल संसार में मानव अध्ययन-अध्यापन अथवा व्यवहार के लगभग सभी क्षेत्रों में असीमित मात्रा में डाटा उपलब्ध है। जब हम किसी खोज इंजन के माध्यम से किसी विषय पर कोई सामग्री खोजते हैं, तो उसके उत्तर स्वरूप करोड़ों की संख्या में परिणाम प्राप्त होते हैं, जो लिंकों के माध्यम से देखने के लिए उपलब्ध रहते हैं। अब यदि प्रत्येक लिंक को क्लिक करके उसमें दी हुई सामग्री को पढ़कर देखा जाए कि यह प्रयोक्ता के काम की है या नहीं तो इसमें समय और श्रम का अत्यधिक व्यय होगा।
इससे बचने के लिए ही प्राकृतिक भाषा संसाधन (NLP) के क्षेत्र में कार्य कर रहे शोधकर्ताओं द्वारा ऐसी प्रणालियों के विकास पर कार्य किया जा रहा है, जो संबंधित पाठ का सारांश रूप में मुख्य अंश प्रयोक्ता के सामने रख दे। उसे पढ़कर ही प्रयोक्ता समझ सकता है कि यह पाठ मेरे लिए उपयोगी होगा या नहीं। इसे गूगल खोज के एक उदाहरण से देख सकते हैं-



इसमें हम देख सकते हैं कि ‘Language Technology’ के बारे में खोज करने पर गूगल खोज इंजन द्वारा इसके 5 अरब दस करोड़ परिणाम दिए गए हैं। उनमें से पहले सबसे अधिक पढ़े गए का सारांश थोड़े विस्तार से और शेष पाठों का दो-दो पंक्तियों में परिचय या सारांश प्रस्तुत किया गया है।
इससे अधिक सारांश भी प्रस्तुत किया जा सकता है, किंतु उसके लिए सक्षम पाठ सारांशीकरण प्रणाली की आवश्यकता होगी। 
पाठ सारांशीकरण प्रणाली की कार्यविधि-

सर्वप्रथम पाठ सारांशीकरण प्रणाली मूल पाठ से मुख्य शब्दों (keywords) का चयन करती है और उन्हें आपस में जोड़कर नए वाक्य का निर्माण करती है। इस प्रक्रिया में अनावश्यक विस्तार के लिए आए हुए शब्द छोड़ दिए जाते हैं। एक पाठ सारांशीकरण प्रणाली की कार्यविधि को https://blog.floydhub.com/gentle-introduction-to-text-summarization-in-machine-learning/ पर एनिमेटेड चित्र के माध्यम से इस प्रकार से दिखाया गया है-

स्वचलित पाठ सारांशीकरण के अभिगम  (Approaches to Automatic Text Summarization)
स्वचलित पाठ सारांशीकरण  (Automatic Text Summarization) प्रणालियों के विकास के लिए मुख्यतः तीन अभिगमों का प्रयोग किया जाता है-
1.1     निष्कर्षण-आधारित सारांशीकरण (Extraction-based summarization)
इसमें मूलतः कथ्य को मूल पाठ से निकाल लिया जाता है और उसके आधार पर सारांश प्रस्तुत किया जाता है। सारांश निर्मित करने के लिए कथ्य में किसी प्रकार का परिवर्तन नहीं किया जाता।  
1.2     अमूर्तन-आधारित सारांशीकरण (Abstraction-based summarization)
इसमें मूल पाठ से कथ्य को निकालकर उसका संक्षेपीकरण करते हुए इस प्रकार से प्रस्तुत किया जाता है, कि वह पाठ के मूल कथन के यथासंभव निकट हो।
1.3 साधित    सारांशीकरण (Aided summarization)
इसमें मशीन के साथ-साथ मानव का भी सहयोग लिया जाता है।

7 full-time, contractual staffs Vacancy feb 2020

Dear all,

The “Communal and Misogynistic Aggression in Hindi-English-Bangla [ComMA] Project" is looking to employ 7 full-time, contractual staffs on Post-DoctoralComputational Linguist and RA positions for a maximum period of 12 months. The details of the positions, qualifications etc are given in the attached file.

Interested and eligible candidates are invited to apply for one or more of these positions by going to the following form -

Deadline for applicationFebruary 7, 2020; 23:59 IST

Job LocationK.M. Institute of Hindi and Linguistics, Dr. Bhimrao Ambedkar University, Agra;  Indian Institute of Technology - Kharagpur and Panlingua Language Processing LLP, New Delhi

For any queries, contact: comma.kmi@gmail.com

Thursday, January 23, 2020

भाषा के रूप


 भाषा के रूप
भाषिक इकाइयों और नियमों की व्यवस्था के रूप में भाषा एक अमूर्त संकल्पना है। हम इसका अध्ययन स्वनिम से लेकर प्रोक्ति तक की इकाइयों के गठन एवं संरचनापरक उपव्यवस्थाओं के रूप में करते हैं। भाषा अमूर्त संकल्पना के रूप में हमारे मस्तिष्क में रहती है और उसके आधार पर हम अपने वास्तविक जीवन में व्यवहार करते हैं। वास्तविक जीवन में व्यवहार की दृष्टि से देखा जाए तो प्रत्येक व्यक्ति की मानसिक, सामाजिक, आर्थिक, शैक्षिक, व्यावसायिक आदि दृष्टियों से पृष्ठभूमि अलग-अलग होती है। इस कारण उनका भाषा व्यवहार भी किसी-न-किसी रूप में भिन्न होता है। अतः एक भाषा के स्वरूप में संरचनात्मक एकरूपता के साथ-साथ व्यावहारिक विभेद भी पाया जाता है। यह विभेद क्षेत्र, लिंग, शैक्षिक एवं आर्थिक वर्गीकरण आदि दृष्टियों से देखा जाता है। इसमें राजनीतिक निर्णय भी भूमिका निभाते हैं। क्षेत्र और सामाजिक-राजनीतिक स्थिति के आधार पर भाषा के निम्नलिखित व्यावहारिक रूप देखे जा सकते हैं-
भाषा, उपभाषा/बोली; उपबोली; व्यक्ति बोली
भाषा, बोली और व्यक्ति बोली को डॉ. श्याम सुंदर दास (2009) भाषाविज्ञान (पृ.48-49) के माध्यम से इस प्रकार से समझ सकते हैं-


संदर्भ-
दास, श्याम सुंदर (2009) भाषाविज्ञान. नई दिल्ली : प्रकाशन संस्थान।

Wednesday, January 22, 2020

मानव भाषा और मशीनी भाषा (Human Language and Machine Language)


मानव भाषा और मशीनी भाषा (Human Language and Machine Language)

कंप्यूटर का अविष्कार मानव सभ्यता की कुछ प्रमुख क्रांतिकारी घटनाओं में से एक है। इसके कारण मानव सभ्यता ने डिजिटल युग (Digital Era) में प्रवेश किया है। कंप्यूटर की गणना करने और तर्क के आधार पर कार्य करने की क्षमता असीम है। इसकी स्मृति (memory) और गति (speed) को बढ़ाने की दिशा में निरंतर कार्य किया जा रहा है। आज डिजिटल युक्तियाँ- मोबाइल, स्मार्टफोन, टैबलेट, कंप्यूटर, लैपटॉप आदि हमारे जीवन का अभिन्न अंग बन चुकी हैं, किंतु ये युक्तियाँ जिस भाषा में कार्य करती हैं, वह हमारी भाषा से बिल्कुल अलग है। उसे मशीनी भाषा नाम दिया गया है, जबकि मनुष्य जिस भाषा का प्रयोग करता है उसे मानव भाषा कहते हैं। इन दोनों को संक्षेप में इस प्रकार से समझ सकते हैं-
मानव भाषा (Human Language)
मानव भाषा ध्वनि संकेतों की वह व्यवस्था है, जिसका प्रयोग मनुष्य विचार करने और विचारों का आपस में संप्रेषण करने में करता है। भाषावैज्ञानिकों द्वारा इसे परिभाषित करते हुए कहा गया है-
“भाषा यादृच्छिक ध्वनि-प्रतीकों की वह व्यवस्था है, जिसके माध्यम से मनुष्य विचार करता है तथा अपने भाषायी समाज में विचारों का आदान-प्रदान करता है।”
अतः मानव भाषा ध्वनि-प्रतीकों की व्यवस्था है। ध्वनि-प्रतीक उच्चार के लघुतम खंड होते हैं, जिनका अपना कोई अर्थ नहीं होता। भाषा विविध स्तरों पर इन निरर्थक ध्वनि-प्रतीकों को इस प्रकार से जोड़ती है, कि उनके माध्यम से अर्थ और विचार का संप्रेषण किया जाता है।
 संप्रेषण के लिए एक बार में कम-से-कम जिस ध्वनि-गुच्छ का प्रयोग किया जाता है, उसे वाक्यकहते हैं। ध्वनियों का समूहन 'वाक्य' के रूप में करने के लिए मानव मस्तिष्क को उनका संचयन और व्यवस्थापन कई क्रमशः बड़े स्तरों पर किया जाता है, जिन्हें भाषाविज्ञान में भाषा के स्तर कहा जाता है, ये निम्नलिखित हैं-
स्वनिम
रूपिम
शब्द/पद
पदबंध
उपवाक्य
 वाक्य
प्रोक्ति
इन सभी इकाइयों और उन्हें गठित करने वाले नियमों को संरचना की दृष्टि से चित्र रूप में इस प्रकार से देखा जा सकता है-
...
इस प्रकार स्पष्ट है कि मानव भाषा एक बहुस्तरीय व्यवस्था है, जिसमें ध्वनि-प्रतीक अलग-अलग स्तरों पर जुड़ते हैं और अपने से बड़ी इकाइयों का गठन करते हैं। इनकी प्रक्रिया अत्यंत जटिल होती है। उदाहरण के लिए शब्द और पदबंध की दृष्टि से देखा जाए तो कभी एक ही शब्द एक पदबंध का कार्य करता है तो कभी एक से अधिक शब्द मिलकर एक पदबंध का कार्य करते हैं, जैसे-
लड़का आम खाएगा।
बड़ा लड़का मीठे आम खाता है।
बहुत बड़ा लड़का सबसे मीठे आम खा रहा है।
इन तीनों वाक्यों में 03-03 पदबंध ही हैं, जबकि शब्द संख्या क्रमशः 03, 06, 09 है। इसी प्रकार की अनेक जटिलताएँ मानव भाषाओं में प्राप्त होती हैं। उनमें से कुछ जटिलताओं को भाषा प्रौद्योगिकी विदों द्वारा निम्नलिखित वर्गों में रखा गया है-
संदिग्धार्थकता
बहुअर्थकता
नामपद अभिज्ञान
प्रोक्ति संदर्भ
संवेदना विश्लेषण           आदि।

मशीनी भाषा (Machine Language)
कंप्यूटर या मशीन विद्युत के ऑन और ऑफ द्वारा संचालित होती है, जिसे हम अपनी सुविधा के लिए ‘1’ और ‘0’ से प्रदर्शित करते हैं और इनके संयोजनों (combinations) से निर्मित भाषा को द्विआधारी भाषा (बाइनरी भाषा) कहते हैं। मशीन केवल इसी भाषा में दिए गए निर्देशों को समझने और संसाधित करने में सक्षम होती है। इस भाषा में आदेश देने के लिए संयोजित कोड इस प्रकार दिखाई देते हैं- 00100101, 10101110 आदि। शून्य और एक के ये दो संयोजन हैं, जिनके माध्यम से मशीन को दो बातें बताई जा सकती हैं। एक पूरे कंप्यूटर को संचालित करने के लिए ऐसे हजारों-लाखों कोड दिए जाते हैं। इन कोडों के माध्यम से निर्मित होने वाली भाषा ही मशीनी भाषा है। एक मशीनी भाषा में लिखा हुआ पाठ इस प्रकार दिखाई देगा-

मानव भाषाओं के सापेक्ष मशीनी भाषा को देखा जाए तो इनमें एक स्तरीय व्यवस्था होती है। अर्थात मशीन में दिए जाने वाले कोड शून्य और एक के संयोजन से एक प्रतीक का निर्माण करते हैं। उन कोडों को ही विभिन्न लाजिकल गेटों से गुजारा जाता है और निर्देश दिए जाते हैं।
मशीनी भाषा में मानव भाषाओं की तरह जटिलताएँ नहीं पाई जातींं।
मानव भाषा को प्राकृतिक भाषा (Natural Language- NL) और मशीनी भाषा को कृत्रिम भाषा (Artificila Language- AL) कहते हैं।

Tuesday, January 21, 2020

भाषा क्षमता एवं भाषा व्यवहार (Language Competence and Language Performance)


भाषा क्षमता एवं भाषा व्यवहार (Language Competence and Language Performance)
प्रजनक व्याकरण के जनक नोऑम चॉम्स्की द्वारा किसी व्यक्ति के भाषा ज्ञान और उसके द्वारा किए जाने वाले भाषा व्यवहार के संदर्भ में दो अवधारणाएँ दी गई हैं- भाषा क्षमता एवं भाषा व्यवहार। इन्हें संक्षेप में इस प्रकार समझ सकते हैं-
भाषा क्षमता (Language Competence)
भाषा क्षमता किसी भाषा प्रयोक्ता की वह मानसिक क्षमता है, जिसके आधार पर वह वाक्यों को सुनता, समझता एवं अभिव्यक्त करता है या कर सकता है। भाषा व्यवहार के लिए संबंधित भाषा का कोश और नियम भाषाभाषी के मस्तिष्क में अमूर्त रूप से स्थापित रहते हैं। नियमों की इस व्यवस्था में स्वनिमिक, रूपिमिक, वाक्यीय एवं आर्थी सभी प्रकार की उपव्यवस्थाएँ सम्मिलित होती हैं। इन सभी का संपूर्ण ज्ञान ही व्यक्ति की भाषा क्षमता है।
भाषा क्षमता के अंतर्गत व्यक्ति की ऐसे वाक्य बनाने या समझने की वह कुशलता भी आ जाती है, जिसका उसने कभी प्रयोग न किया हो।
अपनी भाषा क्षमता के आधार पर भाषाभाषी यह बताने के सक्षम होता है कि उसके सम्मुख प्रस्तुत कोई वाक्य उसकी भाषा का है नहीं। उदाहरण के लिए हिंदी के संदर्भ में निम्नलिखित दो वाक्यों को देखें-
·      मैं भारतीय हूँ।
·      वतशिवा इंदोजिन देसु।
ये दोनों वाक्य देवनागरी में लिखे गए हैं, किंतु कोई भी हिंदी भाषी इन्हें देखकर बता देगा कि दूसरा वाक्य हिंदी भाषा का नहीं है।
इसी प्रकार भाषा के क्षमता के अंतर्गत संदिग्धार्थक वाक्यों का अर्थ समझना, व्याकरणिक या आर्थी दृष्टि से अशुद्ध वाक्यों को पहचान लेना आदि भी आते हैं। उदाहरण के लिए हिंदी के संदर्भ में निम्नलिखित दो वाक्यों को देखें-
·      मैं भारतीय हूँ।
·      मैं भारतीय है।
कोई भी हिंदी भाषी बता देगा कि दूसरा वाक्य अशुद्ध (व्याकरण की दृष्टि से) है।
भाषा व्यवहार (Language Performance)
किसी व्यक्ति द्वारा अपने जीवन में किया जाने वाला भाषा का वास्तविक व्यवहार भाषा व्यवहार है। इसमें व्यक्ति द्वारा किया जाने वाला शब्द चयन, वाक्य रचना प्रयोग वाचन शैली आदि सभी आ जाते हैं। उदाहरण के लिए एक हिंदी भाषी निम्नलिखित तीन में से किसी भी वाक्य का प्रयोग पुस्तक माँगने के लिए कर सकता है-
·      मुझे पुस्तक दीजिए।
·      मुझे किताब दीजिए।
·      मुझे बुक दीजिए।
इनमें एक ही वस्तु के लिए तीन शब्दों का ज्ञान होना व्यक्ति की भाषा क्षमता है, किंतु वह इनमें से किसी एक ही प्रकार के वाक्य या शब्द का प्रयोग करते हुए व्यवहार करता है। यह उसका भाषा व्यवहार है।
भाषा व्यवहार में व्यक्ति द्वारा किए जाने वाले विशेष प्रयोग, त्रुटियाँ, अभिरुचि और संदर्भ आदि सभी भाषायी और मनोवैज्ञानिक तथ्य आ जाते हैं।

Monday, January 20, 2020

मशीनी अनुवाद : एक परिचय (Machine Translation- Introduction)


मशीनी अनुवाद
संगणकीय भाषाविज्ञान और भाषा प्रौद्योगिकी के अनुप्रयुक्त क्षेत्र के रूप में मशीनी अनुवादसर्वाधिक प्रसिद्ध क्षेत्र है। यह ऐसी साफ्टवेयर प्रणालियों  का विकास से संबंधित है जिनके माध्यम से किसी एक प्राकृतिक भाषा के पाठ का अनुवाद दूसरी भाषा में स्वचलित रूप से किया जा सके। इन साफ्टवेयर प्रणालियों में भाषिक ज्ञान को  वाक्यात्मक नियमों और कोश (syntactic rules and lexicon) के अंतर्गत या विशाल संग्रह जैसे : कार्पस (corpus) आदि में रखा जाता है। मशीनी अनुवाद प्रणालियों के विकास हेतु मुख्यत: चार प्रकार के उपागम अपनाए गए हैं जो निम्नलिखित हैं :
(क)        नियम आधारित (Rule based)
(ख)        सांख्यिकीय (Statistical )
(ग)         उदाहरण आधारित (Example-based)
(घ)         संकर  (Hybrid)
गूगल मशीनी अनुवाद प्रणाली द्वारा अभी (जनवरी 2020) निम्नलिखित भाषाओं में मशीनी अनुवाद की सुविधा उपलब्ध है-

Afrikaans
Albanian
Amharic
Arabic
Armenian
Azerbaijani
Bangla
Basque
Belarusian
Bosnian
Bulgarian
Burmese
Catalan
Cebuano
Chinese (Simplified)
Chinese (Traditional)
Corsican
Croatian
Czech
Danish
Dutch
English
Esperanto
Estonian
Filipino
Finnish
French
Galician
Georgian
German
Greek
Gujarati
Haitian Creole
Hausa
Hawaiian
Hebrew
Hindi
Hmong
Hungarian
Icelandic
Igbo
Indonesian
Irish
Italian
Japanese
Javanese
Kannada
Kazakh
Khmer
Korean
Kurdish
Kyrgyz
Lao
Latin
Latvian
Lithuanian
Luxembourgish
Macedonian
Malagasy
Malay
Malayalam
Maltese
Maori
Marathi
Mongolian
Nepali
Norwegian
Nyanja
Pashto
Persian
Polish
Portuguese
Punjabi
Romanian
Russian
Samoan
Scottish Gaelic
Serbian
Shona
Sindhi
Sinhala
Slovak
Slovenian
Somali
Southern Sotho
Spanish
Sundanese
Swahili
Swedish
Tajik
Tamil
Telugu
Thai
Turkish
Ukrainian
Urdu
Uzbek
Vietnamese
Welsh
Western Frisian
Xhosa
Zulu