Total Pageviews

Sunday, December 2, 2018

कंप्यूटर पर हिंदी (यूनीकोड, कीबोर्ड लेआउट)

जगदीप सिंह दांगी
यूनीकोड क्या है ?
यूनीकोड अँग्रेज़ी के दो शब्दों, यूनीवर्सल (जागतिक) एवं कोड (कूट संख्या) से गठित एक नया शब्द है। अतः यूनीकोड का मतलब एक 'विशेष कूट संख्या' से है। यूनीकोड शब्द कंप्यूटर विज्ञान एवं प्रौद्योगिकी के क्षेत्र में प्रचलित है। इसे यूनीवर्सल कोड भी कहते हैं। कंप्यूटर कार्यक्रम के अंतर्गत यूनीकोड प्रत्येक वर्ण के लिए एक विशेष अंक प्रदान करता है, चाहे कोई भी प्लेट्फ़ॉर्म हो, चाहे कोई भी प्रोग्राम हो, चाहे कोई भी भाषा हो। यूनीकोड को व्यापक रूप से विश्वव्यापी सूचना आदान-प्रदान के मानक के रूप में स्वीकार किया जा चुका है।

यूनीकोड : तकनीकी परिचय
यह 16 बिट (2 बाइट) का कोड है। इसे ही यूनीकोड मानक माना गया है। यूनीकोड 16 - बिट एनकोडिंग का प्रयोग करता है; जोकि 65536 कोड-प्वाइंट (वर्ण) उपलब्ध कराता है। 16 बिट यूनीकोड में 65536 वर्णों (कैरेक्टरों) की उपलब्धता होने के कारण यह कोड विश्व की लगभग सभी लेखनीबद्ध भाषाओं के लिए सभी कैरेक्टरों को एनकोड करने की क्षमता रखता है। यूनीकोड मानक कैरेक्टर के बारे में सूचना और उनका उपयोग बताते हैं। कंप्यूटर उपयोक्ताओं के लिए जो बहुभाषी टेक्स्ट (पाठ) पर काम करते है, व्यापारियों, भाषाविदों, अनुसंधानकर्त्ताओं, वैज्ञानिकों, गणितज्ञों और तकनीशियनों के लिए यूनीकोड मानक बहुत लाभप्रद है। यूनीकोड मानक (स्टैंडर्ड) प्रत्येक कैरेक्टर को एक विलक्षण संख्यात्मक मान और नाम देता है। यह अंतरराष्ट्रीय मानक है। इससे हिंदी तथा अन्य भारतीय भाषाओं में कंप्यूटर पर अँग्रेज़ी की तरह ही सरलता से और शतप्रतिशत शुद्धता से कार्य किया जा सकता है।

आंतरिक तौर पर कंप्यूटर केवल द्विआधारी (बाइनरी) कूट अंकों (0 और 1) को ही समझता है। इसलिए हम जो भी वर्ण टाइप करते हैं वह अंततः 0 और 1 में ही परिवर्तित किए जाते हैं, तभी कंप्यूटर उन्हे समझ पाता है। किस भाषा के किस शब्द के लिए कौन-सा अंक प्रयुक्त होगा इसका निर्धारण करने के नियम विभिन्न कैरेक्टर-सैट (character set) या संकेत-लिपि प्रणाली (Encoding System) द्वारा निर्धारित होते हैं। ये प्रत्येक वर्ण के लिए एक अंक निर्धारित करके वर्ण संग्रहीत करते हैं। यूनीकोड का आविष्कार होने से पहले, ऐसे अंक देने के लिए सैकड़ों विभिन्न संकेत-लिपि प्रणालियाँ थीं। किसी एक संकेत लिपि में पर्याप्त वर्ण नहीं है। उदाहरण के लिए, यूरोपीय संघ को अकेले ही, अपनी सभी भाषाओं के वर्णों को संग्रहीत करने के लिए विभिन्न संकेत लिपियों की आवश्यकता होती है। यहाँ तक कि अँग्रेज़ी जैसी भाषा के लिए भी, सभी वर्णों, विरामचिह्नों और सामान्य प्रयोग के तकनीकी प्रतीकों हेतु एक ही संकेत लिपि पर्याप्त नहीं थी।
इन संकेत लिपियों में आपस में तालमेल भी नहीं है। इसीलिए, दो संकेत-लिपियाँ दो विभिन्न वर्णों के लिए, एक ही अंक प्रयोग कर सकती हैं, अथवा समान वर्ण के लिए विभिन्न अंकों का प्रयोग कर सकती हैं। किसी भी कंप्यूटर को विभिन्न संकेत लिपियों की आवश्यकता होती है; फिर भी जब दो विभिन्न संकेत लिपियों अथवा प्लेट्फॉर्मों के बीच डाटा भेजा जाता है तो उस डाटा के हमेशा खराब होने का जोखिम रहता है।

यूनीकोड के प्रयोग से क्या लाभ हैं ?
  1. एकरूपता। विभिन्न तरह के अस्की फ़ॉन्ट्स से छुटकारा मिलता है।
  2. हिंदी में ई-मेल, चैट आदि आसानी से कर सकते हैं।
  3. कार्यालयों के सभी कार्य कंप्यूटर पर हिंदी में आसानी से होते हैं।
  4. हिंदी में बनी फाइलों का आसानी से आदान-प्रदान कर सकते हैं।
  5. हिंदी की-वर्ड को गूगल या किसी अन्य सर्च इंजन में सर्च कर सकते हैं।

कंप्यूटर पर यूनीकोड में हिंदी देवनागरी के टंकण (टाइपिंग) हेतु कुछ विधियाँ
कंप्यूटर पर यूनीकोड आधारित हिंदी टाइपिंग (टंकण) करने के लिए सामान्यतः एक हिंदी उपकरण (टूल) की ज़रूरत होती है, जिसे आई॰एम॰इ॰ IME (Input Method Editor) टूल कहते हैं। यूनीकोड अस्की फ़ॉन्ट (कृतिदेव - 8 बिट कोड फ़ॉन्ट) की तरह व्यवहार नही करता जैसे कि हम एम॰एस॰ वर्ड में जाकर कृतिदेव फ़ॉन्ट चुन कर हिंदी टाइपिंग करने लगते हैं। यूनीकोड का प्रचलित फ़ॉन्ट मंगल (16 बिट कोड फ़ॉन्ट) है। एम॰एस॰ वर्ड में हम मंगल को कृतिदेव की तरह चुन कर हिंदी टाइपिंग नहीं कर सकते हैं। यूनीकोड आधारित हिंदी देवनागरी, आई॰एम॰इ॰ IME (Input Method Editor) टूल, आई॰एस॰एम॰ ISM (ISFOC Script Manager), प्रखर देवनागरी लिपिक, प्रलेख देवनागरी लिपिक आदि जैसे उपकरणों की सहायता से टंकित (टाइप) की जा सकती है।
वर्तमान में कंप्यूटर पर यूनीकोड आधारित हिंदी टंकण (टाइपिंग) हेतु मुख्यतः तीन विधियाँ बहु-प्रचलित हैं:-
1. रेमिंग्टन टंकण शैली
2. इन-स्क्रिप्ट टंकण शैली
3. फोनेटिक इंग्लिश आधारित टंकण शैली
इन तीनों प्रकार की टंकण शैली (विधि - Method) की अपनी-अपनी टंकण करने की एक विधा है और प्रत्येक के लिए अपना-अपना एक की-बोर्ड लेआउट (Keyboard Layout or Overlay) भी है।
यहाँ पर ध्यान देने योग्य बात यह है कि टंकण शैली (विधि - Method) और की-बोर्ड लेआउट (Keyboard Layout) दो भिन्न बातें हैं। तो आगे जाने से पहले प्रत्येक के लिए की-बोर्ड लेआउट की बात करते हैं।
यहाँ की-बोर्ड लेआउट से अभिप्राय यह है कि कुंजीपटल पर देवनागरी के विभिन्न वर्णों का एक निश्चित क्रम में कुंजीपटल की कुंजियों पर व्यवस्थित रूप से होना है। हिंदी टंकण के लिए निम्नलिखित तीन की-बोर्ड लेआउट बहु-प्रचलित हैं, जो इस प्रकार से हैं:-
1. टाइपर-राइटर लेआउट - इसे प्रायः रेमिंग्टन टाइप-राइटर के नाम से भी जाना जाता है। इसका लेआउट हिंदी टाइप-राइटर (टाइपिंग मशीन) पर आधारित है। यह काफ़ी पुराना और बहु-प्रचलित लेआउट है। यह लेआउट उन लोगों के लिए उपयोगी है जो कंप्यूटर पर आने से पूर्व ही इस लेआउट पर टाइपिंग सीखे हैं या पहले से ही इस पर टाइपिंग करने के आदी हैं।

रेमिंगटन की-बोर्ड लेआउट

सामान्य अवस्था
(1)
शिफ़्ट कुंजी दबा कर
(2)
रेमिंग्टन टंकण शैली: - टंकण शैली से यहाँ अभिप्राय यह है कि हिंदी शब्द टंकण (टाइपिंग) करने के लिए टंकणकर्ता किस क्रम में कुंजियों का उपयोग करता है। रेमिंग्टन की टंकण शैली का सिद्धांत इस प्रकार से है (The way you see, the way you type) अर्थात् "जिस तरह से आपको पाठ दीखता है, उसी तरह से (उसी वर्ण क्रम में) आप टाइप करते हैं"। जैसे कि आपको 'कविता' लिखना है तो वर्ण कुंजियों का टंकण क्रम इस प्रकार से होगा:-
क + ि + व + त + ा = कविता
इसी प्रकार:-
क + ा + य + र् = कार्य
क + फ + ़ + ् + य + ू + र् = कर्फ़्यू
स् + प + ा + े + ट + ् + र् + स = स्पोर्ट्स
ब + ि + ढ + ़ + य + ा = बढ़िया
रेमिंग्टन एक टच टाइपिंग प्रणाली है। टच टाइपिंग एक टंकण विधि है, जिसमें की-बोर्ड को बिना देखे केवल हाथों से छू-कर टाइप किया जाता है। यह हिंदी टाइपिंग की सबसे पुरानी विधि है। यह उन प्रयोगकर्ताओं के लिए एकदम सही और उपयोगी है जिन्होंने पहले से हिंदी टाइपराइटर पर हिंदी टाइपिंग सीखी है तथा इसके अभ्यस्त हैं। यह विधि अब काफी हद तक समयातीत (आउट-डेटेड) हो चुकी है तथा नए सिरे से हिंदी टाइपिंग सीखने वालों के लिए उपयोगी नहीं है। आजकल इसका प्रयोग मुख्य रूप से नॉन-यूनीकोड ग्राफिक्स तथा डीटीपी (डेस्कटॉप पब्लिशिंग) प्रोग्रामों में किया जाता है।
रेमिंग्टन टंकण शैली के तहत हिंदी टाइपिंग करने के लिए टंकणकर्ता को अँग्रेज़ी भाषा की जानकारी का होना कतई आवश्यक नहीं है। एकदम अँग्रेज़ी का ज्ञान न रखने वाले भी इस शैली से बखूबी टंकण कार्य कर सकते हैं।
2. डी.ओ.इ. फोनेटिक - इसे इन-स्क्रिप्ट लेआउट कहते हैं। इस लेआउट का मानकीकरण भारत सरकार के इलेक्ट्रॉनिक्स विभाग DOE (Department of Electronics) द्वारा किया गया तथा "ब्यूरो ऑफ इण्डियन स्टैंडर्ड्स" (BIS) द्वारा इसे राष्ट्रीय मानक घोषित किया गया। इस लेआउट की सबसे बड़ी खूबी यह है कि यह सभी भारतीय भाषाओं के वर्णों के लिए प्रयुक्त कुंजियों में समरूपता रखता है अर्थात् कुंजीपटल की कुंजी 'k' सभी भारतीय भाषाओं के लिए वर्ण 'क' की कुंजी रहेगी।

इन-स्क्रिप्ट की-बोर्ड लेआउट
सामान्य अवस्था
(1)
शिफ़्ट कुंजी दबा कर
(2)

इन-स्क्रिप्ट टंकण शैली :- इन-स्क्रिप्ट टंकण शैली का सिद्धांत इस प्रकार से है (The way you pronounce, the way you type) अर्थात् "जिस तरह से आप पाठ का उच्चारण करते हैं, उसी तरह से (उसी वर्ण क्रम में) आप टाइप करते हैं"। जैसे कि आपको 'कविता' लिखना है तो वर्ण कुंजियों का टंकण क्रम इस प्रकार से होगा:-
क + व + ि + त + ा = कविता
इसी प्रकार :-
क + ा + र् + य = कार्य
क + र् + फ + ़ + ् + य + ू = कर्फ़्यू
स + ् + प + ो + र् + ट + ् + स = स्पोर्ट्स
ब + ढ + ़ + ि + य + ा = बढ़िया
इन-स्क्रिप्ट टंकण भी एक टच टाइपिंग प्रणाली है। इसके ध्वन्यात्मक (वर्णक्रम) गुण के कारण एक व्यक्ति जो कि किसी एक लिपि में इन-स्क्रिप्ट टाइपिंग जानता हो वह सभी भारतीय लिपियों में, बिना उस लिपि के ज्ञान के भी श्रुतलेखन द्वारा टाइप कर सकता है। उदाहरण - तेलुगु में राम लिखना हो या हिंदी में, दोनो दशाओं में समान कुंजियाँ दबाने से काम बन जाता है अर्थात् यदि आप देवनागरी में टाइप करना जानते हैं तो तेलुगु में भी लिख सकते हैं।
इन-स्क्रिप्ट टंकण शैली के तहत हिंदी टाइपिंग करने के लिए टंकणकर्ता को अँग्रेज़ी भाषा की जानकारी का होना कतई आवश्यक नहीं है। एकदम अँग्रेज़ी का ज्ञान न रखने वाले भी इस शैली से बखूबी टंकण कार्य कर सकते हैं, परंतु टंकणकर्ता को हिंदी पढ़ना आना ज़रूरी है, क्योंकि यहाँ जो शब्द टाइप किया जाएगा वह उस शब्द के उच्चारण के वर्ण क्रम में ही कुंजियाँ प्रयोग कर टाइप कर सकेगा।
यह सभी प्रमुख प्रचालन तंत्रों (OS) में अंतर्निर्मित (Inbuilt) आता है इसलिए किसी अलग टाइपिंग औजार को इंस्टाल करने की आवश्यकता नहीं। वह सभी नवीन उपयोगकर्ता, जो कंप्यूटर पर पहले से हिंदी के लिए किसी भी प्रकार की टाइपिंग नहीं जानते उन्हें इन-स्क्रिप्ट ही सीखना चाहिए। इन-स्क्रिप्ट का कुंजीपटल विन्यास विशेष शोध द्वारा विशिष्ट क्रम में बनाया गया है, जिससे इसे याद करना अत्यंत सरल है।
मात्र एक हफ्ते के अभ्यास से ही इन-स्क्रिप्ट में लिखना शुरू किया जा सकता है। इन-स्क्रिप्ट में आमतौर पर एक वर्ण के लिए एक कुंजी होने से टाइपिंग की अशुद्धियाँ कम होती हैं। इन-स्क्रिप्ट लेआउट में भारतीय लिपियों के सभी यूनीकोड मानकीकृत चिह्नों को शामिल किया गया है। टच स्क्रीन डिवाइसों यथा टैबलेट पीसी तथा मोबाइल फोन आदि के लिए भी इन-स्क्रिप्ट की-बोर्ड पूर्णतया उपयुक्त है।
3. फोनेटिक इंग्लिश - इसे रोमनाइज्ड लेआउट कहते हैं। इसका ध्वन्यात्मक लिप्यंतरण आधारित की-बोर्ड लेआउट कंप्यूटर का वास्तविक की-बोर्ड लेआउट (QWERTY) ही है। ध्वन्यात्मक लिप्यंतरण (फोनेटिक ट्राँसलिट्रेशन) मशीनी लिप्यंतरण की एक विधि है। यह एक लिप्यंतरण विधि है, जिससे कि हिंदी आदि भारतीय लिपियों को आपस में तथा रोमन में बदला जाता है। इसकी कोई मानक लिप्यंतरण स्कीम नहीं होती। अलग-अलग टूल में अलग-अलग स्कीम प्रयोग होती है।

फोनेटिक इंग्लिश रोमनाइज्ड की-बोर्ड लेआउट
सामान्य अवस्था
(1)
शिफ़्ट कुंजी दबा कर
(2)
फोनेटिक इंग्लिश ( रोमनाइज्ड आधारित टंकण शैली :- इस टंकण शैली में प्रयोक्ता हिंदी (अथवा कोई इंडिक) टेक्स्ट को रोमन लिपि में टाइप करता है तथा यह रियल टाइम में समकक्ष देवनागरी (अथवा इंडिक लिपि) में ध्वन्यात्मक रूप से परिवर्तित हो जाता है। इस प्रकार का स्वचालित परिवर्तन ध्वन्यात्मक टेक्स्ट एडिटर, वर्ड प्रोसेसर तथा सॉफ्टवेयर प्लगइन के द्वारा किया जाता है। परंतु सर्वश्रेष्ठ तरीका फोनेटिक आइ॰एम॰इ॰ का प्रयोग है, जिसकी सहायता से टेक्स्ट किसी भी एप्लिकेशन में सीधे ही लिखा जा सकता है।
लेकिन इस टंकण शैली में कार्य करने के लिए प्रयोगकर्ता को अँग्रेज़ी का अच्छा-खासा ज्ञान होना आवश्यक है। यह कंप्यूटर के उन प्रयोगकर्ताओं के लिए बेहतर है, जो पहले से ही अँग्रेज़ी की टाइपिंग जानते हैं और हिंदी टाइप करना चाहते हैं। जैसे कि आपको 'कविता' लिखना है तो रोमन वर्ण कुंजियों का टंकण क्रम इस प्रकार से होगाः-
k + a + v + i + t + a + a = कविता
उसी प्रकार:-
k + a + a + r + y + a = कार्य
k + a + r + f + y + u + u = कर्फ्यू
s + p + o + r + t + s = स्पोर्ट्स
b + a + d + h + i + y + a + a = बढ़िया
मूल आलेख (हिंदी समय से साभार)-
http://www.hindisamay.com/content/3665/1/%E0%A4%B2%E0%A5%87%E0%A4%96%E0%A4%95-%E0%A4%9C%E0%A4%97%E0%A4%A6%E0%A5%80%E0%A4%AA-%E0%A4%B8%E0%A4%BF%E0%A4%82%E0%A4%B9-%E0%A4%A6%E0%A4%BE%E0%A4%81%E0%A4%97%E0%A5%80--%E0%A4%95%E0%A5%80-%E0%A4%B2%E0%A5%87%E0%A4%96-%E0%A4%B9%E0%A4%BF%E0%A4%82%E0%A4%A6%E0%A5%80-%E0%A4%A6%E0%A5%87%E0%A4%B5%E0%A4%A8%E0%A4%BE%E0%A4%97%E0%A4%B0%E0%A5%80-%E0%A4%B2%E0%A4%BF%E0%A4%AA%E0%A4%BF-%E0%A4%94%E0%A4%B0-%E0%A4%AF%E0%A5%82%E0%A4%A8%E0%A5%80%E0%A4%95%E0%A5%8B%E0%A4%A1.cspx

1 comment:

  1. sir Dr.Dhanji i am from Manipur.Sir mei aap se ICT ke bare khuch janna chahata hung or kuch material bhi lena chahata hung.

    ReplyDelete