Total Pageviews

Sunday, May 19, 2019

हिंदी का संगणकीय व्याकरण : भूमिका

हिंदी का संगणकीय व्याकरण
(Computational Grammar of Hindi)
(2019) डॉ. धनजी प्रसाद
ISBN : 978-93-88933-03-2
राजकमल प्रकाशन : नई दिल्ली
पुस्तक विवरण


भूमिका

भाषा मनुष्य के मनुष्य होने का सबसे बड़ा कारण है। भाषा के संदर्भ में यह उक्ति किसी का भी ध्यान अनायास ही अपनी ओर खींच लेती है। यदि किसी व्यक्ति की भाषाविज्ञान या भाषा संबंधी चिंतन में कोई गति न हो और उससे यह बात किसी भाषावैज्ञानिक द्वारा कही जा रही हो तो एक बार वह व्यक्ति ऐसा सोच सकता है कि भाषा के बारे में पढ़ लेने के कारण ये अन्य चीजों की महत्ता को कम करते हुए भाषा की महत्ता को प्रतिष्ठित करने का प्रयास कर रहे हैं। किंतु वास्तव में यह उक्ति शत-प्रतिशत सत्य है। जंगल में रहने वाले आदिमानव को 21वीं सदी के तकनीकी मानव बनाने में भाषा की ही आधारभूत भूमिका रही है। यदि भाषा नहीं होती तो न ही मनुष्य विचार कर पाता और न ही विचारों का संप्रेषण। ऐसी स्थिति में मनुष्य अपनी सभ्यता के विकास के लिए कुछ भी नहीं कर पाता। अतः भाषा ही मानव सभ्यता के निर्माण एवं विकास, अथवा दूसरे शब्दों में अन्य प्राणियों से अलग मनुष्य के मनुष्य होने का कारण है। बाहर से देखने पर यह भाषा अत्यंत सरल जान पड़ती है, और इसे सरल समझना उचित भी दिखाई पड़ रहा है क्योंकि मानव शिशु जन्म लेने के 5 वर्षों के अंदर बिना किसी कठिनाई के इसे सीख लेता है। किंतु वास्तविकता इसके बिल्कुल विपरीत है। भाषा को समझते हुए जैसे-जैसे हम गहराई में जाते हैं, वैसे-वैसे हमें इसकी जटिलताओं की अनुभूति होने लगती है। इसकी आंतरिक व्यवस्था में कितनी जटिलता है? इसका अनुमान इसी बात से लगाया जा सकता है कि मंगल ग्रह तक सफलतापूर्वक पहुँच जाने के बावजूद आज तक किसी भी भाषा का पूर्णत: विश्लेषण नहीं किया जा सका है। आज हमारे पास इतने शक्तिशाली कंप्यूटर हैं कि सेकेंड के लाखवें हिस्से की पहचान कर सकते हैं, या दशमलव के बाद सैकड़ों स्थान तक की संख्याओं की गणना कर सकते हैं, किंतु किसी भी कंप्यूटर द्वारा आज तक किसी भी भाषा का संसाधन नहीं किया जा सका है।
भाषा की आंतरिक व्यवस्था अत्यंत जटिल है। इसके दो कारण हैं- भाषा व्यवस्था का विभिन्न स्तरों पर स्तरित होते हुए भी सभी स्तरों का एक दूसरे से संबद्ध होना, तथा मानव मस्तिष्क द्वारा किसी भी प्रकार से अभिव्यक्ति का निर्माण करना और उसे समझ लेना। अतः भाषा में प्राप्त होने वाली विभिन्न प्रकार की जटिलताओं के कारण कंप्यूटर पर संसाधन की दृष्टि से किसी पुस्तक का लेखन अत्यंत चुनौतीपूर्ण कार्य रहा है। फिर भी हिंदी को लेकर यह आरंभिक प्रयास किया गया है। यह पुस्तक हिंदी के पूर्णत: मशीनी संसाधन का दावा करते हुए प्रस्तुत नहीं की जा रही है, बल्कि यह उस दिशा में एक कदम मात्र है। इसके माध्यम से प्राकृतिक भाषा संसाधन (NLP) के क्षेत्र में कार्य कर रहे लोगों को हिंदी का मशीन में संसाधन करने की एक दृष्टि (sight) प्राप्त हो सके, यही लेखक का उद्देश्य है। वैसे हिंदी के मशीनी संसाधन को लेकर 1990 के दशक से ही कार्य हो रहे हैं, और पर्याप्त मात्रा में यह कार्य हो भी चुका है, किंतु आम विद्यार्थियों, शोधार्थियों और इस क्षेत्र में रुचि रखने वाले विद्वानों के लिए उसकी तकनीकी उपलब्ध नहीं है, जिससे कोई नया व्यक्ति इस दिशा में कार्य कर सके। हिंदी माध्यम से तो ऐसी सामग्री का पूर्णत: अभाव है। विभिन्न प्रकार के शोधों द्वारा यह प्रमाणित हो चुका है कि कोई भी व्यक्ति अपनी मातृभाषा में मौलिक कार्य अधिक दक्षतापूर्वक कर सकता है। इसलिए हिंदी के मशीनी संसाधन की सामग्री किसी भी अन्य भाषा के बजाय हिंदी में ही होनी चाहिए। इस पुस्तक को प्रस्तुत करने का एक मुख्य उद्देश्य इस कथन की पूर्ति करते हुए हिंदी को इस दिशा में यथासंभव आत्मनिर्भर बनाना भी है।
हिंदी का संगणकीय व्याकरण (Coputational Grammar of Hindi) हिंदी के सुधी पाठकों, शोधार्थियों, विद्वानों और  कंप्यूटर पर हिंदी संसाधन से जुड़े सभी शोधकर्ताओं के सम्मुख प्रस्तुत करते हुए मुझे अत्यंत हर्ष की अनुभूति हो रही है। चॉम्स्की द्वारा रूपांतरक प्रजनक व्याकरण (TGG) के प्रतिपादन के बाद से संगणकीय व्याकरण शब्द का प्रयोग ऐसे मॉडलों के लिए किया जाता रहा है जो संगणकीय अनुप्रयोग की दृष्टि से किसी भाषा के नियमों को तार्किक रूप से प्रतिपादित करने की व्यवस्था प्रदान करें। चॉम्स्की ने अपना व्याकरण 1957 ई. में प्रतिपादित किया। यह वही समय है जब संगणक अपनी पहली पीढ़ी से निकलकर दूसरी पीढ़ी में प्रवेश कर रहा था। इसी समय कुछ विद्वानों द्वारा संगणक का प्रयोग का भाषायी क्षेत्र (मशीनी अनुवाद) में करने का प्रयास किया जा रहा था। उस समय ऐसे व्याकरण उपलब्ध नहीं थे, जो मशीनी संसाधन की दृष्टि से तैयार किए गए हों या जिनमें भाषायी नियमों को तार्किक रचनाओं (logical formations) या गणितीय सूत्रों के रूप में प्रस्तुत किया गया हो। चॉम्स्की के व्याकरण ने इस कमी को पूरा किया। इसके बाद शब्दकोशीय प्रकर्यात्मक व्याकरण (LFG), सामान्यीकृत पदबंध संरचना व्याकरण (GPSG),  शीर्ष-आधारित पदबंध संरचना व्याकरण (HPSG), निर्भरता व्याकरण (Dependency Grammar), संज्ञानात्मक व्याकरण (Cognitive Grammar),  संबंधपरक व्याकरण (Relational Grammar), वृक्ष संलग्नक व्याकरण (TAG), भूमिका एवं संदर्भ व्याकरण (Role and Reference Grammar) आदि अनेक व्याकरण विकसित किए गए हैं। इन व्याकरणों को दो श्रेणियों में बाँटा जा सकता है- संदर्भ-मुक्त व्याकरण (Context-free Grammar) तथा संदर्भ-युक्त व्याकरण (Context-sensitive Grammar)। इन सभी का उद्देश्य भाषायी नियमों को इस प्रकार से प्रस्तुत करना है कि उन्हें संगणक पर संसाधित किया जा सके। इसलिए ऐसे व्याकरणों को संगणकीय व्याकरण नाम दिया जाता है। प्रस्तुत पुस्तक में प्रयुक्त संगणकीय व्याकरण शब्द इस संकल्पना से थोड़े भिन्न अर्थ में है। यहाँ पर कंप्यूटर में हिंदी के प्रयोग, संसाधन और सॉफ्टवेयर विकास की दृष्टि से व्याकरण का निर्माण कर इसे संगणकीय व्याकरण नाम दिया गया है। इसका उद्देश्य हिंदी की नियम आधारित प्रणालियों (Rule-based Systems) के निर्माण हेतु आवश्यक व्याकरणिक और भाषावैज्ञानिक पृष्ठभूमि उपलब्ध कराना है। यह पुस्तक पारंपरिक हिंदी व्याकरण’, आधुनिक भाषावैज्ञानिक चिंतन और प्राकृतिक भाषा संसाधन (NLP) के परिप्रेक्ष्य में हिंदी की संरचना तीनों का अद्भुत संगम है। इसमें हिंदी की भाषिक इकाइयों और उनकी व्यवस्था को भाषावैज्ञानिक दृष्टिकोण से रखा गया है। इन इकाइयों और व्यवस्था की व्याख्या में यथासंभव पारंपरिक व्याकरणिक चिंतन को भी दृष्टिगत रखा गया है और आवश्यकतानुसार उद्धरित भी किया गया है। इसके अलावा चूँकि इसका उद्देश्य कंप्यूटर पर हिंदी को स्थापित करना है इसलिए प्राकृतिक भाषा संसाधन (NLP) की दृष्टि से आवश्यक अतिरिक्त इकाइयों, उनकी संरचना और सामग्री को भी प्रस्तुत किया गया है।
प्राकृतिक भाषा संसाधन (NLP) एक बहुत विस्तृत कार्य है। इसके दो प्रकार हैं- वाक् संसाधन (Speech Processing) और पाठ संसाधन (Text Processing)वाक् संसाधन लिखित पाठ को वाचिक रूप में और वाचिक रूप को लिखित पाठ में बदलने की प्रक्रियाओं के अध्ययन-अध्यापन से संबंधित है, जिन्हें क्रमशः पाठ-से-वाक् (Text-to-Speech: TTS) और वाक्-से-पाठ (Speech-to-Text : STT) कहा जाता है। प्रस्तुत पुस्तक में इस संदर्भ में कोई चर्चा नहीं की गई है। यह पुस्तक पाठ संसाधन से संबंधित है। पाठ संसाधन एक लिखित पाठ को मशीन द्वारा स्वचलित रूप से संसाधित करने की प्रक्रिया है। इसके लिए विभिन्न भाषिक स्तरों पर भाषायी ज्ञान को मशीन में स्थापित किया जाता है। चूँकि इसका क्षेत्र अत्यंत विस्तृत है, इसलिए पाठ संसाधन के संदर्भ में प्राकृतिक भाषा संसाधन (NLP) को चरणबद्ध रूप से समझने-समझाने के लिए कुछ स्तरों में विभक्त किया जा सकता है, जैसे-
·        पूर्व प्राकृतिक भाषा संसाधन (Pre-NLP) : इसमें प्रोग्रामिंग, डाटाबेस प्रबंधन, फॉन्ट निर्माण और फॉन्ट परिवर्तन संबंधी कार्य आदि आते हैं। प्रोग्रामिंग भी मुख्य रूप से स्ट्रिंग मैनिपुलेशन और डाटाबेस प्रबंधन प्रणाली से जोड़कर टूल्स के निर्माण से संबंधित होनी चाहिए। भाषा संसाधन हेतु डाटाबेस प्रबंधन प्रणाली की आवश्यकता इलेक्ट्रानिक शब्दकोश अथवा कार्पस संग्रह और प्रबंधन के लिए पड़ती है। फॉन्ट निर्माण अथवा फॉन्ट परिवर्तन NLP नहीं है। NLP तो किसी पाठ के टंकित हो जाने बाद आरंभ होती है। अतः भाषा संसाधन संबंधी कार्य के लिए इनका ज्ञान अपेक्षित तो है, किंतु केवल इतना कर पाना NLP नहीं है। यह NLP से पूर्व की स्थिति है।
·        प्राथमिक प्राकृतिक भाषा संसाधन (Primary-NLP) : NLP किसी मानव भाषा के ज्ञान को मशीन में स्थापित करने की प्रक्रिया है, जिससे मशीन द्वारा भाषा संबंधी कार्यों को स्वचलित रूप से संपन्न कराया जा सके। अतः भाषा संबंधी ज्ञान को स्वन, स्वनिम, रूपिम, शब्द/पद, पदबंध, वाक्य और प्रोक्ति सभी भाषायी स्तरों पर स्थापित करना होता है। यह कार्य मुख्यतः रूपविश्लेषण (Morph Analysis) और रूपसर्जन (Morph Generation) से आरंभ होता है। अतः शब्द स्तर तक के विश्लेषण और प्रजनन से जुड़े टूल्स का निर्माण करना प्राथमिक NLP है। इसमें संगणकीय कोश निर्माण (Building Computational Lexicon), विराम-चिह्न अभिज्ञान एवं संसाधन (Punctuation Marks Recognition and Processing), लिप्यंतरण प्रणाली (Transliteration System), रूपविश्लेषण (Morph Analysis) और रूपसर्जन (Morph Generation), वर्तनी जाँचक निर्माण (Building Spell Checker), दिनांक, समय और मुद्रा अभिज्ञान (Date, Time and Currency Recognition) आदि कार्य आते हैं। अतः शब्द या पद की आंतरिक रचना से संबंधित विश्लेषण और प्रजनन के कार्य प्राथमिक NLP के अंतर्गत आते हैं।
·        केंद्रीय प्राकृतिक भाषा संसाधन (Central-NLP) : इसके अंतर्गत शब्दभेद टैगिंग (Parts of Speech Tagging), पदबंध चिह्नन (Phrase Marking), व्याकरण जाँचक निर्माण (Building Grammar Checker), स्वचलित वाक्य प्रजनन (Automatic Sentence Generation) और पद-विच्छेदन (Parsing) संबंधी कार्य आते हैं। प्राथमिक NLP में विकसित किए गए सभी टूल्स इन प्रणालियों के विकास में किसी-न-किसी रूप में प्रयोग में आते हैं। रूपविश्लेषक (Morph Analyser) को एक टूल के रूप में देखा जा सकता है, किंतु भाषा व्यवहार संबंधी किसी कार्य में केवल रूपविश्लेषक की कोई प्रत्यक्ष उपयोगिता नहीं है। इस टूल का वर्तनी जाँचक, व्याकरण जाँचक, टैगर, पार्सर आदि किसी भी सॉफ्टवेयर में प्रयोग किया जा सकता है। यही बात प्राथमिक NLP के सभी टूल्स पर लागू होती है। वर्तनी जाँचक और लिप्यंतरण प्रणालियों का स्वतंत्र रूप से प्रयोग किया जाता है।
·        प्रगत प्राकृतिक भाषा संसाधन (Advanced-NLP) : केंद्रीय NLP ही मूल NLP है। इसमें बताए गए टूलों और सॉफ्टवेयरों द्वारा ही भाषायी अनुप्रयोग क्षेत्रों, जैसे- मशीनी अनुवाद (Machine Translation), ओ.सी.आर. (OCR), सूचना प्रत्यानयन (Information Retrieval) आदि संबंधी कार्य होते हैं। किंतु इन सॉफ्टवेयरों के विकास में संदिग्धार्थकता (Ambiguity), नामपद अभिज्ञान (Name Entity Recognition : NER), बहुशब्दीय अभिव्यक्ति (Multi-word Expression- MWE), प्रोक्ति संदर्भ (Discourse References) आदि संबंधी चुनौतियाँ आती हैं। इसके अलावा अर्थ (Meaning) को मशीन में स्थापित करना तथा अर्थ और तर्क (Meaning and Logic) को एक साथ जोड़ना आदि आज भी चुनौतिपूर्ण कार्य हैं। इन चुनौतियों को हल करने के लिए किया जाने वाला भाषा संसाधन संबंधी कार्य प्रगत NLP है। NLP से जुड़े सभी शोधकर्ता एवं संस्थान इस दिशा में प्रयासरत हैं। इन चुनौतियों के संबंध में कार्य करने वाले व्यक्ति को केंद्रीय NLP के सॉफ्टवेयरों या प्रणालियों की विकास प्रक्रिया और कार्यप्रणाली का ज्ञान होना आवश्यक है। अर्थात कोई भी व्यक्ति तब तक संदिग्धार्थकता (Ambiguity), नामपद अभिज्ञान (Name Entity Recognition : NER), बहुशब्दीय अभिव्यक्ति (Multi-word Expression), प्रोक्ति संदर्भ (Discourse References) आदि पर कार्य नहीं कर सकता, जब तक उसे टैगर, पार्सर, पदबंध चिह्नक, वाक्य प्रजनक आदि की कार्यप्रणाली का ज्ञान न हो। कई बार पी-एच. डी. शोधार्थियों द्वारा NLP संबंधी बिना किसी पूर्वज्ञान के प्रगत NLP से संबंधित इन विषयों पर शोध विषय ले लिए जाते हैं। इससे शोधार्थियों को अपना विषय समझने में ही शोध का अधिकांश समय चला जाता है और कार्य गुणवत्तापूर्ण नहीं हो पाता। मेरी समझ से यह उचित नहीं है। जब तक प्राथमिक और केंद्रीय NLP की प्रणालियों की कार्यपद्धति का ज्ञान न हो, इन क्षेत्रों में गुणवत्तापूर्ण कार्य कर पाना असंभव की तरह कठिन है।
इस पुस्तक में हिंदी के महत्वपूर्ण वैयाकरणों और भाषावैज्ञानिकों द्वारा हिंदी की भाषा व्यवस्था से जुड़ी अवधारणाओं के संदर्भ में दिए गए विचारों को आवश्यकतानुसार उद्धरित किया गया है। पुस्तक के निर्माण में यथासंभव प्रयास किया गया है कि हिंदी व्याकरण का कोई पक्ष अछूता न रह जाए। अत: मूल रूप से यह पुस्तक हिंदी का एक व्याकरण है, जिसका लक्ष्य संगणक (कंप्यूटर) है, किंतु इसकी पृष्ठभूमि भाषावैज्ञानिक है। इसमें हिंदी की सभी भाषिक इकाइयों, नियमों और व्यवस्थाओं का विवेचन भाषावैज्ञानिक आधार पर किया गया है। इसके लिए भाषाविज्ञान के संरचनात्मक और प्रजनक उपागमों (approaches) का प्रयोग किया गया है। साथ-ही आवश्यकता के अनुसार प्रकार्यात्मक संबंधों को प्रकार्य की दृष्टि से ही व्याख्यायित किया गया है। अत: इसमें किसी एक भाषावैज्ञानिक मॉडल का अनुकरण न करते हुए सभी प्रमुख मॉडलों में व्यक्त संकल्पनाओं और विचारों का समावेश किया गया है। इस पुस्तक को हिंदी का भाषावैज्ञानिक व्याकरण भी कह सकते हैं जिसका उद्देश्य कंप्यूटर में हिंदी के संसाधन संबंधी प्रणालियों का विकास करना है। चूँकि इसमें भाषावैज्ञानिक और व्याकरणिक नियम दिए गए हैं, इसलिए इसके माध्यम से नियम-आधारित संगणकीय प्रणालियों (Rule-based Computational Systems) का ही विकास किया जा सकता है।
कंप्यूटर एक डमी मशीन है, यह स्वयं से कुछ भी नहीं कर सकती। इसलिए उसमें एक-एक बात को चरणों में वस्तुनिष्ठ रूप से समझाना पड़ता है। इस व्याकरण में विभिन्न भाषिक स्तरों पर हिंदी की व्यवस्था को वस्तुनिष्ठ रूप से प्रस्तुत करने का यथासंभव प्रयास किया गया है। इसलिए यह व्याकरण मशीनी संसाधन की दृष्टि से तो उपयोगी है ही, हिंदी का विदेशी भाषा के रूप में शिक्षण करने के लिए भी इसकी पर्याप्त सामग्री विशिष्ट रूप से उपयोगी साबित होगी, इसका मुझे पूरा विश्वास है। यह पुस्तक हिंदी के उन मर्मज्ञ विद्वानों के लिए भी उपयोगी सिद्ध होगी जो हिंदी को वस्तुनिष्ठ रूप से देखना, समझना चाहते हैं।
इस पुस्तक के प्रत्येक भाग (या यहाँ तक कि प्रत्येक अध्याय) पर अंग्रेजी में अनेक पुस्तकें अलग-अलग उपलब्ध हैं, किंतु हिंदी में इस प्रकार की पुस्तकों का सर्वथा अभाव दिखाई पड़ता है। इसी कारण लेखक द्वारा यह प्रयास किया गया है कि प्रत्येक भाग (खंड) में लगभग 100 पृष्ठों की सामग्री तो उपलब्ध कराई ही जाए। यद्यपि एक-दो में ऐसा नहीं हो सका है, फिर भी मशीनी संसाधन हेतु आवश्यक विवेचन प्राप्त किया जा सकता है।
हिंदी में तकनीकी लेखन में शब्दावली की बहुत समस्या रही है। यहाँ पर पहले से उपलब्ध शब्दावली का अधिकाधिक उपयोग किया गया है। फिर भी, विशेष परिस्थितियों में अपरिहार्य होने पर नवीन शब्द भी प्रयुक्त/निर्मित किए गए हैं। चूँकि अभी हिंदी में प्रयुक्त प्रौद्योगिकीय शब्दावली बहुत अधिक प्रचलित नहीं हो पाई है, इस कारण सभी शीर्षक द्विभाषिक (bilingual) दिए गए हैं। इसके अलावा जहाँ-जहाँ तकनीकी शब्दों का प्रयोग हुआ है, वहाँ-वहाँ कोष्ठक में उनकी अंग्रेजी को अधिक-से-अधिक देने का प्रयास किया गया है। मुझे आशा है कि इससे पाठक शब्दावली में उलझने के बजाए विषय और कथ्य (content) पर केंद्रित हो सकेंगे। पुस्तक के अंत में शब्दावली नाम से पारिभाषिक शब्दों की परिभाषा आवश्यक उदाहरणों के साथ एक सूची के रूप में दी गई है। इसमें तकनीकी शब्दों और नवीन संकल्पनाओं को सरलतापूर्वक समझा जा सकता है। सूची में शब्दों को अकारादि क्रम में ही रखा गया है। इसलिए किसी भी शब्द को संबंधित स्थान पर बिना किसी समस्या के देखा जा सकता है।
इस पुस्तक की दो मुख्य कमजोरियाँ हैं- हिंदी माध्यम से लिखा जाना और लेखक का एक पूर्व प्रतिष्ठित नाम न होना। किसी भी भाषा के भाषा संसाधन अथवा कंप्यूटर से जुड़ी पुस्तकें मुख्यत: अंग्रेजी में ही लिखी जाती हैं। भारतीय अथवा हिंदी पाठकों में अंग्रेजी के प्रति एक जुनून भी देखने को मिलता है, यदि पुस्तक अंग्रेजी में लिखी गई हो, तो वह गुणवत्तापूर्ण होगी ही; ऐसी धारणाएँ प्राय: देखने को मिलती हैं। हिंदी में लिखी पुस्तकों को उतनी गुणवत्तापूर्ण नहीं माना जाता। कई लोग तो हिंदी पुस्तकों को इसलिए अपने पास नहीं रखना चाहते कि इससे उनकी साख प्रभावित होगी। किंतु ज्ञान के मामले वास्तविक स्थिति यही है कि मातृभाषा में पढ़ने-लिखने वाले लोग अधिक रचनात्मक होते हैं। यह बात वैज्ञानिक रूप से भी प्रमाणित हो चुकी है। इसलिए कंप्यूटर के क्षेत्र में भाषा संसाधन संबंधी कार्य कर रहे विद्वानों से मेरा अनुरोध होगा कि भाषा पर विचार करने के बजाए पुस्तक की सामग्री पर ध्यान केंद्रित करें।
इसी तरह हिंदी में विद्वत्ता के पैमाने बहुत अलग प्रकार के हैं। किसी पुस्तक को खरीदने या पढ़ने से पहले लोग यह देखते हैं कि इसका लेखक कौन है? वह कोई बड़ा नाम होना चाहिए, अन्यथा किसी की भी पुस्तक लेने की क्या जरूरत? हिंदी विद्वान तो यहाँ तक देखते हैं कि पुस्तक की भूमिका किसने लिखी है? या पुस्तक का प्रकाशक कौन है? इन सभी से मेरा विनम्र अनुरोध है कि नाम, उम्र, बड़े विद्वान की भूमिका या बड़े प्रकाशक से किसी भी पुस्तक में गुणवत्ता नहीं आ सकती। इसलिए इन बेकार की धारणाओं का यथाशीघ्र त्याग करके सबसे पहले पुस्तक की विषय-सूची देखें और यदि संभव हो अंदर की कुछ सामग्री पर एक दृष्टि डालें, जिससे पुस्तक की वास्तविक गुणवत्ता का सही आकलन हो सके। इसी प्रकार हिंदी में एक मानसिकता विशेष से ग्रसित स्वघोषित विद्वान भी हैं, जो हिंदी में तकनीकी विषयों पर स्वयं लिखते भी नहीं, और यदि कोई नया (बेनाम) व्यक्ति लिखता है तो आलोचना जरूर करते हैं, कि यह क्या लिखा है? बहुत ही साधारण (basic) सामग्री है आदि। ऐसे लोगों से मेरी प्रार्थना है कि केवल आलोचना करने के बजाए स्वयं भी कुछ लिखें, जिसका लाभ नए लेखकों सहित सभी लोग ले सकें और हिंदी समृद्ध हो।
इस पुस्तक के लेखन हेतु सामग्री संकलन और विश्लेषण का कार्य जैसे-जैसे पूरा हो रहा था वैसे-वैसे मुझे यह अनुभूति आ रही थी- ज्यों-ज्यों डूबे श्याम रंग, त्यों-त्यों उज्ज्वल होय। मैंने जितना अधिक अध्ययन किया, मुझे उतना ही अधिक अपने अल्पज्ञान का पता चला। इसलिए यह पुस्तक हिंदी व्याकरण को मशीनी अनुप्रयोग को समझने-समझाने की दृष्टि से प्रस्तुत करने का एक प्रयास मात्र है। पुस्तक की भाषा-शैली को यथासंभव सरल रखने का प्रयास किया गया है और प्रत्येक प्रयोग को उदाहरण द्वारा समझाने की कोशिश की गई है। इससे मुझे पूरा विश्वास है कि भाषा संसाधन के क्षेत्र में पहला कदम रखने वाला व्यक्ति भी इसमें किए गए विवेचनों को समझ सकेगा तथा इस दिशा में उसकी रुचि और अधिक बलवती हो सकेगी। पुस्तक में हिंदी के संसाधन हेतु आवश्यक नियमों और इकाइयों की चर्चा की गई है, और साथ-ही-साथ जिन बिंदुओं पर आगे और अधिक शोध की आवश्यकता है, उन्हें भी रेखांकित किया गया है। इसलिए यह पुस्तक हिंदी के मशीनी संसाधन हेतु आवश्यक शोध की ओर भी संकेत करती है। इससे शोधार्थियों को अपने शोध-विषयों के निर्धारण में भी सहायता मिल सकेगी। 
जब मैंने इस पुस्तक की योजना बनाई थी तब सोचा था कि आर्थी निरूपण नाम से अर्थ से संबंधित एक खंड भी इस पुस्तक में होगा, किंतु जैसे-जैसे मैं इस दिशा में काम करता गया, यह बात स्पष्ट हो गई कि अर्थ ही भाषा का केंद्र है। चॉम्स्की का पूरा व्याकरण बहुत उपयुक्त होते हुए भी पूर्णता को प्राप्त नहीं कर सकता, क्योंकि उसके केंद्र में अर्थ नहीं है। इसलिए अभी मैं केवल अर्थ को ही केंद्र बनाकर अलग काम करने की योजना बना रहा हूँ। यदि यह योजना सफल हुई तो वह कृति स्वयं एक पुस्तक के रूप में आपके सम्मुख उपस्थित हो सकेगी।
पुस्तक लेखन एक बड़ा कार्य है, जो महीनों और वर्षों चलता रहता है। लंबे समय तक काम करते हुए लेखक को प्रत्यक्ष या परोक्ष रूप से विभिन्न विद्वज्जन और स्वजन का सहयोग मिलता रहता है। इसलिए उन सभी के प्रति आभार और कृतज्ञता ज्ञापित करके उन्हें समुचित सम्मान देना भी लेखक का कर्तव्य बनता है। इस क्रम मैं सर्वप्रथम पं. कामता प्रसाद गुरु और प्रो. सूरजभान सिंह सहित हिंदी व्याकरण के मर्मज्ञों को नमन करता हूँ, जिनके ज्ञान का उपयोग किए बिना इस पुस्तक की रचना संभव नहीं थी; साथ ही प्रो. उमाशंकर उपाध्याय और प्रो. अनिल कुमार पाण्डेय का अंतर्मन से आभारी हूँ, जिनसे मैं समय-समय पर चर्चा करता रहा। प्रो. पंचानन मोहंती, प्रो. उमाशंकर उपाध्याय एवं प्रो. वृषभप्रसाद जैन द्वारा पुस्तक का पुनरीक्षण किया गया तथा अनेक महत्वपूर्ण सुझाव दिए गए। इसके लिए आप सभी का विशेष आभार व्यक्त करता हूँ।
मैं म.गां.अं.हिं.वि., वर्धा के कुलपति प्रो. गिरीश्वर मिश्र के प्रति हृदय से कृतज्ञता ज्ञापित करता हूँ, जिन्होंने मुझे नियमित रूप से प्रोत्साहित किया। इस कार्य हेतु सामग्री संकलन एवं अन्य क्रियाओं को संपन्न करने हेतु परियोजना के रूप में प्रायोजित करने के लिए मैं विश्वविद्यालय में स्थापित हिंदी शिक्षण अधिगम केंद्र (TLCHS) के प्रति भी हार्दिक आभार व्यक्त करता हूँ। इसके अलावा मैं अपने स्वजन- पत्नी (रागिनी)- जिन्होंने अत्यंत श्रमपूर्वक पुस्तक का टंकण किया; पिता (श्री शिवनरायन कुशवाहा), माता (श्रीमती इंद्रावती देवी) और अन्य के प्रति भी कृतज्ञ हूँ, जिनके प्रेम और स्नेह से मैं इस पुस्तक को पूर्ण करने में सफल हो सका। अपने मित्र डॉ. रणजीत भारती को प्रूफ संपादन के लिए धन्यवाद देते हुए डॉ. प्रवीण कुमार पाण्डेय एवं छोटे भाई अभिजीत प्रसाद को भी समय-समय पर पुस्तक के लेखन में सहयोग के लिए धन्यवाद देता हूँ।


- धनजी प्रसाद
05 जुलाई,  2018

1 comment: