भाषा प्रौद्योगिकी (Language Technology)


दुनिया भर में 7,000 से अधिक भाषाएँ हैं, और अगली सदी के दौरान उन में से आधे के हमेशा के लिए लुप्त हो जाने का खतरा है। भाषा प्रौद्योगिकियों के प्रतिनिधि स्थानीय भाषा प्रोग्राम के माध्यम से इन भाषाओं और संस्कृतियों को भविष्य की आने वाली पीढ़ियों के लिए संरक्षित किया जा सकता है।
भाषा मनुष्य की सामाजिक आवश्यकताओं की पूर्ति करती है। परस्पर विचार-विनिमय की साधन भाषा संप्रेषण के माध्यम से संबंधों का जाल बुनने की दिशा में सक्रियता से योगदान देती है। किसी समाज, जाति, वर्ग आदि से परिचित होने के लिए सर्वप्रथम उसकी भाषा से परिचित होना एक अनिवार्य शर्त है। संपूर्ण विश्व में विविध भाषाएँ एवं क्षेत्रीय बोलयाँ हैं। सभी भाषाओं का ज्ञान होना किसी एक व्यक्ति के लिए मुश्किल ही नहीं, असभंव भी है। बीसवीं सदी की सूचना-क्रांति एवं भूमण्डलीकरण के फलस्वरूप मात्र अपनी भाषा तक ही सीमित न रहकर वैश्विक परिदृश्य में विविध भाषाओं तथा अपनी भाषा की उपयोगिता के मूल्याकंन करने की दिशा में कार्य किया जा रहा है और परिणाम अनुवाद, मशीनी अनुवाद तथा अन्य कई प्रक्रियाओं के रूप में सामने है। यह कार्य मैनुअली करना बहुत श्रमसाध्य तथा दुष्कर है, अत: इस क्षेत्र में इलैक्ट्रॉंनिक मशीन के सहारे की जरूरत ने ही भाषा-प्रौद्योगिकी को जन्म दिया है।
भाषा-प्रौद्योगिकी का आशय तथा आवश्यकता
'भाषा' शब्द भाषा-विज्ञान से लिया गया है तथा 'प्रौद्योगिकी ' शब्द उद्योग एवं व्यवसाय से संबंधित है जिसका मुख्य उद्देश्य उत्पादन एवं वितरण है, वह भी कम समय में बड़े पैमाने पर। भाषा प्रौद्योगिकी एक शास्त्रीय, तकनीकी, प्रबंधकीय एवं अभियांत्रिकी शाखा है जो भाषीय सूचनाओं के तंत्र को विकसित करके उसका प्रयोग कम्प्यूटर के माध्यम से करते हुए मानव ओर मशीन के बीच सामाजिक, आर्थिक एवं सांस्कृतिक परिवेश को सुदृढ़ और सबल बनाती है। छोटे और अधिक शक्तिशाली कंप्यूटर द्वारा व्यापार, शिक्षा, कार्यालय आदि अनेक क्षेत्रों में तेजी से विकास हुआ है।
 इनसाइक्लोपीडिया विकीपीडिया के अनुसार- “Language Technology is often called human language Technology (HLT) or natural language processing (NLP) and consists of computational linguistics (CL) and speech Technology as its core but includes also many application oriented aspects of them. Language Technology is closely connected to computer science and general linguistics.”
कंप्यूटर भाषा विज्ञान और भाषीय तकनीक आदि इसके केंद्र तथा अंतरतम भाग हैं लेकिन ये कंप्यूटर भाषाविज्ञान के कई प्रायोगिक पक्षों को समाहित किए हुए है। भाषा प्रोद्योगिकी कंप्यूटर विज्ञान तथा सामान्य भाषाविज्ञान के बहुत समीप है। भारतीय भाषाओं के लिए विभिन्न आई.टी.कंपनियों ने सॉफ्टवेर (भाषाओं के लिए विविध फॉन्ट, सुविधाजनक की-बोर्ड, फॉन्ट रुपांतरण और शब्दकोश आदि) उपकरण तैयार किये हैं. यूनिकोड कंसोर्टियम ऑरगनाइजेशन ने भारतीय भाषाओं के लिए यूनिकोड (भारतीय भाषाओं के लिए यूनिक कोड) बनाते हुए भारतीय भाषाओं की फॉन्ट समस्या पर विराम लगाया है। यूनिकोड के माध्यम से इंटरनेट पर भारतीय भाषाओं की सुंदरलिपि लहराने लगी है. भाषा प्रौद्योगिकी के परिणामस्वरुप अंग्रेजी समुदायों की तुलना में भारतीय भाषा-भाषी कम्प्युटर  का अधिकाधिक प्रयोग करने लगे हैं. हिंदी, मराठी, तेलगु, कन्नड़,गुजराती और मलयालम आदि भाषाओं में ई-मेल आदि भेजे जा रहें हैं. अब पाणिनी के व्याकरण से लेकर आधुनिक ब्लागरों तक पर्याप्त जानकारी हिंदी में प्राप्त हो रही है. हिंदी और भारतीय भाषाओं में कई ब्लाग तैयार किये जा रहें हैं.अतः हिंदी और भारतीय साहित्य को विश्वके कोने-कोने तक पहुंचाने में यूनिकोड वरदान साबित हुआ है.
यूनिकोड के माध्यम से भारतीय भाषाओं में कम्प्युटर  पर ऑफिस वर्जन में आसानी से काम किया जा रहा है. इस क्रम में भारतीय भाषाओं की गरिमा विश्व स्तर पर छाई है.
भाषा प्रौद्योगिकी के परिप्रेक्ष्य में भाषा के प्रौद्योगिकीय विकास तथा संभावनाओं पर इन बिन्दुओं के आलोक में प्रकाश डाला जा सकता  हैः-

1.     भाषा प्रौद्योगिकी की संकल्पना
यूरोप में अंतरराष्ट्रीय लिपि होने से कम्प्युटर  पर भाषा प्रचार-प्रसार अत्यंत तेजी के साथ हुआ. भारतीय लोगों को कम्प्युटर  पर अधिकार पाने के लिए अंग्रेजी भाषा पर अधिकार पाना अनिवार्य हुआ था. भारत में भारतीय भाषाओं के परिप्रेक्ष्य में सूचना प्रौद्योगिकी को लागू करने के लिए "लिपि" की प्रमुख समस्या थी. भाषा प्रौद्योगिकी की संकल्पना का आविर्भाव केवल भारत में ही नहीं, विश्व के स्तर पर स्थापित  हुआ. अलग-अलग देश भाषा प्रौद्योगिकी के लिए प्रयास कर रहे थे। भारत में भाषा प्रौद्योगिकी की पहल सन् 1979 में डीओई द्वारा आयोजित "कम्प्युटर  पर आधारित सूचना प्रोसेसिंग की भाषाई जटिलताएं" नामक संगोष्ठी से की गई. भारतीय भाषा की किसी वेबसाइट को देखने के लिए हमें फॉन्ट को डाउनलोड़ करते हुए कम्प्युटर  में इन्स्टॉल करनापड़ता था. यूनिकोड़ के प्रयोगसे फॉन्ट की समस्या से छुटकारा मिला एवं भारतीय भाषाओं में वेबसाइट और ब्लाबनाने के लिए सहायता प्राप्त हुई
2.     यूनिकोड और भारतीय भाषा का मानकीकरण

एशियाई भाषाओं के मानकीकरण और राष्ट्रीय भाषाओं में कम्प्युटर  के प्रयोग हेतु भाषा कोडिंग के मानकीकरण के लिए सन 1997 में "बहु-भाषा सूचना प्रौद्योगिकी-97" (Multi Language InformationTechnology-97) विषयपर पहली अंतरराष्ट्रीय संगोष्ठी का आयोजन किया गया, जिसमें TDIL के अधिकारियों ने भारत का प्रतिनिधित्व किया.उसके बाद सन 1998 में कम्पुटरिकरण के लिए "अंतरराष्ट्रीय सहयोग केंद्र" CICS की स्थापना की और जापान के प्रतिनिधियों ने भारत की यात्रा की तथा इलेक्ट्रानिकी विभाग, भारत सरकार, एनसीएसटी, सी-डैक, सी-डैक नोएडा,सीईईआरआई और एनआईसी के प्रमुख अधिकारियों से विचार-विमर्श किया. भारतीय भाषाओं का इस्कि (ISCII- Indian Script Code for Information Interchange) कोड़ के अंतर्गत मानकीकरण किया गया.

3.     भारतीय भाषाओं की लिपि और भाषा प्रौद्योगिकी

भारतीय भाषाओं के प्रौद्योगिकी विकास में भारत सरकार एवं विभिन्न प्रौद्योगिकी संगठन जैसेभारतीय प्रौद्योगिकी संस्थान, आईआईटी कानपूर,उन्नतकम्पूटिंग के लिए विकास केंद्र (सी-डैक), पुणे और भारतीय भाषाओं के विद्वान प्रयास कर रहे थे. भारतीय भाषाओं के प्रौद्योगिकीय विकास के लिए सबसे बड़ी चुनौती थी "भारतीय लिपियों" में एकरुपता स्थापित करने की. इस अनुक्रम में सन 1983 में इलेक्ट्रानिक्स विभाग, भारत सरकार ने इनस्क्रिप्ट की-बोर्ड का प्रकाशन किया. इस की-बोर्ड में सभी भारतीय भाषाओं में समान कुंजियों का प्रयोग किया जाता है.इनस्क्रिप्ट की-बोर्ड का व्यावसायिकरण सन 1986 में इलेक्ट्रानिकी विभाग, भारत सरकार ने किया और भारतीय मानक ब्युरो ने सन 1991 में इस्कि (ISCII- Indian Script Code for Information Interchange) कोड के अंतर्गत सभी भारतीय भाषाओं के लिए एक ही की-बोर्ड अर्थात इनस्क्रिप्ट की-बोर्ड का मानकीकरण किया.


इनस्क्रिप्ट की-बोर्ड भारतीय लिपियों के वर्णाक्षरों की वैज्ञानिक एवं ध्वन्यात्मक प्रकृति के साथ प्रस्तुत करता है. यह की-बोर्ड प्रयोगकर्ता को व्याकरण सम्मत त्रुटियों से बचाता है और टंकन कार्य में आसानी प्रदान करता है. इलेक्ट्रानिकी विभाग, भारत सरकार ने भारतीय भाषाओं के लिए सॉफ्टवेर निर्माताओं को इस मानक की-बोर्ड का प्रयोग अनिवार्य कर दिया है. आजकल मोबाइल फोन निर्माता कंपनियां भी अपने मोबाइल उत्पादों के साथ इनस्क्रिप्ट की-बोर्ड को ही प्रयुक्त कर रही है.

4.     भारतीय भाषाओं की वर्तनी एवं शब्द भंडार

भारतीय भाषाओं की वर्तनी एवं शब्दों के लिए पर्यायी, विपरीतार्थ और बहुभाषी शब्द आदि के लिए भाषा प्रौद्योगिकी में सबसे बड़ी चुनौती थी। इस प्रयास में विभिन्न प्रौद्योगिकी कंपनियां भाषाओं के लिए सॉफ्टवेअर बनाने का कार्य कर रही थीं। माइक्रोसॉफ्ट ने भारतीय भाषाओं के लिए अपनी साइट www.bhashaindia.com पर सभी भारतीय भाषाओं के लिए शब्द-भंडार जैसे- हिंदी से अंग्रेजी, अंग्रेजी से हिंदी तथा अन्य भाषाओं में द्विभाषी Smart tag बनाया है। स्मार्ट टैग को आसानी से कम्प्युटर  में संस्थापित किया जा सकता है। स्मार्ट टैग यूनिकोड समर्थित होने के कारण ऑफिस वर्जन में आसानी से काम करता है।

5.     भाषा प्रौद्योगिकी एवं भारतीय भाषाओं के फॉन्ट

भाषाओं के सॉफ्टवेअर निर्माता कंपनियों ने कार्पोरेट लाईसेंस के आधार पर भारतीय भाषाओं के लिए कई फॉन्ट तैयार किये हैं। भारतीय सरकार की प्रौद्योगिकी संस्थानों ने भी इस दिशा में महत्वपूर्ण प्रयास किया है, जिसमें सी-डैक, पुणे एवं सी-डैक नोएडा के सहयोग से भारतीय भाषाओं के यूनिकोड समर्थित फॉन्ट, ओपन टाइप फॉन्ट और पब्लिसिंग कार्यमें प्रयुक्त होने वाले फॉन्ट को निःशुल्क उपलब्ध किया है।
6.     भाषा प्रौद्योगिकी के विकास में सरकारी पहल-
आठवीं योजना के दौरान यह निश्चय किया गया कि भारतीय भाषाओं के लिए भाषा प्रौद्योगिकी को अधिक महत्व दिया जाए। अत: एक बड़ा प्रोग्राम आरंभ करने का निर्णय लिया गया, जिसमें गुणवत्ता राष्ट्रीय आवश्यकता और परंपरागत ज्ञान की भागीदारी पर ध्यान केंद्रित करना प्रथम लक्ष्य था। डी.ओ.एल. ने 1990-91 में भारतीय भाषाओं के लिए तकनीकी विकास प्रोग्राम आरंभ किया। मानव-मशीन अन्योक्यक्रिया भारतीय भाषाओं में सूचना प्रोसेसिंग और बहुभाषा ज्ञान को बढ़ावा देने के लिए सूचना प्रोसेसिंग टूल्स विकसित करना, उन्हे प्रायोगिक रूप देना और भारतीय भाषाओं में सूचना प्रोसेसिंग के क्षेत्र में आर एँड डी प्रयासों का समर्थन करना था जिसमे मशीनी अनुवाद, मानव मशीन, तालमेल, भाषा संबंधी अघ्ययन और स्वाभाविक भाषा प्रोसेसिंग आदि शामिल हैं।
 संचार और सूचना प्रौद्योगिकी मंत्रालय,भारत सरकार ने सी-डैक, पुणे तथा नोएडा और आईआईटी मुंबई ने केवलफॉन्ट ही नहीं,बल्कि भारतीय भाषाओं के लिए टू टाइप फॉन्ट, की-बोर्ड ड्राइवर, मल्टीफॉन्ट की-बोर्ड इंजिन, युनिकोड की-बोर्ड ड्राइवर, स्टोरेज कोड परिवर्तक, भारतीय ओपन ऑफिस, स्पेल चेकर, शब्दकोश, डेकोरेटिव फॉन्ट डिजाइनर उपकरण, डाटाबेस सोर्टिंग उपकरण,टंकन सहायक, माइक्रोसॉफ्ट वर्ड टूल्स, एक्सेल उपकरण एवं विडोज के लिए लिप्यंतरण उपकरण आदि केवल तैयार ही नहीं किया,बल्कि निःशुल्क भी उपलब्ध कर दिया।
भारत सरकार के सूचना एवं प्रौद्योगिकी मंत्रालय ने इसे "भारतीय भाषाओं के लिए प्रौद्योगिकी विकास" की वेबसाइट www.ildc.gov.in से निःशुल्क डाउनलोड कर सकते हैं। यह सभी उपकरण सभी ऑपरेटिंग सिस्टम जैसे विंडोज 2000, एक्स-पी, विस्टा एवं विंडोज 2007 के साथ सपोर्ट करते हैं।
कंप्यूटर मे हिंदी प्रयोग की बढ़ती संभावनाओं को ध्यान में रखकर इलेक्ट्रॉनिकी विभाग के भारतीय भाषाओं के लिए 'टेक्नोलॉंजी विकास' नामक परियोजना के अन्तर्गत कई प्रोजैक्ट शुरू किए हैं। किसी भी प्रजांतत्र और सरकारी अथवा निजी संगठन मे जनभाषा का सम्मान करना फलप्रद होता है। सरकारी कामकाज में पारदर्शिता लाने के लिए सूचनाओं का माध्यम जनभाषा होना जरूरी है। इंटरनेट प्रणाली के महाशक्तिशाली तंत्र में भाषा का अपना विशिष्ट स्थान होता है। भाषा-प्रौद्योगिकी के अन्तर्गत इलैक्ट्रॉनिक्स के माध्यम से भाषा का लेखन, पाठन, मुद्रण की नई तकनीक, लिपि का तकनीक के साथ तादात्म्य एवं भाषा-शिक्षण के उपकरणों का विकास आदि सन्निहित हैं।
भारतीय भाषाओं के हितों को ध्यान में रखते हुए भारत सरकार के डी. ओ. ई (Department Electronics) ने 1979 में कंप्यूटर आधारित सूचना प्रोसेसिंग की भाषाई जटिलता पर एक संगोष्ठी का आयोजन किया। इसके पश्चात् विभिन्न शिक्षा संस्थाओं और आर. एंड. डी. (Research Development) संगठनों मे डी. ओ.ई. की टेक्नोलॉजी विकास परिषद टी.डी.आई.के अधीन लगभग 10 प्रोजैक्ट आंरभ किए गए। आई. आई. टी कानपुर द्वारा विकसित बहुभाषी कंप्यूटर टर्मिनल प्रणाली GIST (Graphics and Intelligence based Script Technology) 1985 में लगभग 10 कंपनियों को स्थानांतरित की गई। डी.ओ.ई. प्रायोजित प्रोजैक्ट के रूप में Gist का विकास भारतीय प्रोद्योगिकी इंस्टीट्यूट, कानपुर में आरंभ किया गया और उन्नत कंप्यूटिंग के लिए विकास केंद्र (C-DAC) पुणे में इसे पूर्ण रूप दिया गया। भारतीय भाषाओं के लिए आई.टी. अनुप्रयोगों को बढ़ावा देने में C-DAC ने एक पथ-प्रदर्शक का कार्य किया है। जिस्ट कंप्यूटर मॉनीटर पर विभिन्न भारतीय लिपियों का प्रदर्शन करता है जो संबंधित भारतीय लिपियों वाले कीबोर्ड के माध्यम से दर्ज सूचना पर आधारित होता है। भारतीय लिपियों मे प्रयुक्त कीज के लिए कोड और उनके अभिविन्यास को 'भारतीय मानक ब्यूरो' ने मानकीकृत किया है। इस विकास के परिणामस्वरूप कई सॉफ्टवेयर प्रोडेक्ट बने हैं जो अब बाजार मे उपलब्ध हैं, जिससे विभिन्न उपभोक्ता विन्डोज वातावरण, डेस्कटॉप पब्लिशिंग, स्प्रैड शीट, स्पैल चेकर आदि के अंतर्गत वर्ड प्रोसेसिंग कर सकते है। अब विभिन्न भाषाओं में डबिंग और सब-टाइटलिंग के साथ टी.वी कार्यक्रमों का प्रसारण संभव है।
अनुंसधान संस्थानों के अतिरिक्त विभिन्न आर एँड डी संगठनों तथा शैक्षणिक संस्थानों द्वारा अनुसंधानात्मक तथा विकासात्मक प्रोजेक्ट आंरभ किये गये। इन सभी प्रयासों को समेकित करने के लिए इलैक्ट्रॉनिक्स विभाग ने 1987 में भारतीय भाषाओं के लिए इलैक्ट्रोनिक टूल्स (ETIL) आरंभ किये। यह प्रोग्राम भारतीय भाषा प्रोसेसिंग के लिए इलैक्ट्रॉनिक टूल्स के विकास उनके प्रवर्तक अनुप्रयोगिक क्षेत्रों, प्रौद्योगिकी मूल्यांकन और अनुसंधानिक निष्कर्षों पर आधारित सिस्टम में समेकित पर केंद्रित था। इसके अतिरिक्त डी.ओ.ई. की विभिन्न योजनाओं के अधीन टी.डी.सी. और ज्ञान आधारित कंप्यूटर सिस्टम (KBCS) विकास प्रोजक्ट भी शुरू किए गए। यही प्रोजेक्ट अधिकांश उत्कृष्ट अनुसंधान अधिकल्प और विकास के उद्देश्य से आंरभ किया गया था। इसके पश्चात् दिसम्बर, 1987 में कंप्यूटर पोषित सीखने/सिखाने (CALT) के लक्ष्य से 'भाषा और कलाएँ' एक समिति बनाई गई जिसका लक्ष्य भाषा और कला प्रशिक्षण कार्यक्रम के अंतर्गत एव विषय रूप में CALT के लिए उपयुक्त पाठ्यक्रम तैयार करना था। साथ ही समिति ने भाषा और कला प्रोसेसिंग, स्पीच जानकारी, ज्ञान प्रसारण, अध्ययन आदि के क्षेत्र में कम्प्यूटेशनल लेक्सकॉंन, भाषा विश्लेषण आदि संबंधी कई प्रोजेक्टों की भी सिफारिश की।
1991 से भारतीय भाषाओं के तकनीकी विकास PDIL (Technology Development for Indian Languages) प्रोग्राम के अन्तर्गत कई विकासात्मक कार्य आरंभ किये गये। जिसमें विभिन्न भाषाओं के लिए पाठ संबंधी मशीन कार्पोरा विकास, मशीनी अनुवाद, इन्टर्फेस सिस्टम कंप्यूटर आधारित भाषा शिक्षण/प्रशिक्षण और स्वभाविक भाषा प्रोसेसिंग के मूल तत्व सम्मिलित हैं। भारतीय भाषाओं अर्थात् तमिल, तेलगू, कन्नड़, मलयालम, असमी, बंगला, उड़िया, हिन्दी, पंजाबी, संस्कृत, कश्मीरी, और उर्दू में लगभग 30 लाख शब्दों के पाठ का मशीन पठनीय कार्पोरा विकसित किया गया है और मराठी, गुजराती, और सिंधी में यह कार्य पूरा होने की स्थिति में है। साथ ही मणिपुरी, नेपाली तथा कोंकड़ी में कार्य प्रगति पर है।
दरअसल पिछले कुछ दशकों से भाषा संबंधी अघ्ययन और अनुसंधान में क्रान्तिकारी परिवर्तन आया है। भाषा-विश्लेषण की दिशा में कॉर्पोरा (Corpus सामग्री) एक प्रामाणिक प्रविधि के रूप में सामने आया है। कॉर्पस संरचनात्मक व्याकरण में भाषिक भाषा विवरण या भाषा संबंधी मान्यता का सत्यापन करने का आधारभूत, लिखित भाषा या बोली से लिप्यंकिन डाटा है। वर्ड काउन्ट, आवृत्ति कांउट और व्याकरणिक टैगिंग के लिए भी टी.डी.आई.एल. ने सॉफ्टवेयर विकसित किया गया और साथ ही कुछ ऐसी भाषाओं के लिए वर्तनी शोधक (Spell-Cheker) भी विकसित किए गए।
कन्नड़ से हिंदी भाषा के लिए एक मशीनी अनुवाद सिस्टम (अनुसारिका) विकसित किया गया और अब अन्य भाषाओं अर्थात् तेलगू, मलयालम और बंगला से हिंदी में अनुवाद की दिशा मे कार्य किया जा रहा है।
कंप्यूटर तथा मानव के बीच संवाद स्थापित करने के लिए इन्टर्फेस सिस्टम (HUMIS) का विकास इस अभियान की महत्वपूर्ण कड़ी है।
कैरेक्टर पहचान, देवनागरी पाठ के लिए विभिन्न बिम्ब प्रोसेसिंग और प्रारूप पहचान ऐल्गोरिथ्म (Algorithm) का विकास किया गया है। ऐल्गोरिथ्म एक जटिल संक्रिया को करने के लिए बनाया गया प्रक्रिया उपकरण है जो संक्रियता को सुनिश्चत, स्पष्ट सरलतर सक्रियताओं से खण्डीकृत करता है। मुद्रित देवनागरी पाठ के लिए OCR (Optical Character Recognition) सिस्टम के लिए एक अन्य सिस्टम विकास भी योजना के तहत है।
स्वभाविक भाषा प्रोसेसिंग NLP (National Language Processing) तथा प्रशिक्षक प्रशिक्षण कार्यक्रम TTP (Teachers Trainnig Programme) के तहत भाषाविदो और भाषा अध्यापकों के लिए 7 केन्द्रों पर NLP-TTP पाठ्यक्रम आरंभ किए गए। B.Ed/M.Ed. के पाठ विवरण में CLT (Computer Assisted Learling and Training) पाठ्यक्रम आरंभ करने के लिए चार साधन केन्द्रों को नियुक्त किया गया। इन प्रोजैक्टों में से कुछ हिंदी के लिए विशेष सिस्टम विकसित किए गए।
साथ ही संस्कृत में स्वाभाविक भाषा से संबंधित, पाणिनि व्याकरण के कंप्यूटेशनल रूपांतर और 'देसिका के विकास के लिए एक प्रोजेक्ट आंरभ किया गया, जिसका मुख्य उद्देश्य भारतीय शास्त्र जैसे न्याय, मीमांसा, निरूक्त के तत्वों के अध्ययन के लिए प्रोटोटाइप बनाना और पाणिनि अष्टाध्यायी की मॉडलिंग करना है।
7.     भाषा प्रौद्योगिकी बनाम कम्प्युटर
हिंदी भाषा और प्रौद्योगिकी की बात करते समय अन्य भारतीय भाषाओं की चर्चा होना स्वाभाविक है क्योंकि कोई कंप्यूटरीकृत उपकरण विकसित करते समय सभी भाषाओं अथवा किन्हीं दो भाषाओं या एक परिवार की भाषाओं को दृष्टि में रखा जाता है। वस्तुत: कम्यूटर की दो संकेतों की अपनी स्वंतत्र गणितीय भाषा है और उसी भाषा में वे हमारी भाषाओं को ग्रहण करके अपने सभी कार्य संपन्न करते हैं। इसलिए कंप्यूटर के लिए किसी भी भाषा को अपनाने मे कोई बाधा नहीं होती।
कंप्यूटर में सभी गणनाएँ केवल दो संकेतों (0 और 1) से होती है। केवल गणित ही नही, तार्किक कथनों को भी 'हाँ' या 'नही' के बीजगणित में ढाला जा सकता है। विभिन्न लिपियों के माध्यम से प्राकृतिक भाषाओं के कुंजीयन के लिए द्वि-आधारी कोड (Binary Code) बनाए गए है। रोमन लिपि के कोड की आस्की-7 (ASCII अर्थात् American Standard code for Information Inter change) कहा जाता है। फ्रांसीसी, जर्मन, इतालवी, पुर्तगाली, डच और स्पेनिश आदि रोमन आधारित भाषाओं में प्रयुक्त सभी विशेषक चिह्रनों को भी इसमे समाविष्ट किया गया है। जैसे A के लिए आस्की-7 कोड में 8 बिट की 0 ओर 1 की यह गणना 01000001 के रूप में निर्धारित की गई है। जैसे ही इसे डीकोडित किया जायेगा, यह A में परिणत हो जाएगा। कंप्यूटर जब किसी शब्द संसाधन को संग्रहीत (Store) करता है तो उसके साथ ही उसका परिवर्तक प्रोग्राम भी संग्रहीत कर लेता है। जैसे -अंग्रेजी के लिए संबंधित परिवर्तक (Converter) जो कि मशीनी भाषा में अंग्रेजी दिखाता है, पहले कंप्यूटर परिवर्तक और मशीनी भाषा को एक ही फाइल संचित करता था, जैसे-
A= 11 + परिवर्तक भाषा
B = 12 + परिवर्तन भाषा
परंतु इसको अगर किसी दूसरी भाषा में परिवर्तित करना होता था तो परिवर्तक को हर पंक्ति बदलनी होती थी जिससे उसमें कुछ गलतियाँ होने की संभावना बढ़ जाती थी। बग्ज्स (Bugs कंप्यूटर लैग्वेज में दोष) आने लगते थे। भारत सरकार ने ISSCII (Indian Standard Script Code for Information Change) के माध्यम से भारतीय भाषाओं की कंप्यूटिंग के लिए कोड प्रणाली की शुरूआत की। यह आस्की-7 का ही विस्तृत रूप है।
8.      माइक्रोसॉफ्ट बनाम भाषा प्रौद्योगिकी
माइक्रोसॉफ्ट दुनिया भर में लोगों को अपनी स्थानीय भाषा और सांस्कृतिक पहचान को बनाए रखने के प्रयासों के साथ प्रौद्योगिकी का लाभ लेने में मदद करने लिए प्रतिबद्ध है। इस प्रतिबद्धता के प्रतिनिधि के रूप में उनकी एक वैश्विक पहल स्थानीय भाषा कार्यक्रम है जो भाषाई और सांस्कृतिक भेद का सम्मान करते हुए लोगों को अपनी परिचित भाषा में प्रौद्योगिकी तक पहुँच प्रदान करता है। 4 अरब वक्ताओं और 100 से अधिक समर्थित भाषाओं के साथ, स्थानीय भाषा कार्यक्रम भाषा और संस्कृति के माध्यम से लोगों और प्रौद्योगिकी के बीच के अन्तराल को पाटने के साथ-साथ स्थानीय समुदायों में व्यक्तियों के सशक्तिकरण के लिए नए आर्थिक अवसरों, आई.टी. कौशल निर्माण कर, शिक्षा लक्ष्यों की उपलब्धियों को बढ़ाते हुए स्थानीय भाषा और संस्कृति को भविष्य की पीढ़ियों के लिए जीवंत रखने के लिए माइक्रोसॉफ्ट कंपनी सक्रिय है।
यूनेस्को के अंतर्राष्ट्रीय मातृ भाषा दिवस के अवसर पर, विंडोज़ टीम ने विंडोज़ 8 में समर्थित नई स्थानीय भाषा सुविधाओं का खुलासा किया है। वर्तमान में, माइक्रोसॉफ्ट 46 भाषाओं में अनुवाद उपकरण प्रदान करता है, और विंडोज़ तथा आफ़िस में लगभग 100 भाषाओं में अनुवाद की सुविधा प्रदान करता है। यह वैश्विक जनसंख्या का 90 प्रतिशत से अधिक तक पहुँचने सक्षम है।
माइक्रोसॉफ्ट अनुवादक हब के रूप में एक नया उपकरण भी प्रदान करना चाहता जो समुदाय की आवश्यकतानुसार निर्मित अनुवाद मॉडल का निर्माण करना संभव बनाएगा। माइक्रोसॉफ्ट का स्थानीय भाषा कार्यक्रम की निम्नलिखित विशेषताएँ है:
मुफ्त डाउनलोड के माध्यम से विंडोज़, ऑफ़िस और विजुअल स्टूडियो के लिए भाषा इंटरफ़ेस पैक के द्वारा लगभग 100 भाषाएँ समर्थित हैं।
माइक्रोसॉफ्ट शब्दावली संग्रह आई टी शब्दों के स्थानीय भाषा में अनुवाद कर उनके अर्थ को एकरूपता प्रदान करता है।
माइक्रोसॉफ्ट टेलमी की वाक् अभिज्ञान सेवा प्राकृतिक भाषा की क्षमता के माध्यम से रोजमर्रा के कार्यो को सरल बनाती है।
माइक्रोसॉफ्ट भाषा विकास केंद्र के तहत अल्प संसाधन वाली भाषाओं के लिए वाक् संश्लेषण प्रौद्योगिकी जैसी कई सेवाओं के विकास पर काम करता है। इसके अलावा व्यापक अनुसंधान और विकास के माध्यम से, यह दुनिया भर के विकलांग लोगों के लिए भाषा सीखने के अवसर निर्मित करता है।
·     माइक्रोसॉफ्ट विंडोज ऑपरेटिंग सिस्टम के लिए भारतीय भाषाओं में टंकण हेतु विकसित इंडिक इनपुट टूल्स -

·       Microsoft I​ndic Language Input Tool (ILIT)

Microsoft Indic Language Input Tool helps you enter Indian language text easily into any Microsoft Windows applications. The primary input mechanism is transliteration. Additionally, it provides a visual keyboard to assist with editing words that do not transliterate properly.

·       Indic Input 3

Users working with Windows 8 operating systems should use Indic Input 3. Minimum System Requirements - Windows Vista, Windows 7 and Windows 8 Tool is compatible with equivalent 64-bit Operating Systems

·       Indic Input 2

 Users working with latest operating systems should use Indic Input 2. It is suitable for – 32-bit version of Windows Vista or Windows 7 or Windows Server 2008 64-bit version of Windows XP or Windows Vista or Windows 7 or Windows Server 2003 or Windows Server 2008

·       Indic Input 1

 Users working with older operating systems should use Indic Input 1. It is suitable for – 32-bit version of Windows 2000 or Windows XP or Windows Server 2003. Indic Input 1 is NOT supported on newer versions of operating systems
निष्कर्ष एवं उपसंहार
किसी भाषा का संप्रेषण केवल विद्वानों तक सीमित नहीं होता। भाषा पर समाज से सभी वर्गों का समान अधिकार होता है। भाषा एक सामाजिक सम्पत्ति है। भाषिक प्रचार का पहला तत्व है- भाषिक संप्रेषण। अतः भाषा प्रौद्योगिकी को अधिक सक्षम बनाने के लिए हमें चाहिए कि ऐसी प्रौद्योगिकी का विकास करें और उस प्रौद्योगिकी को पाठ्यक्रम में शामिल किया जाए।
आज सूचना प्रौद्योगिकी के क्षेत्र में इंटरनेट ने क्रान्ति की है। इंटरनेट पर भारतीय भाषाओं मे ई-मेल आदि भेजे जा सकते हैं। इंटरनेट पर भारतीय भाषाओं में यूनिकोड के माध्यम से समाचार भी प्रकाशित करना संभव हुआ है। इन सब बातों को मद्दे नज़र रखते हुए यह आशा सहज ही की सकती है कि भविष्य में इंटरनेट के माध्यम से भाषा प्रौद्योगिकी का प्रचार अत्यंत तेजी से होगा और भारतीय भाषाएं समस्त विश्व में अपना परचम लहराएगी।
*****************************************************************************

टिप्पणियाँ

इस ब्लॉग से लोकप्रिय पोस्ट

ऑनलाइन हिन्दी प्रशिक्षण हेतु लीला प्रबोध , प्रवीण एवं प्राज्ञ के नए पाठ्यक्रम

यूनिकोड और हिन्दी शब्द संसाधन (Unicode & Hindi Word Processor)

ई महाशब्दकोश E-Mahashabdakosh