Friday, July 21, 2006

आईआईटी-मुंबई का कमाल 'हिंदी शब्दतंत्र'

इंटरनेट में अचानक ही कई बेजोड़ चीज़ें मिल जाती हैं. ऐसी ही एक बेजोड़ चीज़ है- हिंदी शब्दतंत्र और उसी से जुड़ा बेहतरीन हिंदी शब्दकोश.

जैसा कि हमारी सरकारी एजेंसियों के अधिकतर अच्छे कामों के बारे में होता आया है, हिंदी शब्दतंत्र के बारे में भी ढंग से कोई प्रचार नहीं किया गया. कुछ वैज्ञानिक गोष्ठियों में इस पर चर्चा ज़रूर हुई होगी.

थोड़ी छानबीन के बाद पता चला कि हिंदी शब्दतंत्र और कुछ नहीं बल्कि भविष्य के एक चमत्कार का आधारभूत ढाँचा है. आने वाले वर्षों में जब एक भाषा से दूसरे में ढंग का मशीनी अनुवाद संभव हो पाएगा, तब हम हिंदी शब्दतंत्र के महत्व को ठीक से समझ सकेंगे.

ज़्यादा तकनीकी ब्यौरे में नहीं जाते हुए बताया जाए तो शब्दतंत्र या WORDNET भाषा और कंप्यूटर प्रोग्राम का ऐसा सुमेल है, जो कि एक भाषा के माल को दूसरी भाषा में ढालने का कारखाना साबित हो सकता है. भारत जैसे बहुभाषी राष्ट्र में ये कितना उपयोगी साबित हो सकता है, इसकी सहज कल्पना भी संभव नहीं है.

शब्दतंत्र को बाकी मशीनी शब्दकोशों से इस मामले में अलग माना जा सकता है कि यह सिर्फ़ पारिभाषिक अर्थों पर नहीं, बल्कि शब्द विशेष के विभिन्न उपयोगों पर भी गौर फ़रमाता है. कंप्यूटर किसी शब्द का इतना वास्तविक वर्गीकरण SYNSET के सिद्धांत पर करता है. SYNSET यानि a set of one or more synonyms, मतलब समानार्थक शब्दों का वर्ग या मुद्रिका.

आइए हिंदी शब्दतंत्र में एक शब्द 'आम' के उदाहरण के ज़रिए SYNSET के कमाल को देखते हैं.


आम...

Noun(2)
(R) आम, रसाल, आम्र, अंब, अम्ब - एक फल जो खाया या चूसा जाता है "तोता पेड़ पर बैठकर आम खा रहा है / शास्त्रों ने आम को इंद्रासनी फल की संज्ञा दी है"
(R) आम, आम वृक्ष, पिकप्रिय, पिकदेव, पिकबंधु, पिकबन्धु, पिकबंधुर, पिकबन्धुर, पिकराग - एक बड़ा पेड़ जिसके फल खाए या चूसे जाते हैं "आम की लकड़ी का उपयोग साज-सज्जा की वस्तुएँ बनाने में किया जाता है"

Adjective(2)
(R) सामान्य, आम, साधारण, कामचलाऊ, मामूली, अविशिष्ट, अविशेष, अदिव्य - जिसमें कोई विशेषता न हो या अच्छे से कुछ हल्के दरज़े का "यह सामान्य साड़ी है"
(R) सामूहिक, आम, सार्वजनिक, सामुदायिक, सामान्य - प्रायः सभी व्यक्तियों,अवसरों,अवस्थाओं आदि में पाया जानेवाला या उनसे संबंध रखनेवाला "साक्षरता पर विचार-विमर्श हेतु एक सामूहिक सभा का आयोजन किया गया"

ऊपरोक्त विवरण में हरे में है समानार्थक शब्दों का समूह, नीले में है परिभाषा और बैंगनी में है वाक्य के रूप में उदाहरण.

आज 22 जुलाई 2006 की बात करें तो हिंदी शब्दतंत्र में 47076 अलग-अलग शब्द, और 22469 SYNSETs हैं.

मुंबई के भारतीय प्रौद्योगिकी संस्थान के भारतीय भाषा प्रौद्योगिकी केन्द्र ने हिंदी शब्दतंत्र का विकास किया है. इसका आधार प्रिंसटन विश्वविद्यालय के वर्डनेट को माना जा सकता है. जहाँ तक मुझे पता चला है शब्दतंत्र के विकास में ढाई साल लगे और इसी साल दो अप्रैल को आईआईटी-मुंबई में ही एक वैज्ञानिक संगोष्ठी में इसका लोकार्पण किया गया. आईआईटी-मुंबई ने हिंदी के साथ ही मराठी भाषा के लिए भी मराठी शाब्दबंध नाम से एक शब्दतंत्र का विकास किया है.

बात यहीं पर आकर अटक नहीं जाती आईआईटी-मुंबई के विशेषज्ञों ने एक बेहतरीन शब्दकोश भी बना डाला है. इसमें अंग्रेज़ी-हिंदी के अलावा हिंदी-अंग्रेज़ी में भी शब्दों के अर्थ देखने की सुविधा है. यूनीवर्सल वर्ड- हिंदी लेक्सिकन नामक यह शब्दकोश कई विशेषताएँ लिए हैं. मसलन EXACT के साथ-साथ LIKE श्रेणी में भी अर्थ ढूँढने की सुविधा. और आपने LIKE श्रेणी में अर्थ ढूँढे तो शब्द से जुड़े मुहावरे भी सामने आ सकते हैं. इसी तरह यहाँ हिंदी टंकण के लिए झंझटमुक्त की-बोर्ड की भी व्यवस्था की गई है.

शब्दतंत्र और शब्दकोश दोनों विकास की अवस्था में हैं. इसलिए हमारी राय आईआईटी-मुंबई के विशेषज्ञों के लिए ख़ास महत्व रखती है. शब्दकोश पर मैंने भी एक सलाह दी कि वैसी व्यवस्था ज़रूर की जाए जिसमें पूरा शब्द टाइप करने की ज़रूरत नहीं हो. यानि दो-तीन मात्राएँ टाइप करते ही संभावित शब्दों के विकल्प सामने आ जाएँ, जिनमें से इच्छित पर क्लिक करने मात्र से ही काम बन जाए.

हमलोगों में से कई लोग कंप्यूटर के महारथी और सच्चे अर्थों में हिंदी सेवी हैं. आप महानुभावों से अनुरोध है कि आईआईटी-मुंबई के कर्मयोगियों को अपनी सलाह उपलब्ध कराने की कृपा करें.

Labels: , ,

15 Comments:

  • बढ़िया चीज़ बताई आपने।

    By Blogger आलोक, at 5:24 AM  

  • इनका अस्तित्व बहुत दिनो से है, किन्तु अब इनका काफी सुधार हो गया है और काफी उन्नत हो गयी हैं|

    By Blogger अनुनाद सिंह, at 10:34 AM  

  • इस बहुत अच्छे प्रयास में बहुत कुछ जोड़ा जाना बाकी है।आप कृपया इनको लिखें कि शब्द सम्पदा के लिये अरविंद कुमार की हिंदी थिसारस ,जो उनकी सालों की पारिवारिक मेहनत से तैयार हुआ, से सहयोग लें।

    By Blogger अनूप शुक्ला, at 11:23 AM  

  • हिन्दी ब्लागर जी,

    मै एक हिन्दी वर्तनी जांचक उपकरण पर काम कर रहा हूं। काम पूरा हो गया है लेकिन मेरे पास अच्छा शब्द्कोष नही है।
    मेरी जरूरत ऐसी है कि
    १.शब्दकोष मे हर पंक्ति पर एक शब्द हो।शब्द अक्षरो की सख्या के आधार पर समुह मे हो।
    जैसे एक अक्षर वाले शब्द पहले , उसके बाद दो अक्षर वाले।
    २. ये समुह अपने वर्णानुक्रम मे हों।

    मुझे एक अच्छा शब्द्कोष मिल जाये तो मै उसे उपरोक्त समुह और अनुक्रम के अनुसार व्यवस्थित कर लुंगा।

    आप की जानकारी मे ऐसा कोई शब्द्कोष हो मुझे बतायें। मेरा मेल पता है ash डाट shri जीमेल डाट काम
    धन्यवाद

    By Anonymous आशीष, at 3:40 AM  

  • महाशय हिन्दी भाषा और साहित्य के लिए आपका यह कार्य अति महत्वपूर्ण है। इस कार्य के लिए आप " मानक हिन्दी कोश" जो कि पाँच भागों मे है "हिन्दी साहित्य सम्मेलन प्रयाग " ने इसे प्रकाशित किया है। यह बहुत ही अच्छा और प्रामाणिक हिन्दी शब्द कोश है।
    डॉ॰ जगदीश व्योम

    By Anonymous Anonymous, at 3:25 PM  

  • सी-डैक, पुणे और सी-डैक, नोएडा भी मशीनी अनुवाद प्रणाली पर कई वर्षों से कार्य कर रहे हैं। सी-डैक, पुणे द्वारा विकसित किए गए 'मंत्रा' साफ्टवेयर की सहायता से भारतीय संसद की राज्य सभा में कुछ वर्षों से अनुवाद कार्य किया जा रहा है। हिन्दी में मशीन ट्रांसलेशन सिस्टम के मेरे अब तक के अनुभव के आधार पर मैं यह कहूँगा कि यदि भारत में इस क्षेत्र में हो रहे विभिन्न अनुसंधान एवं विकास परियोजनाओं के बीच तालमेल और सहयोग हो तो यह क्षेत्र बहुत तेजी से विकसित हो सकेगा और कंप्यूटर के जरिए हिन्दी के प्रयोग को बढ़ावा देने में अभूतपूर्व सफलता हासिल हो सकेगी।

    By Blogger Srijan Shilpi, at 1:52 PM  

  • Cool blog, interesting information... Keep it UP »

    By Anonymous Anonymous, at 9:18 AM  

  • this is really intersting

    By Anonymous Anonymous, at 9:32 PM  

  • बढ़िया चीज है ये तो भैय्या

    By Anonymous Anonymous, at 8:59 AM  

  • hello blog ji
    its really helpfull.
    but i want such dictionary where i can get english to hindi word.
    for example Science in hindi we say vigyan but i want science in written in hindi. i hope you have understood. kindly let me know you have this thing. or where i can get.
    i will thankfull to you.

    jatin

    By Anonymous Anonymous, at 8:07 AM  

  • Your dictionary is really helpfull.
    you have this dictionary in book form? is it available in market?

    jatin

    By Anonymous jatin, at 8:12 AM  

  • Hello blog ji
    i want to get scientific dictionary where i can search all scientific words.

    jatin

    By Anonymous Anonymous, at 8:27 AM  

  • You people have really developed a great thing.

    By Anonymous Anonymous, at 10:12 AM  

  • S.K.Pandey from IICT, Bhadohi: You have developed a great thing

    By Anonymous Anonymous, at 10:13 AM  

  • Thanks for this great acheivement. REaly this is tremendous development for HIndi Sahitya. This would be very help ful for the people of India to learn this language who are away from this.

    Umakant Srivastava, IICT, Bhadohi

    By Anonymous Anonymous, at 10:33 AM  

Post a Comment

<< Home