शुक्रवार, जुलाई 21, 2006

आईआईटी-मुंबई का कमाल 'हिंदी शब्दतंत्र'

इंटरनेट में अचानक ही कई बेजोड़ चीज़ें मिल जाती हैं. ऐसी ही एक बेजोड़ चीज़ है- हिंदी शब्दतंत्र और उसी से जुड़ा बेहतरीन हिंदी शब्दकोश.

जैसा कि हमारी सरकारी एजेंसियों के अधिकतर अच्छे कामों के बारे में होता आया है, हिंदी शब्दतंत्र के बारे में भी ढंग से कोई प्रचार नहीं किया गया. कुछ वैज्ञानिक गोष्ठियों में इस पर चर्चा ज़रूर हुई होगी.

थोड़ी छानबीन के बाद पता चला कि हिंदी शब्दतंत्र और कुछ नहीं बल्कि भविष्य के एक चमत्कार का आधारभूत ढाँचा है. आने वाले वर्षों में जब एक भाषा से दूसरे में ढंग का मशीनी अनुवाद संभव हो पाएगा, तब हम हिंदी शब्दतंत्र के महत्व को ठीक से समझ सकेंगे.

ज़्यादा तकनीकी ब्यौरे में नहीं जाते हुए बताया जाए तो शब्दतंत्र या WORDNET भाषा और कंप्यूटर प्रोग्राम का ऐसा सुमेल है, जो कि एक भाषा के माल को दूसरी भाषा में ढालने का कारखाना साबित हो सकता है. भारत जैसे बहुभाषी राष्ट्र में ये कितना उपयोगी साबित हो सकता है, इसकी सहज कल्पना भी संभव नहीं है.

शब्दतंत्र को बाकी मशीनी शब्दकोशों से इस मामले में अलग माना जा सकता है कि यह सिर्फ़ पारिभाषिक अर्थों पर नहीं, बल्कि शब्द विशेष के विभिन्न उपयोगों पर भी गौर फ़रमाता है. कंप्यूटर किसी शब्द का इतना वास्तविक वर्गीकरण SYNSET के सिद्धांत पर करता है. SYNSET यानि a set of one or more synonyms, मतलब समानार्थक शब्दों का वर्ग या मुद्रिका.

आइए हिंदी शब्दतंत्र में एक शब्द 'आम' के उदाहरण के ज़रिए SYNSET के कमाल को देखते हैं.


आम...

Noun(2)
(R) आम, रसाल, आम्र, अंब, अम्ब - एक फल जो खाया या चूसा जाता है "तोता पेड़ पर बैठकर आम खा रहा है / शास्त्रों ने आम को इंद्रासनी फल की संज्ञा दी है"
(R) आम, आम वृक्ष, पिकप्रिय, पिकदेव, पिकबंधु, पिकबन्धु, पिकबंधुर, पिकबन्धुर, पिकराग - एक बड़ा पेड़ जिसके फल खाए या चूसे जाते हैं "आम की लकड़ी का उपयोग साज-सज्जा की वस्तुएँ बनाने में किया जाता है"

Adjective(2)
(R) सामान्य, आम, साधारण, कामचलाऊ, मामूली, अविशिष्ट, अविशेष, अदिव्य - जिसमें कोई विशेषता न हो या अच्छे से कुछ हल्के दरज़े का "यह सामान्य साड़ी है"
(R) सामूहिक, आम, सार्वजनिक, सामुदायिक, सामान्य - प्रायः सभी व्यक्तियों,अवसरों,अवस्थाओं आदि में पाया जानेवाला या उनसे संबंध रखनेवाला "साक्षरता पर विचार-विमर्श हेतु एक सामूहिक सभा का आयोजन किया गया"

ऊपरोक्त विवरण में हरे में है समानार्थक शब्दों का समूह, नीले में है परिभाषा और बैंगनी में है वाक्य के रूप में उदाहरण.

आज 22 जुलाई 2006 की बात करें तो हिंदी शब्दतंत्र में 47076 अलग-अलग शब्द, और 22469 SYNSETs हैं.

मुंबई के भारतीय प्रौद्योगिकी संस्थान के भारतीय भाषा प्रौद्योगिकी केन्द्र ने हिंदी शब्दतंत्र का विकास किया है. इसका आधार प्रिंसटन विश्वविद्यालय के वर्डनेट को माना जा सकता है. जहाँ तक मुझे पता चला है शब्दतंत्र के विकास में ढाई साल लगे और इसी साल दो अप्रैल को आईआईटी-मुंबई में ही एक वैज्ञानिक संगोष्ठी में इसका लोकार्पण किया गया. आईआईटी-मुंबई ने हिंदी के साथ ही मराठी भाषा के लिए भी मराठी शाब्दबंध नाम से एक शब्दतंत्र का विकास किया है.

बात यहीं पर आकर अटक नहीं जाती आईआईटी-मुंबई के विशेषज्ञों ने एक बेहतरीन शब्दकोश भी बना डाला है. इसमें अंग्रेज़ी-हिंदी के अलावा हिंदी-अंग्रेज़ी में भी शब्दों के अर्थ देखने की सुविधा है. यूनीवर्सल वर्ड- हिंदी लेक्सिकन नामक यह शब्दकोश कई विशेषताएँ लिए हैं. मसलन EXACT के साथ-साथ LIKE श्रेणी में भी अर्थ ढूँढने की सुविधा. और आपने LIKE श्रेणी में अर्थ ढूँढे तो शब्द से जुड़े मुहावरे भी सामने आ सकते हैं. इसी तरह यहाँ हिंदी टंकण के लिए झंझटमुक्त की-बोर्ड की भी व्यवस्था की गई है.

शब्दतंत्र और शब्दकोश दोनों विकास की अवस्था में हैं. इसलिए हमारी राय आईआईटी-मुंबई के विशेषज्ञों के लिए ख़ास महत्व रखती है. शब्दकोश पर मैंने भी एक सलाह दी कि वैसी व्यवस्था ज़रूर की जाए जिसमें पूरा शब्द टाइप करने की ज़रूरत नहीं हो. यानि दो-तीन मात्राएँ टाइप करते ही संभावित शब्दों के विकल्प सामने आ जाएँ, जिनमें से इच्छित पर क्लिक करने मात्र से ही काम बन जाए.

हमलोगों में से कई लोग कंप्यूटर के महारथी और सच्चे अर्थों में हिंदी सेवी हैं. आप महानुभावों से अनुरोध है कि आईआईटी-मुंबई के कर्मयोगियों को अपनी सलाह उपलब्ध कराने की कृपा करें.

15 टिप्‍पणियां:

आलोक ने कहा…

बढ़िया चीज़ बताई आपने।

अनुनाद सिंह ने कहा…

इनका अस्तित्व बहुत दिनो से है, किन्तु अब इनका काफी सुधार हो गया है और काफी उन्नत हो गयी हैं|

अनूप शुक्ला ने कहा…

इस बहुत अच्छे प्रयास में बहुत कुछ जोड़ा जाना बाकी है।आप कृपया इनको लिखें कि शब्द सम्पदा के लिये अरविंद कुमार की हिंदी थिसारस ,जो उनकी सालों की पारिवारिक मेहनत से तैयार हुआ, से सहयोग लें।

आशीष ने कहा…

हिन्दी ब्लागर जी,

मै एक हिन्दी वर्तनी जांचक उपकरण पर काम कर रहा हूं। काम पूरा हो गया है लेकिन मेरे पास अच्छा शब्द्कोष नही है।
मेरी जरूरत ऐसी है कि
१.शब्दकोष मे हर पंक्ति पर एक शब्द हो।शब्द अक्षरो की सख्या के आधार पर समुह मे हो।
जैसे एक अक्षर वाले शब्द पहले , उसके बाद दो अक्षर वाले।
२. ये समुह अपने वर्णानुक्रम मे हों।

मुझे एक अच्छा शब्द्कोष मिल जाये तो मै उसे उपरोक्त समुह और अनुक्रम के अनुसार व्यवस्थित कर लुंगा।

आप की जानकारी मे ऐसा कोई शब्द्कोष हो मुझे बतायें। मेरा मेल पता है ash डाट shri जीमेल डाट काम
धन्यवाद

बेनामी ने कहा…

महाशय हिन्दी भाषा और साहित्य के लिए आपका यह कार्य अति महत्वपूर्ण है। इस कार्य के लिए आप " मानक हिन्दी कोश" जो कि पाँच भागों मे है "हिन्दी साहित्य सम्मेलन प्रयाग " ने इसे प्रकाशित किया है। यह बहुत ही अच्छा और प्रामाणिक हिन्दी शब्द कोश है।
डॉ॰ जगदीश व्योम

Srijan Shilpi ने कहा…

सी-डैक, पुणे और सी-डैक, नोएडा भी मशीनी अनुवाद प्रणाली पर कई वर्षों से कार्य कर रहे हैं। सी-डैक, पुणे द्वारा विकसित किए गए 'मंत्रा' साफ्टवेयर की सहायता से भारतीय संसद की राज्य सभा में कुछ वर्षों से अनुवाद कार्य किया जा रहा है। हिन्दी में मशीन ट्रांसलेशन सिस्टम के मेरे अब तक के अनुभव के आधार पर मैं यह कहूँगा कि यदि भारत में इस क्षेत्र में हो रहे विभिन्न अनुसंधान एवं विकास परियोजनाओं के बीच तालमेल और सहयोग हो तो यह क्षेत्र बहुत तेजी से विकसित हो सकेगा और कंप्यूटर के जरिए हिन्दी के प्रयोग को बढ़ावा देने में अभूतपूर्व सफलता हासिल हो सकेगी।

बेनामी ने कहा…

Cool blog, interesting information... Keep it UP »

बेनामी ने कहा…

this is really intersting

बेनामी ने कहा…

बढ़िया चीज है ये तो भैय्या

बेनामी ने कहा…

hello blog ji
its really helpfull.
but i want such dictionary where i can get english to hindi word.
for example Science in hindi we say vigyan but i want science in written in hindi. i hope you have understood. kindly let me know you have this thing. or where i can get.
i will thankfull to you.

jatin

jatin ने कहा…

Your dictionary is really helpfull.
you have this dictionary in book form? is it available in market?

jatin

बेनामी ने कहा…

Hello blog ji
i want to get scientific dictionary where i can search all scientific words.

jatin

बेनामी ने कहा…

You people have really developed a great thing.

बेनामी ने कहा…

S.K.Pandey from IICT, Bhadohi: You have developed a great thing

बेनामी ने कहा…

Thanks for this great acheivement. REaly this is tremendous development for HIndi Sahitya. This would be very help ful for the people of India to learn this language who are away from this.

Umakant Srivastava, IICT, Bhadohi