जैसा कि हमारी सरकारी एजेंसियों के अधिकतर अच्छे कामों के बारे में होता आया है, हिंदी शब्दतंत्र के बारे में भी ढंग से कोई प्रचार नहीं किया गया. कुछ वैज्ञानिक गोष्ठियों में इस पर चर्चा ज़रूर हुई होगी.
थोड़ी छानबीन के बाद पता चला कि हिंदी शब्दतंत्र और कुछ नहीं बल्कि भविष्य के एक चमत्कार का आधारभूत ढाँचा है. आने वाले वर्षों में जब एक भाषा से दूसरे में ढंग का मशीनी अनुवाद संभव हो पाएगा, तब हम हिंदी शब्दतंत्र के महत्व को ठीक से समझ सकेंगे.
ज़्यादा तकनीकी ब्यौरे में नहीं जाते हुए बताया जाए तो शब्दतंत्र या WORDNET भाषा और कंप्यूटर प्रोग्राम का ऐसा सुमेल है, जो कि एक भाषा के माल को दूसरी भाषा में ढालने का कारखाना साबित हो सकता है. भारत जैसे बहुभाषी राष्ट्र में ये कितना उपयोगी साबित हो सकता है, इसकी सहज कल्पना भी संभव नहीं है.
शब्दतंत्र को बाकी मशीनी शब्दकोशों से इस मामले में अलग माना जा सकता है कि यह सिर्फ़ पारिभाषिक अर्थों पर नहीं, बल्कि शब्द विशेष के विभिन्न उपयोगों पर भी गौर फ़रमाता है. कंप्यूटर किसी शब्द का इतना वास्तविक वर्गीकरण SYNSET के सिद्धांत पर करता है. SYNSET यानि a set of one or more synonyms, मतलब समानार्थक शब्दों का वर्ग या मुद्रिका.
आइए हिंदी शब्दतंत्र में एक शब्द 'आम' के उदाहरण के ज़रिए SYNSET के कमाल को देखते हैं.
ऊपरोक्त विवरण में हरे में है समानार्थक शब्दों का समूह, नीले में है परिभाषा और बैंगनी में है वाक्य के रूप में उदाहरण.आम...
Noun(2)
(R) आम, रसाल, आम्र, अंब, अम्ब - एक फल जो खाया या चूसा जाता है "तोता पेड़ पर बैठकर आम खा रहा है / शास्त्रों ने आम को इंद्रासनी फल की संज्ञा दी है"
(R) आम, आम वृक्ष, पिकप्रिय, पिकदेव, पिकबंधु, पिकबन्धु, पिकबंधुर, पिकबन्धुर, पिकराग - एक बड़ा पेड़ जिसके फल खाए या चूसे जाते हैं "आम की लकड़ी का उपयोग साज-सज्जा की वस्तुएँ बनाने में किया जाता है"
Adjective(2)
(R) सामान्य, आम, साधारण, कामचलाऊ, मामूली, अविशिष्ट, अविशेष, अदिव्य - जिसमें कोई विशेषता न हो या अच्छे से कुछ हल्के दरज़े का "यह सामान्य साड़ी है"
(R) सामूहिक, आम, सार्वजनिक, सामुदायिक, सामान्य - प्रायः सभी व्यक्तियों,अवसरों,अवस्थाओं आदि में पाया जानेवाला या उनसे संबंध रखनेवाला "साक्षरता पर विचार-विमर्श हेतु एक सामूहिक सभा का आयोजन किया गया"
आज 22 जुलाई 2006 की बात करें तो हिंदी शब्दतंत्र में 47076 अलग-अलग शब्द, और 22469 SYNSETs हैं.
मुंबई के भारतीय प्रौद्योगिकी संस्थान के भारतीय भाषा प्रौद्योगिकी केन्द्र ने हिंदी शब्दतंत्र का विकास किया है. इसका आधार प्रिंसटन विश्वविद्यालय के वर्डनेट को माना जा सकता है. जहाँ तक मुझे पता चला है शब्दतंत्र के विकास में ढाई साल लगे और इसी साल दो अप्रैल को आईआईटी-मुंबई में ही एक वैज्ञानिक संगोष्ठी में इसका लोकार्पण किया गया. आईआईटी-मुंबई ने हिंदी के साथ ही मराठी भाषा के लिए भी मराठी शाब्दबंध नाम से एक शब्दतंत्र का विकास किया है.
बात यहीं पर आकर अटक नहीं जाती आईआईटी-मुंबई के विशेषज्ञों ने एक बेहतरीन शब्दकोश भी बना डाला है. इसमें अंग्रेज़ी-हिंदी के अलावा हिंदी-अंग्रेज़ी में भी शब्दों के अर्थ देखने की सुविधा है. यूनीवर्सल वर्ड- हिंदी लेक्सिकन नामक यह शब्दकोश कई विशेषताएँ लिए हैं. मसलन EXACT के साथ-साथ LIKE श्रेणी में भी अर्थ ढूँढने की सुविधा. और आपने LIKE श्रेणी में अर्थ ढूँढे तो शब्द से जुड़े मुहावरे भी सामने आ सकते हैं. इसी तरह यहाँ हिंदी टंकण के लिए झंझटमुक्त की-बोर्ड की भी व्यवस्था की गई है.
शब्दतंत्र और शब्दकोश दोनों विकास की अवस्था में हैं. इसलिए हमारी राय आईआईटी-मुंबई के विशेषज्ञों के लिए ख़ास महत्व रखती है. शब्दकोश पर मैंने भी एक सलाह दी कि वैसी व्यवस्था ज़रूर की जाए जिसमें पूरा शब्द टाइप करने की ज़रूरत नहीं हो. यानि दो-तीन मात्राएँ टाइप करते ही संभावित शब्दों के विकल्प सामने आ जाएँ, जिनमें से इच्छित पर क्लिक करने मात्र से ही काम बन जाए.
हमलोगों में से कई लोग कंप्यूटर के महारथी और सच्चे अर्थों में हिंदी सेवी हैं. आप महानुभावों से अनुरोध है कि आईआईटी-मुंबई के कर्मयोगियों को अपनी सलाह उपलब्ध कराने की कृपा करें.
15 टिप्पणियां:
बढ़िया चीज़ बताई आपने।
इनका अस्तित्व बहुत दिनो से है, किन्तु अब इनका काफी सुधार हो गया है और काफी उन्नत हो गयी हैं|
इस बहुत अच्छे प्रयास में बहुत कुछ जोड़ा जाना बाकी है।आप कृपया इनको लिखें कि शब्द सम्पदा के लिये अरविंद कुमार की हिंदी थिसारस ,जो उनकी सालों की पारिवारिक मेहनत से तैयार हुआ, से सहयोग लें।
हिन्दी ब्लागर जी,
मै एक हिन्दी वर्तनी जांचक उपकरण पर काम कर रहा हूं। काम पूरा हो गया है लेकिन मेरे पास अच्छा शब्द्कोष नही है।
मेरी जरूरत ऐसी है कि
१.शब्दकोष मे हर पंक्ति पर एक शब्द हो।शब्द अक्षरो की सख्या के आधार पर समुह मे हो।
जैसे एक अक्षर वाले शब्द पहले , उसके बाद दो अक्षर वाले।
२. ये समुह अपने वर्णानुक्रम मे हों।
मुझे एक अच्छा शब्द्कोष मिल जाये तो मै उसे उपरोक्त समुह और अनुक्रम के अनुसार व्यवस्थित कर लुंगा।
आप की जानकारी मे ऐसा कोई शब्द्कोष हो मुझे बतायें। मेरा मेल पता है ash डाट shri जीमेल डाट काम
धन्यवाद
महाशय हिन्दी भाषा और साहित्य के लिए आपका यह कार्य अति महत्वपूर्ण है। इस कार्य के लिए आप " मानक हिन्दी कोश" जो कि पाँच भागों मे है "हिन्दी साहित्य सम्मेलन प्रयाग " ने इसे प्रकाशित किया है। यह बहुत ही अच्छा और प्रामाणिक हिन्दी शब्द कोश है।
डॉ॰ जगदीश व्योम
सी-डैक, पुणे और सी-डैक, नोएडा भी मशीनी अनुवाद प्रणाली पर कई वर्षों से कार्य कर रहे हैं। सी-डैक, पुणे द्वारा विकसित किए गए 'मंत्रा' साफ्टवेयर की सहायता से भारतीय संसद की राज्य सभा में कुछ वर्षों से अनुवाद कार्य किया जा रहा है। हिन्दी में मशीन ट्रांसलेशन सिस्टम के मेरे अब तक के अनुभव के आधार पर मैं यह कहूँगा कि यदि भारत में इस क्षेत्र में हो रहे विभिन्न अनुसंधान एवं विकास परियोजनाओं के बीच तालमेल और सहयोग हो तो यह क्षेत्र बहुत तेजी से विकसित हो सकेगा और कंप्यूटर के जरिए हिन्दी के प्रयोग को बढ़ावा देने में अभूतपूर्व सफलता हासिल हो सकेगी।
Cool blog, interesting information... Keep it UP »
this is really intersting
बढ़िया चीज है ये तो भैय्या
hello blog ji
its really helpfull.
but i want such dictionary where i can get english to hindi word.
for example Science in hindi we say vigyan but i want science in written in hindi. i hope you have understood. kindly let me know you have this thing. or where i can get.
i will thankfull to you.
jatin
Your dictionary is really helpfull.
you have this dictionary in book form? is it available in market?
jatin
Hello blog ji
i want to get scientific dictionary where i can search all scientific words.
jatin
You people have really developed a great thing.
S.K.Pandey from IICT, Bhadohi: You have developed a great thing
Thanks for this great acheivement. REaly this is tremendous development for HIndi Sahitya. This would be very help ful for the people of India to learn this language who are away from this.
Umakant Srivastava, IICT, Bhadohi
एक टिप्पणी भेजें