Thursday, March 29, 2007

तकनीक लोगों के लिए

वर्ल्ड इकोनॉमिक फ़ोरम ने 2006-07 के लिए वैश्विक सूचना तकनीक रिपोर्ट जारी कर दी है. यह रिपोर्ट विश्व के 122 देशों के लिए 'नेटवर्क तैयारी सूचकांक' (NRI) बताती है जो कि 3 घटक सूचकांकों से बना है -
1) देश या समाज द्वारा उपलब्ध कराया गया 'सूचना और संवाद तकनीक' (ICT) का माहौल
2) समाज के प्रमुख हिस्सेदारों की तैयारी (जनता, व्यापार, सरकार)
3) इन हिस्सेदारों में सूचना और संवाद तकनीक का प्रयोग

तो ख़बर यह है कि अमेरिका तकनीकी सिरमौर नहीं रहा. बल्कि आस-पास भी नहीं. पिछले साल के पहले से अब वह सीधे 7वें स्थान पर आ गया है. और अपने आप को आइटी महाशक्ति समझने वाला भारत 44वें स्थान पर है, पिछले साल से 4 स्थान नीचे.

यह रहे शीर्ष 10 देश, ख़ासकर उनके लिए जो कहते हैं अँग्रेज़ी में शिक्षा के बिना तकनीकी तरक्की संभव नहीं.

1. डेनमार्क
2. स्वीडन
3. सिंगापुर
4. फ़िनलैंड
5. स्विटज़रलैंड
6. नीदरलैंड्स
7. अमेरिका
8. आइसलैंड
9. यूके
10. नॉर्वे

भाषा के संदर्भ में ये आँकड़े अगर कुछ बताते हैं तो यह कि तकनीक को हर एक तक पहुँचाने के लिए तकनीक का स्थानीयकरण ज़रूरी है. हमारे यहाँ नीति उल्टी तरफ़ से चल रही दिखती है. हम लोगों का विदेशीकरण करने में लगे हैं.

Monday, March 26, 2007

आज मेरी क़िस्मत अच्छी है

अगर आपने गूगल का हिंदी खोजक इस्तेमाल किया हो तो आपकी नज़र उस बटन पर ज़रूर पड़ी होगी जो कहता है - 'आज मेरी क़िस्मत अच्छी है'. अगर आप कुछ लिखकर 'खोज' की बजाय यह बटन दबाते हैं तो गूगल सीधा आपको सबसे संगत परिणाम (यानि जो परिणाम पृष्ठ पर सबसे ऊपर हो) की साइट पर भेज देता है.

करीब 5-6 साल पहले जब मैंने गूगल के जुमले "I'm Feeling Lucky" का यह अनुवाद किया था तब हिंदी खोज की दुनिया बिल्कुल सुनसान थी. स्वामित्वधारी फ़ॉण्टों पर बनी कुछ हिंदी साइटें चल रही थीं और उनमें खोज पाने की तरकीब किसी के पास नहीं थी. बीबीसी हिंदी के अलावा कोई प्रमुख साइट यूनिकोड में नहीं थी. गूगल ख़ुद भी यूनिकोड समर्थन के साथ प्रयोग ही कर रहा था और नतीजतन यह अनुवाद भी मुझे रोमन लिपि (आइट्रांस) में करना पड़ा था.

तब से अब तक इंटरनेट पर हिंदी की गंगा में बहुत बाइट्स बह चुके हैं. ऐसे खोज इंजन उपलब्ध हैं जो न केवल यूनिकोड बल्कि सभी मुख्य हिंदी कूटकरणों को पहचान सकते हैं और उन्हें सूचीकृत या इंडेक्स कर सकते हैं. और सबसे बड़ी बात जिसका ज़िक्र मैंने कुछ दिन पहले किया था कि अब ढूँढ़ने को भी बहुत कुछ है.

इस समय छह ऐसी हिंदी खोज साइटें हैं जो अपना खोज इंजन (खोजक) इस्तेमाल करती हैं - गूगल, लाइव (या एमएसएन), याहू, भ्रमर, रफ़्तार, और गुरूजी. आइए इन हिंदी खोजकों द्वारा उपलब्ध कराई जा रही सुविधाओं और इनके तकनीकी परिमाणों पर एक तुरत तुलनात्मक नज़र डालें.

हिंदी टाइप सुविधा
गूगल - नहीं
लाइव - नहीं
याहू - नहीं
भ्रमर - नहीं
रफ़्तार - हाँ
गुरूजी - हाँ
-
हालाँकि धीरे धीरे यह सुविधा अप्रासंगिक होती जाएगी, इस वक़्त इसके बड़े फ़ायदे हैं. दुख की बात यह कि जहाँ यह सुविधा उपलब्ध है वहाँ भी फ़ायरफ़ॉक्स पर काम नहीं करती.

वर्तनी सुझाव
गूगल - नहीं
लाइव - नहीं
याहू - नहीं
भ्रमर - नहीं
रफ़्तार - हाँ
गुरूजी - हाँ

प्रति संचय
गूगल - हाँ
लाइव - हाँ
याहू - हाँ
भ्रमर - नहीं
रफ़्तार - हाँ
गुरूजी - हाँ

ग़ैर-यूनिकोड सूचन (इंडेक्सिंग)
गूगल - हाँ
लाइव - हाँ
याहू - हाँ
भ्रमर - नहीं
रफ़्तार - हाँ
गुरूजी - हाँ
-
भ्रमर के अलावा सभी खोजक अब अयूनिकोडित सामग्री को सूचीबद्ध करने में समर्थ हैं

हिंदी अंतरपटल
गूगल - हाँ
लाइव - हाँ
याहू - नहीं
भ्रमर - हाँ
रफ़्तार - हाँ
गुरूजी - हाँ
-
यह एक आवश्यक परिमाण है और एक तर्क हो सकता है कि याहू को इस वजह से हिंदी का खोजक माना ही न जाए.

सूचक आकार (नमूना खोजशब्द - "हिन्दी")
गूगल - 6430 हज़ार
लाइव - 356 हज़ार
याहू - 418 हज़ार
भ्रमर - 98
रफ़्तार - 96 हज़ार
गुरूजी - 62 हज़ार
-
सूचीबद्ध पन्नों की संख्या एक बहुत महत्वपूर्ण मानदंड है. यहाँ गूगल स्पष्ट रूप से बहुत आगे है. और भ्रमर लगभग इस दौड़ से बाहर ही हो गया है.

तेज़ी (नमूना खोजशब्द - "हिन्दी")
गूगल - 0.018 सेकेंड/हज़ार-शब्द
लाइव - (खोजसमय अनुपलब्ध)
याहू - 0.21 सेकेंड/हज़ार-शब्द
भ्रमर - (सूचक बहुत छोटा)
रफ़्तार - 1.875 सेकेंड/हज़ार-शब्द
गुरूजी - (खोजसमय अनुपलब्ध)
-
लाइव और गुरुजी के लिए हालाँकि खोज समय आँकड़े उपलब्ध नहीं है, पर वे काफ़ी तेज़ दिखाई देते हैं. गूगल सबसे तेज़ है और लाइव उससे बहुत पीछे नहीं.

ये कुछ महत्वपूर्ण परिमाण थे और एक सरसरी नज़र बताती है कि गूगल हिंदी खोज में भी नम्बर 1 है. पर साथ ही यह भी कि गुरुजी जैसे भारतीय खोजक उन बातों में बेहतर हैं जो एक हिन्दीभाषी के लिए महत्वपूर्ण साबित हो सकती हैं.

पर जो बात सबसे अच्छे खोजक को बाक़ियों से अलग करेगी वह है परिणामों की संगतता. इसके लिए बड़ा सूचक (इंडेक्स) होना महत्वपूर्ण है पर उससे भी ज़्यादा ज़रूरी है खोज एल्गॉरिद्म - वह फ़ॉर्मूला जो किसी परिणाम को ऊपर दिखाता है और किसी को नीचे. और किसी को सबसे ऊपर. मुझे इस समय गूगल इस मामले में सबसे आगे दिखता है, पर बेहतर होगा कि आप इसे ख़ुद मापें. तो जब जब कुछ खोजने पर आपको इच्छित परिणाम सबसे ऊपर दिखाई दे, बोलिए आज मेरी क़िस्मत अच्छी है. और आप जल्दी ही अपनी पसंद का इंजन पा जाएँगे.

Wednesday, March 21, 2007

RMIM पुरस्कार घोषित

करीब महीने भर चली नामांकन और अंकन प्रक्रिया के बाद वर्ष 2006 के RMIM पुरस्कार सामने हैं।

ओमकारा को 'साल का एल्बम' चुना गया है. विवरण और अन्य श्रेणियाँ पुरस्कार वेबसाइट पर देखे जा सकते हैं।

प्रक्रिया में हिस्सा लेने वाले वोटरों और अन्य तमाम सहयोगियों का धन्यवाद।

Wednesday, March 14, 2007

वेब पर हिंदी - एक दो तीन होने की तैयारी

वेब पर हिंदी सामग्री अब उस अवस्था में पहुँच गई है जिसे अंग्रेज़ी में 'क्रिटिकल मास' कहा जाता है. और पिछले कुछ महीने इसमें बहुत मददगार रहे हैं (यूँ वेब पर महीने सालों के बराबर होते हैं). इस अर्से में हिंदी में उपलब्ध साइटों, सुविधाओं, और जानकारी में अभूतपूर्व वृद्धि हुई है. कुछ मुख्य उदाहरण देखें, जिनमें से कई तो पिछले महीने में ही जारी हुए हैं:

इनके अलावा पुराने चिट्ठों और साइटों पर भी सामग्री तेज़ी से बढ़ रही है.

यानि वह समय आ गया है जब हिंदी सामग्री बुकमार्कों से उफन कर बाहर निकल रही है और सर्च इंजनों की दरकार महसूस होने लगी है. कंटेंट निर्माण के साथ साथ विकेंद्रीकरण भी बढ़ रहा है जो कि न केवल विविधता के लिए अच्छा है बल्कि इंटरनेट के मूल चरित्र के पास भी है, और इसीलिए अवश्यंभावी भी. अच्छे खोजक इस चरित्र को विकसित करने में काफ़ी सहायक होते हैं.

यूनिकोड अब वेब पर हिंदी सामग्री के लिए वैसा ही मानक बन चुका है जैसा अंग्रेज़ी के लिए ASCII है. लगभग सभी नई साइटें इसी कूटकरण में बन रही हैं. पुरानी साइटों को इसमें बदला जा रहा है (मसलन एनआइसी की बनाई साइटें और अभिव्यक्ति-अनुभूति). और जो साइटें अपने स्वामित्वधारी फ़ॉण्ट इस्तेमाल कर रही हैं (उदा. दैनिक जागरण, दैनिक भास्कर), वे भी अब बड़ी आसानी से ऑन-द-फ़्लाई (हाथों-हाथ) यूनिकोड में बदली जा सकती हैं. सर्च इंजन भी इन्हें खोज पा रहे हैं. कुल मिलाकर अब इस सिलसिले में मानक कोई बाधा नहीं रहा है.

इस अवस्था के बाद खोजकों का योगदान महत्वपूर्ण हो जाता है. ये हिंदी के प्रयोक्ता के लिए तो जीवन आसान बनाएँगे ही, इनके जरिये अपनी सामग्री तक आसान पहुँच व्यापारों, संस्थाओं, और संगठनों को भी हिंदी में साइटें बनाने के लिए प्रेरित करेंगी. जहाँ प्रयोक्ता और प्रस्तोता दोनों एक दूसरे को संपुष्ट करेंगे, खोजकों की भूमिका एक महत्वपूर्ण उत्प्रेरक की होगी. और इसीलिये अच्छे हिंदी खोजकों की ज़रूरत बहुत बढ़ जाती है.

गूगल ने अपनी हिंदी खोज में हाल में सुधार किए हैं और नया इंजन गुरूजी भी बड़ी जल्दी लोकप्रिय हो रहा है. इसके अलावा इस क्षेत्र में शुरुआती कदम उठाने वाला रफ़्तार भी लगातार दौड़ में है. ये सभी बहुत अच्छे प्रयास हैं. और हालाँकि हिंदी सर्च की एल्गॉरिद्म को अभी काफ़ी आगे जाना है, वेब पर कहीं भी उड़ने और गुम न होने की आज़ादी अब हिंदी टेक्स्ट के पास है. तो कमर कस लीजिए, यहाँ से सफ़र तेज़ होने वाला है.