Author : Sam Neufeld

Published on Aug 13, 2021 Updated 0 Hours ago

स्टार्टअप्स में एआई इनोवेशन करने वालों, घरेलू और बहुराष्ट्रीय कंपनियों से बात करके यह समझना होगा कि ओपन डेटा इकोसिस्टम से वे क्या चाहते हैं.

सामाजिक और आर्थिक लक्ष्यों को हासिल करने में, एआई तक़नीक के ज़रिये ओपन गर्वमेंट डेटा का इस्तेमाल

आर्टिफिशियल इंटेलिजेंस (एआई) यानी कृत्रिम मेधा पर भारत सरकार के पहले सम्मेलन रेज 2020 में यह स्पष्ट हो गया कि विकास और सामाजिक-आर्थिक लक्ष्यों को तेज़ी से हासिल करने में इस तक़नीक से कितनी मदद मिल सकती है. इससे लक्ष्य तक पहुंचने की प्रक्रिया तो तेज़ होती ही है, इसके साथ बेहतर नतीजे भी हासिल होते हैं. नेचर और मैकिंजी ग्लोबल इंस्टिट्यूट ने जो शोध प्रकाशित किए हैं, उनसे पता चला है कि एआई की मदद से संयुक्त राष्ट्र के 17 सतत विकास लक्ष्यों (SDGs) के तहत तय किए गए 100 से अधिक परिणाम हासिल करने में काफ़ी बेहतरी आ सकती है. शोध से यह भी पता चला कि एआई आधारित तकनीक की मदद लेने पर इस उद्देश्य में काफी प्रगति हुई. 

हालांकि, जनता की भलाई के लिए खेती, स्वास्थ्य और शिक्षा जैसे क्षेत्रों में एआई आधारित तकनीक का इस्तेमाल इस बात पर निर्भर करता है कि इसके लिए ज़रूरी डेटा उपलब्ध हैं या नहीं. अगर सामाजिक रूप से असर डालने वाले डेटा उपलब्ध हों और उनकी गुणवत्ता अच्छी हो, उन्हें मशीनें पढ़ सकें तो जनता की भलाई के लिए एआई का घरेलू स्तर पर विकास किया जा सकता है. ऑटोनोमस एल्गोरिद्म (जिसे हम एआई कह रहे हैं) की ख़ातिर हमें संशोधित आंकड़ों की ज़रूरत होगी, जिनका इस्तेमाल फिर एनालिटिक्स, भविष्य के बारे में अनुमान लगाने वाली, निर्णयात्मक तकनीक में किया जा सकता है. आंकड़े जितने व्यापक और उच्च गुणवत्ता वाले होंगे और उनका इस्तेमाल जब किसी मॉडल में किया जाएगा तो एआई आधारित तकनीक उतनी ही सटीक, सक्षम और असरदार होगी. 

अभी हम एआई आधारित जिन तकनीकों के बारे में जानते हें, वे प्रोपराइटरी आंकड़ों पर आधारित हैं, जिन पर दिग्गज टेक्नोलॉजी कंपनियों और उनकी इकाइयों का कब्ज़ा है. इन कंपनियों के पास यूजर्स के व्यापक आंकड़े उपलब्ध हैं या वे इसे खरीदने के लिए बड़ी रकम का भुगतान कर सकती हैं.

अभी हम एआई आधारित जिन तकनीकों के बारे में जानते हें, वे प्रोपराइटरी आंकड़ों पर आधारित हैं, जिन पर दिग्गज टेक्नोलॉजी कंपनियों और उनकी इकाइयों का कब्ज़ा है. इन कंपनियों के पास यूजर्स के व्यापक आंकड़े उपलब्ध हैं या वे इसे खरीदने के लिए बड़ी रकम का भुगतान कर सकती हैं. इसके बाद इन आंकड़ों का इस्तेमाल वे अंदरूनी शोध और अनुसंधान कार्यों के लिए कर सकती हैं. हां, यह बात भी सही है कि ये कंपनियां तभी ऐसे शोध करेंगी, जब उन्हें इसकी मदद से अपने प्रतियोगियों से आगे बढ़ने का मौका मिले. दिग्गज टेकनोलॉजी कंपनियों के उलट उभरती हुई कंपनियों (स्टार्टअप्स) को अक्सर आंकड़े इकट्ठा करने, उन्हें खरीदने और फिर संशोधित या प्रोसेस करने में दिक्कत होती है. भारतीय स्टार्टअप्स, सरकारी एजेंसियों और निकायों के लिए सामाजिक कार्यों में एआई के इस्तेमाल में यही सबसे बड़ी बाधा है. 

ओपन गवर्नमेंट डेटा का दायरा और महत्व 

हर साल, केंद्र और राज्य सरकारें मिलकर स्वास्थ्य, खाद्य, बीमा, शिक्षा, कौशल विकास, आवास जैसी सुविधाओं और ईंधन पर सब्सिडी के रूप में 50 करोड़ से अधिक भारतीयों पर अरबों डॉलर खर्च करती हैं. इसके अलावा, वे ऊर्जा, बुनियादी ढांचा, परिवहन और पर्यावरण क्षेत्र में नीतियों के ज़रिये निर्णायक भूमिका निभाती हैं. इन कामकाज के दौरान वे असंख्य आंकड़े इकट्ठा करती हैं. अभी कृषि, ग्रामीण विकास, शिक्षा, प्रवास और ऊर्जा जैसे क्षेत्र में किसी अन्य पक्ष की तुलना में सरकार के पास सबसे अधिक आंकड़े हैं. इस मामले में कोई भी पक्ष उसके बहुत करीब तक नहीं फटक सकता. 

कई देशों में जहां टेक्नोलॉजी इकोसिस्टम काफी विकसित है, वहां स्टार्टअप्स आंकड़ों के लिए सरकार की मदद लेते हैं. सरकार ओपन डेटा प्लेटफॉर्म के ज़रिये उनकी यह जरूरत पूरी करती है. ऊपर जिन क्षेत्रों का ज़िक्र किया गया है, उनसे जुड़े आंकड़े सरकार स्टार्टअप्स को उपलब्ध कराती है, लेकिन भारत में सरकारी आंकड़े दूसरे पक्षों के लिए सीमित रूप में ही उपलब्ध हैं. अभी केंद्र सरकार अपने ओपन डेटा इनिशिएटिव ओपन गवर्नमेंट डेटा प्लेटफॉर्म पर सैकड़ों-हजारों तरह के आंकड़े मेंटेन करती है. हालांकि, इन आंकड़ों की गुणवत्ता ठीक नहीं है. इनके मेटाडेटा के मानकीकरण को लेकर भी दिक्कतें हैं और ये हाई-वैल्यू डेटा नहीं हैं. 

यह भी समझना होगा कि एआई परियोजनाओं पर करीब 80 प्रतिशत वक्त़ इनके लिए आंकड़े तैयार करने और इंजीनियरिंग संबंधी कार्यों पर ख़र्च होता है. इस वजह से एआई स्टार्टअप्स के लिए ओपन गवर्नमेंट डेटा प्लेटफॉर्म पर उपलब्ध आंकड़ों का इस्तेमाल चुनौतीपूर्ण हो जाता है. कुछ मामलों में भारत के तकनीकी जानकार कहीं अधिक विकसित देशों के मेच्योर ओपन डेटा प्रोग्राम की मदद लेते हैं. इसमें भी परेशानी आती है. इन देशों में डेमोग्राफी यानी आबादी की संरचना, सामाजिक-आर्थिक, बीमारियों से संबंधित और पर्यावरण संबंधी आंकड़े भारत से अलग होते हैं. इसलिए विविधता भरे भारत की ख़ातिर तैयार किए जाने वाले एआई मॉडलों में उन आंकड़ों का सीमित इस्तेमाल ही किया जा सकता है. 

कुछ मामलों में भारत के तकनीकी जानकार कहीं अधिक विकसित देशों के मेच्योर ओपन डेटा प्रोग्राम की मदद लेते हैं. इसमें भी परेशानी आती है. इन देशों में डेमोग्राफी यानी आबादी की संरचना, सामाजिक-आर्थिक, बीमारियों से संबंधित और पर्यावरण संबंधी आंकड़े भारत से अलग होते हैं.

ओपन गवर्नमेंट डेटा प्लेटफॉर्म के तहत उपलब्ध आंकड़ों की कमी नहीं है. इससे अलावा, केंद्र सरकार की एआई के लिए राष्ट्रीय रणनीति (NSAI) में दावा किया गया है कि ‘अलग-अलग मंत्रालयों के गोदामों में काफी आंकड़े हैं.’ अगर केंद्र और राज्य सरकारें सामाजिक रूप से असर डालने वाले उच्च-गुणवत्ता और मशीनों के पढ़ने लायक आंकड़े सार्वजनिक तौर पर उपलब्ध कराएं तो इससे सामाजिक कल्याण के लिए घरेलू स्तर पर एआई तैयार करने में मदद मिलेगी. यह सरकार की समाज आधारित यानी सामाजिक कार्यों के लिए एआई के इस्तेमाल की रणनीति से भी मेल खाती है. NSAI का मंत्र है, ‘सबके लिए एआई’, इसमें तकनीक की मदद से समावेशी विकास और कृषि, स्वास्थ्य और शिक्षा के क्षेत्र में प्रगति सुनिश्चित करने की बात कही गई है. 

केंद्र सरकार जल्द ही एआई के लिए राष्ट्रीय योजना लॉन्च करने की तैयारी कर रही है, जिसे एआई मिशन भी कहा जाता है. यह पहल NSAI के तहत की जाएगी, जिसका उद्देश्य देश के एआई इकोसिस्टम को बढ़ावा देना है. ऐसे में देश में ओपन डेटा को लेकर की गई पहल के रास्ते में जो भी अड़चनें आ रही हैं, उन्हें दूर करने के लिए सरकार, उद्योग और सिविल सोसायटी को साथ आना चाहिए. इसके साथ, उन्हें ओपन डेटा को बढ़ावा देने के लिए ऐसी पहल करनी चाहिए ताकि भारतीय स्टार्टअप्स, कंपनियां और अन्य लाभार्थी इसका अधिकतम फायदा उठा पाएं. 

ओपन डेटा के लिए खर्च बढ़ाना और सांस्थानिक क्षमता तैयार करना 

ओपन डेटा का तकनीकी पक्ष ऐसा है कि इसमें हर सरकारी संस्थान को आंकड़े जुटाने होंगे, उन्हें प्रोसेस और फिर पब्लिश करने का कार्य करना होगा. इसके लिए बेहद कुशल कर्मियों और पर्याप्त क्षमता की जरूरत पड़ेगी और परिष्कृत मानक या प्रक्रिया भी तय करने होंगे. अभी सरकारी कर्मचारियों को ओपन डेटा का काम अतिरिक्त जिम्मेदारी के तौर पर दिया गया है, जबकि कई बार ये लोग अपनी प्राथमिक जिम्मेदारियों में ही बहुत ज्यादा उलझे रहते हैं. इस क्षेत्र में अभी जो लोग काम कर रहे हैं, उनकी इन बंदिशों को देखते हुए सरकार को संबंधित संस्थानों की क्षमता बढ़ानी चाहिए. उन्हें अलग से बजट देकर हर सरकारी एजेंसी में इस काम के लिए डेटा मैनेजमेंट और ओपन डेटा कर्मियों की नियुक्तियां करनी चाहिए. जिस तरह से आईटी सिस्टम को नियमित देखभाल और रख़रखाव की ज़रूरत पड़ती है और उसके लिए कुशल कर्मचारियों की विशेष टीमें होती हैं. इसी तरह से संस्थानों में डेटा के लिए ऐसे कुशल कर्मचारी होने चाहिए, जो आंकड़े इकट्ठा और प्रोसेस करके उनसे खास डेटासेट तैयार कर सकें. अगर सरकारी संस्थानों में डेटा के लिए अलग से लोग रखे जाएंगे तो इससे नौकरशाही की अंदरूनी तौर पर आंकड़े रखने की क्षमता में बढ़ोतरी होगी और वे सार्वजनिक इस्तेमाल के लिए प्रासंगिक आंकड़े जारी कर पाएंगे. 

इसी तरह से, सरकार को मौजूदा ओपन डेटा कर्मचारियों की क्षमता बढ़ाने के लिए उनकी शिक्षा और प्रशिक्षण प्रोग्राम पर ख़र्च बढ़ाना चाहिए. अभी उन्हें जो प्रशिक्षण दिया जाता है, वह मिलने वाले आंकड़ों के बारे में निर्देश तक सीमित है. इसका दायरा बढ़ाकर इसमें तकनीकी कुशलता बढ़ाने के प्रशिक्षण को भी शामिल करना चाहिए. इसके साथ उन्हें यह भी बताया जाना चाहिए कि किसी खास संस्थान के लिए आंकड़े जुटाने की खातिर एक मानक प्रक्रिया क्या हो. इससे वे आंकड़े  जुटाने के साथ उनसे अलग-अलग डेटासेट तैयार कर पाएंगे. इससे उच्च गुणवत्ता वाले अधिक आंकड़ों और डेटासेट के पब्लिकेशन में मदद मिलेगी. इसके साथ क्षेत्र विशेष से जुड़ी निजता, सुरक्षा और गोपनीयता संबंधी जरूरतों को लेकर जागरूकता में भी बढ़ोतरी होगी. 

सरकार को मौजूदा ओपन डेटा कर्मचारियों की क्षमता बढ़ाने के लिए उनकी शिक्षा और प्रशिक्षण प्रोग्राम पर ख़र्च बढ़ाना चाहिए. अभी उन्हें जो प्रशिक्षण दिया जाता है, वह मिलने वाले आंकड़ों के बारे में निर्देश तक सीमित है. इसका दायरा बढ़ाकर इसमें तकनीकी कुशलता बढ़ाने के प्रशिक्षण को भी शामिल करना चाहिए.

क़ानून की ज़रूरत

2012 के नेशनल डेटा शेयरिंग और एकाउंटेबिलिटी पॉलिसी (NDSAP) के तहत देश में ओपन डेटा मैंडेट यानी आंकड़े इकट्ठा करके उन्हें दूसरे पक्षों को उपलब्ध कराने का अधिकार मिला. इसके तहत हर सरकारी एजेंसी के चीफ डेटा ऑफिसर को डेटा क्युरेट यानी संशोधित करने और डेटासेट तैयार करने की स्वायत्तता मिली हुई है. इसी पॉलिसी के तहत हर संस्थान, सरकार के डेटा प्लेटफॉर्म में योगदान देता है. हालांकि, इसी वजह से विभिन्न संस्थानों के बीच एक गैर-पारदर्शी, अनियमित और बगैर मकसद के आंकड़े साझा करने की प्रवृति ने जन्म लिया. इसके अलावा, NDSAP में ओपन डेटा कर्मियों के लिए कोई प्रोत्साहन या जवाबदेही की व्यवस्था तय नहीं की गई. इसका भी इन कर्मियों के मोटिवेशन और परफॉर्मेंस पर बुरा असर हुआ. 

इन मुश्किलों को खत्म करने के लिए सरकार को व्यापक ओपन डेटा कानून लाना चाहिए. इस कानून में इन कर्मियों को क्या करना है और क्या नहीं, यह बात स्पष्ट रूप से बताई जानी चाहिए. इसके साथ, डेटासेट की पहचान और उसके चयन के आधार दिए जाने चाहिए. इस कानून के ज़रिये राज्य सरकारों को भी ओपन डेटा मैंडेट के दायरे में लाया जाना चाहिए. अभी यह सिर्फ़ केंद्र सरकार की इकाइयों पर ही लागू होता है. 

सहयोग को बढ़ावा मिले

केंद्र सरकार के 2012 में ओपन गवर्नमेंट डेटा प्लेटफॉर्म लाने के बाद कई सरकारी, अकादमिक और सिविल सोसायटी संस्थाओं ने भी अपने ओपन डेटा प्लेटफॉर्म लॉन्च किए हैं. इनमें शहरी और आवास मंत्रालय के स्मार्ट सिटी मिशन का इंडिया अर्बन डेटा एक्सचेंज, पुणे नगर निगम का पुणे डेटास्टोर, इकॉलॉजिकल सिक्योरिटी फाउंडेशन का द इंडिया ऑब्जर्वेटरी, सेंटर फॉर बजट और गवर्नेंस एकाउंटेबिलिटी का ओपन बजट इंडिया, इंडियन स्कूल ऑफ बिजनेस का द इंडिया डेटा पोर्टल और नीति आयोग के आगामी नेशनल डेटा एनालिटिक्स प्लेटफॉर्म सहित अन्य शामिल हैं.

अलग-अलग प्लेटफॉर्मों पर जो आंकड़े मौजूद हैं, उनसे अधिक से अधिक लाभ उठाने के लिए ओपन डेटा प्लेटफॉर्म रखने वाले हर संस्थान को व्यापक स्तर पर इंटर-ऑपरेबिलिटी लागू करनी होगी. इससे अलग-अलग प्लेटफॉर्मों पर उपलब्ध डेटासेट खुद-ब-खुद दूसरों के ज़रिये बड़ी संख्या में लोगों तक पहुंचेंगे.

ये कोशिशें भारत में ओपन डेटा कम्युनिटी की इच्छाशक्ति और क्षमता की गवाही देती हैं, लेकिन इससे यह भी पता चलता है कि इस क्षेत्र में कमियों को दूर करने के लिए काफी काम करना होगा. ऊपर हमने जिन प्लेटफॉर्मों का जिक्र किया है, वे इंटर-ऑपरेबल नहीं हैं यानी वे आपस में आंकड़े साझा नहीं करते. ऐसे में तकनीक के क्षेत्र में काम करने वाला कोई शख्स देश के फ्लैगशिप प्लेटफॉर्म से वाकिफ हो भी तो इसकी संभावना है कि उसे देश के कई अन्य ओपन डेटा प्लेटफॉर्म के बारे में पता न हो. इसका मतलब है कि देश में एआई के क्षेत्र में काम करने वाला समुदाय और इनोवेशन करने वाले बड़े पैमाने पर उपलब्ध आंकड़ों का इस्तेमाल नहीं कर पा रहे हैं. 

अलग-अलग प्लेटफॉर्मों पर जो आंकड़े मौजूद हैं, उनसे अधिक से अधिक लाभ उठाने के लिए ओपन डेटा प्लेटफॉर्म रखने वाले हर संस्थान को व्यापक स्तर पर इंटर-ऑपरेबिलिटी लागू करनी होगी. इससे अलग-अलग प्लेटफॉर्मों पर उपलब्ध डेटासेट खुद-ब-खुद दूसरों के ज़रिये बड़ी संख्या में लोगों तक पहुंचेंगे. इससे तकनीक के क्षेत्र में काम करने वालों और दूसरे लाभार्थियों को ओपन डेटा का इस्तेमाल करने की आजादी मिलेगी. इसकी पहल केंद्र सरकार को करनी चाहिए. उसे एक ओपन सोर्सिंग सॉफ्टवेयर कम्युनिकेशन इन्फ्रास्ट्रक्चर तैयार करना चाहिए, जो विभिन्न भारतीय ओपन डेटा प्लेटफॉर्मों को जोड़े. इस तरह की पहल इंडिया अर्बन डेटा एक्सचेंज के जरिये की जा रही है, जिसका मकसद शहर आधारित आंकड़ों को सरकार के विभिन्न रिपॉजिटरीज के बीच ट्रांसफर करने में मदद करना है. इस पहल का दायरा बढ़ाकर इसमें गैर-सरकारी डेटा प्लेटफॉर्मों और कई क्षेत्रों को शामिल किया जा सकता है. 

आंकड़ों को लेकर सरकार और निजी क्षेत्र के बीच सहयोग के कई फायदे हम देख चुके हैं. कुछ ऐसी ही पहल सरकार, निजी क्षेत्र और निकायों के बीच साझेदारी को लेकर भी की जा सकती है ताकि महत्वपूर्ण सरकारी ओपन डेटा कार्यक्रमों का दर्जा बेहतर हो. उदाहरण के लिए, सिविकडेटालैब वित्त और बजट को लेकर सरकारी आंकड़ों को सार्वजनिक करने के लिए राज्य स्तर पर अधिकारियों की स्किल को बेहतर करने में अगुवा रहा है. 

एआई के लिए ओपन डेटा पर फोकस हो

सरकार एआई के लिए जल्द ही राष्ट्रीय योजना तो ला ही रही है. इसके साथ उसे उद्योग, अकादमिक जगत और सिविल सोसायटी के प्रतिनिधियों को लेकर एक समिति भी बनानी चाहिए, जो देश के ओपन डेटा की मदद से एआई इनोवेशन को बढ़ावा देने के लिए ज़रूरी माहौल बनाने में मदद करे. माना जाता है कि दुनिया में सबसे अच्छा एआई इकोसिस्टम अमेरिका में है. वहां केंद्र सरकार ने हाल ही में एक टास्क फोर्स बनाई है, जो एआई इनोवेशन और रिसर्च के लिए और अधिक सरकारी आंकड़े उपलब्ध कराएगी.  कुछ ऐसी ही भावना यूरोपियन कमीशन (यूरोपीय संघ की कार्यकारिणी संस्था) ने भी दिखाई है. उसने ओपन डेटा को एआई जैसी नई तकनीक के लिए महत्वपूर्ण संपत्ति बताया है, जिसके लिए बड़े पैमाने पर उच्च गुणवत्ता वाले आंकड़ों को प्रोसेस करने की जरूरत पड़ती है. इसी के मद्देनज़र GAIA-X एक यूरोपीय पहल है, जिसका उद्देश्य डेटा इकोसिस्टम के लिए बुनियादी ढांचा तैयार करना है, जो इनोवेशन को बढ़ावा दे और उसके साथ निजता, पारदर्शिता, सुरक्षा मानकों पर भी खरी उतरे. 

सरकार एआई के लिए जल्द ही राष्ट्रीय योजना तो ला ही रही है. इसके साथ उसे उद्योग, अकादमिक जगत और सिविल सोसायटी के प्रतिनिधियों को लेकर एक समिति भी बनानी चाहिए, जो देश के ओपन डेटा की मदद से एआई इनोवेशन को बढ़ावा देने के लिए ज़रूरी माहौल बनाने में मदद करे.

भारत में ओपन डेटा सिस्टम का इस्तेमाल करने वालों को स्टार्टअप्स में काम करने वाले एआई इनोवेटर्स, भारतीय कंपनियों और बहुराष्ट्रीय कंपनियों के साथ मिलकर इसका विश्लेषण करना चाहिए. इसके बाद एआई तकनीक पर काम करने वालों को बताना चाहिए कि इसमें क्या कमियां हैं. इसके बाद सरकार इसमें सुधार लाने के लिए प्राथमिकताएं तय कर सकती है. इससे नेशनल इंफॉर्मेटिक्स सेंटर और साइंस और तकनीक विभाग में काम करने वाले अधिकारियों को एआई के लिए उच्च गुणवत्ता वाले ओपन डेटा की शर्तें तय करने और उन्हें पब्लिश करने में मदद मिलेगी. इन शर्तों को बाद में कामकाजी दिशानिर्देश बनाया जा सकता है और इन्हें स्टैंडर्ड ऑपरेटिंग प्रोसीजर में शामिल करके सरकारी कर्मचारियों के डेटा प्रैक्टिस में शामिल कराया जा सकता है. 

कोविड-19 महामारी ने जो तबाही मचाई है, उसके मद्देनजर अगर एआई की ख़ातिर ओपन डेटा का फायदा उठाने के लिए एक अभियान चलाया जाए और उसके साथ ओपन डेटा को बढ़ावा देने के लिए ज़रूरी सुधार किए जाएं तो इसका भारत में सामाजिक और विकास कार्यों पर सकारात्मक असर हो कता है. ऐसा करने से हम स्वास्थ्य, कृषि और शिक्षा के क्षेत्र में उलट-पुलट करने वाली तकनीकी इनोवेशन का फायदा उठा सकेंगे. इसके साथ, संसद से पर्सनल डेटा प्रोटेक्शन विधेयक को जल्द से जल्द पारित करवाना भी ज़रूरी है ताकि निजता, सुरक्षा और लोगों के अधिकार की संवेदनशील डेटा के मामले में रक्षा की जा सके और यह काम संस्थागत रूप से हो सके. 

The views expressed above belong to the author(s). ORF research and analyses now available on Telegram! Click here to access our curated content — blogs, longforms and interviews.