Author : Antara Vats

Published on Oct 08, 2022 Updated 24 Days ago

संग्रहित डेटा की क्षमताओं को अधिकतम बनाने के लिए भारत को OGD इकोसिस्टम में मौजूद ख़ामियां को दूर करना होगा.

ओपन गवर्नमेंट डेटा: भारतीय सफ़र के एक दशक पूरा करने के बाद का हिसाब-किताब!

आज के ज़माने में डेटा एक संसाधन बन गया है, जिसकी चाह कारोबार जगत और नीति-निर्माता, दोनों को समान रूप से है. भारत, यूनाइटेड किंगडम, ऑस्ट्रेलिया जैसे कई देश विशाल डेटा भंडारों की ताक़त का भरपूर लाभ उठा रहे हैं. इन तमाम देशों के सरकारी विभागों डेटा इकट्ठा करने और उन्हें संजोने का काम करते हैं. इसकी मदद से वो शासन-प्रशासन और आर्थिक विकास के प्रति अपने रुख़ में सुधार लाते हैं. सरकार (ख़ासतौर से भारत में) के पास कच्चे डेटासेट्स का विशाल भंडार मौजूद है, और उनका इनपर पूरा नियंत्रण है. सार्वजनिक कोष से संचालित परियोजनाओं और योजनाओं के ज़रिए दशकों से इस तरह के डेटा इकट्ठे किए जाते रहे हैं. इनमें महात्मा गांधी राष्ट्रीय ग्रामीण रोज़गार गारंटी अधिनियम, 2005 शामिल है. इस प्रकार जमा किए गए डेटा का नीति-निर्माण को बेहतर बनाने के लिए इस्तेमाल किया जा सकता है. 

ओपन गवर्नमेंट डेटा (OGD) तक पहुंच से नागरिकों को सरकारी योजनाओं के प्रभाव और दक्षता की निगरानी करने की सुविधा मिल जाती है. कारोबार जगत को भी समुदाय-आधारित नवाचार करने की ताक़त मिलती है. ये सरकारी विभागों के बीच भी डेटा और ज्ञान साझा करने की सहूलियत देता है.

यूनेस्को ने 28 सितंबर को सूचना तक सार्वभौमिक पहुंच के लिए अंतरराष्ट्रीय दिवस घोषित किया है. इसका मक़सद सरकारों से सूचना की पारदर्शिता बढ़ाने को लेकर नागरिकों की मांग को बढ़ावा देना है. दरअसल सूचना तक पहुंच की क़वायद तमाम दूसरे अधिकारों (जैसे प्रेस की आज़ादी आदि) को ज़मीन पर उतारने की प्रक्रिया के साथ क़रीबी से जुड़ी हुई है. ओपन गवर्नमेंट डेटा (OGD) तक पहुंच से नागरिकों को सरकारी योजनाओं के प्रभाव और दक्षता की निगरानी करने की सुविधा मिल जाती है. कारोबार जगत को भी समुदाय-आधारित नवाचार करने की ताक़त मिलती है. ये सरकारी विभागों के बीच भी डेटा और ज्ञान साझा करने की सहूलियत देता है. इससे खंड में बंटकर काम करने की व्यवस्था पर नकेल लगती है. इसके अलावा विभागों से परे योजनाओं की निगरानी हो सकती है और एक विभाग के भीतर और तमाम विभागों के बीच गठजोड़ के लिए मसलों की पहचान में मदद मिलती है. ये क़वायद सरकारों और कारोबारों को पारदर्शिता और जवाबदेही को प्राथमिकता देने के लिए प्रेरित करती है. मज़बूत और समावेशी समाजों की यही कसौटी होती है. 

बहरहाल, सरकारें अब भी डेटा संग्रहण की पूरी क्षमता का इस्तेमाल नहीं कर पाई हैं. गुमशुदा डेटासेट्स, डेटा संग्रहण प्रणालियों और मेटाडेटा के प्रति बिना तालमेल वाले रुख़ और डेटा विज़ुअलाइज़ेशन के प्रति बेसबब रवैये से OGD की पहुंच और उपयोगिता सीमित हो जाती है. इसके अलावा ओपन डेटा नीतियां डेटा की दोबारा उपयोगिता के लिए तकनीकी और वैधानिक मानकों को पर्याप्त रूप से परिभाषित करने में नाकाम रहती हैं. 

NDSAP ने सूचना इकट्ठी करने, प्रॉसेसिंग करने और उन्हें साझा करने को लेकर कोई स्पष्ट प्रोटोकॉल सामने नहीं रखे हैं. मिसाल के तौर पर डेटा संग्रह के तौर-तरीक़ों और शब्दावलियों को लेकर सरकारी विभागों में कोई सामंजस्य नहीं था- वो एक ही शीर्षक के साथ अलग-अलग तरह की सूचनाएं इकट्ठी कर रहे थे या अलग-अलग शीर्षकों के साथ एक ही सूचना जमा कर रहे थे. 

भारत की OGD से जुड़ी क़वायद 2012 में विज्ञान और प्रौद्योगिकी मंत्रालय (MeitY) द्वारा नेशनल डेटा शेयरिंग एंड एक्सेसिबिलिटी नीति (NDSAAP) के प्रकाशन के साथ शुरू हुई. अबतक भारत OGD के सफ़र में काफ़ी आगे निकल चुका है. तमिलनाडु और पंजाब जैसे अनेक राज्यों ने राज्य-स्तरीय डेटा शेयरिंग नीतियां तैयार कर ली हैं. डिजिटल इंडिया कार्यक्रम ने अपने प्रमुख स्तंभ के तौर पर OGD की पहचान की है. इसके अलावा नीति आयोग ने नेशनल डेटा एंड एनालिटिक्स प्लेटफ़ॉर्म (NDAP) की शुरुआत की है. ये लेख भारत की ODG यात्रा के उभार की पड़ताल करते हुए भारत के OGD इकोसिस्टम में ख़ामियों को भरने से जुड़े सुझाव प्रस्तावित करता है. 

भारत के OGD प्लेटफ़ॉर्म का उभार

NDSAP को लेकर सरकार का नज़रिया साफ़ था. सरकारी विभागों और नागरिकों के बीच डेटा शेयरिंग की सुविधा देने वाली डेटा प्रबंधन प्रणाली नदारद थी. इसके चलते सरकारी विभागों द्वारा तैयार डेटा के विशाल भंडारों का नीति-निर्माण में ज़रूरत के मुताबिक इस्तेमाल नहीं हो पा रहा था. NDSAP ने तैयार किए गए डेटा को साझा करने की प्रक्रिया की शुरुआत की. इसके लिए डेटा के मालिक़ों के साथ सार्वजनिक कोष का इस्तेमाल किया गया. इसके अलावा OGD प्लेटफ़ॉर्म data.gov.in का इस्तेमाल कर सरकारी एजेंसियों के बीच भी ऐसी ही क़वायद को अंजाम दिया गया. इसे समय-समय पर अपडेट किए जाने की ज़रूरत बताई गई थी. साथ ही इंसान द्वारा और मशीन द्वारा पढ़े जा सकने वाले स्वरूपों में मानकीकृत डेटा उपलब्ध किए जाने थे, जिससे व्यापक पहुंच सुनिश्चित होती. आज इस प्लेटफ़ॉर्म में 33 सेक्टरों के 165 सरकारी विभागों से हासिल डेटासेट्स शामिल हैं. 

बहरहाल, कुछ चुनिंदा डेटासेट्स ही पैमाने पर खरे उतरते हैं. NDSAP ने सूचना इकट्ठी करने, प्रॉसेसिंग करने और उन्हें साझा करने को लेकर कोई स्पष्ट प्रोटोकॉल सामने नहीं रखे हैं. मिसाल के तौर पर डेटा संग्रह के तौर-तरीक़ों और शब्दावलियों को लेकर सरकारी विभागों में कोई सामंजस्य नहीं था- वो एक ही शीर्षक के साथ अलग-अलग तरह की सूचनाएं इकट्ठी कर रहे थे या अलग-अलग शीर्षकों के साथ एक ही सूचना जमा कर रहे थे. अक्सर डेटा को सरकारी वेबसाइटों पर स्कैन्ड PDFs या इमेज के रूप में अपलोड किया जाता है. इससे डेटा की छंटाई मुश्किल हो जाती है. इसके अलावा भारत में अबतक डेटा को गुमनाम बनाने वाले मानक (data anonymisation standards) तैयार नहीं हो पाए हैं. इलेक्ट्रॉनिक्स और सूचना प्रौद्योगिकी मंत्रालय (MeitY) ने अगस्त 2022 में ड्राफ़्ट डेटा एनोनिमाइज़ेशन दिशानिर्देश जारी किए. हालांकि हफ़्ते भर में ही इसे वापस भी ले लिया गया. दरअसल सरकार को महसूस हुआ है कि इस मसौदे पर अभी और अधिक विशेषज्ञ सलाह-मशविरे की दरकार है. और तो और राज्य सरकारों की ही तरह केंद्र सरकार के विभागों में भी निजता और डेटा सुरक्षा सुनिश्चित करने के लिए ज़रूरी ढांचे पर तालमेल नहीं है. 

शुरुआत से ही NDAP ने मौजूदा OGD प्लेटफ़ॉर्म्स की सीमाओं को लेकर तकनीकी विशेषज्ञों और डेटा का प्रयोग करने वालों से मिलने वाले फ़ीडबैक को शामिल करना शुरू कर दिया था. इनमें नौकरशाह, नवाचार करने वाले, पत्रकार, नीति-निर्माता, नागरिक और शोधकर्ता शामिल हैं. इस क़वायद का मक़सद NDAP की प्रासंगिकता और अनुकूलता बनाए रखना था.

नीति आयोग की NDAP का मक़सद ऊपर बताई गई कई ख़ामियों का निपटारा करना है. इसके लिए data.gov.in, DISHA जैसे ग्रामीण विकास मंत्रालय के कई मौजूदा कार्यक्रमों और राज्य-आधारित ओपन डेटा नीतियों की बुनियाद का प्रयोग किया गया. NDAP को विभिन्न स्रोतों से पैदा होने वाले डेटा को मानकीकृत करने के हिसाब से गढ़ा गया है. इससे वो नवाचार, शोध, नीति-निर्माताओं और सार्वजनिक उपभोग के लिए पहुंच के भीतर और अनुकूल हो जाते हैं. डेटा मानकीकरण के लिए स्टैंडर्ड ऑपरेटिंग प्रोटोकॉल्स (SOPs) तय कर दिए गए हैं. इससे डेटा को नियमित रूप से अपडेट करना, विभागों के बीच नियम पालना की निगरानी करना, और स्पष्ट रूप से तय परिभाषाओं के मुताबिक इन्हें पेश करना, आसान हो जाता है. इस तरह प्रयोगकर्ता, विभिन्न स्रोतों से समान डेटा का सकारात्मक  इस्तेमाल कर सकते हैं. नीति आयोग इस परियोजना पर कई सालों से काम करता आ रहा है. मिशन के तकनीकी पहलुओं में सहयोग करने के लिए सलाहकारों से जुड़े मसले 2018 में प्रकाशित हुए. इसके बाद 2020 में विज़न डॉक्यूमेंट का प्रकाशन हुआ. प्लेटफ़ॉर्म का शुरुआती चरण 2021 में शुरू किया गया, और इसे 2022 में सार्वजनिक इस्तेमाल के लिए उपलब्ध करा दिया गया. 

OGD इकोसिस्टम की ख़ामियों को पाटना

NDSAP ने व्यापक रूप से डेटा की पहुंच में सुधार लाने में धुरी की भूमिका निभाई है. अब NDAP इसको और आगे बढ़ाने पर नज़र टिकाए हुए है. डेटा की उपयोगिता बढ़ाने के लिए वो ओपन डेटा से जुड़े दूसरे कार्यक्रमों पर भी काम कर रहा है. मिसाल के तौर पर, शुरुआत से ही NDAP ने मौजूदा OGD प्लेटफ़ॉर्म्स की सीमाओं को लेकर तकनीकी विशेषज्ञों और डेटा का प्रयोग करने वालों से मिलने वाले फ़ीडबैक को शामिल करना शुरू कर दिया था. इनमें नौकरशाह, नवाचार करने वाले, पत्रकार, नीति-निर्माता, नागरिक और शोधकर्ता शामिल हैं. इस क़वायद का मक़सद NDAP की प्रासंगिकता और अनुकूलता बनाए रखना था. इसमें डेटा निर्माताओं और डेटा का प्रयोग करने वालों के बीच, ऐसे संचार को बरक़रार रखने का भी लक्ष्य तय है. दूसरा, इसके तहत डेटासेट्स की गुणवत्ता सुनिश्चित करने के लिए स्पष्ट मापदंड बताए गए हैं.

आगे चलकर OGD में भारत की टिकाऊ और व्यवस्थित तरक़्क़ी सुनिश्चित करने के लिए चीफ़ डेटा ऑफ़िसर्स (CDOs) के क्षमता निर्माण, OGD के इस्तेमाल को प्रोत्साहित करने और सरकार और सरकारी विभागों में तैनात डेटा में मूल्यों का तालमेल सुनिश्चित करने को निश्चित रूप से प्राथमिकता में रखना चाहिए. CDOs के लिए प्रशिक्षण कार्यशालाओं की संख्या बढ़ाने के साथ-साथ विशिष्ट संसाधन से लैस व्यक्तियों की तैनाती किए जाने की भी दरकार है. ऐसे डेटा कंट्रीब्यूटर्स के पास हरेक सरकारी विभाग के भीतर डेटा के संग्रहण, उनकी छंटाई और प्रॉसेसिंग करने के साथ-साथ उनका विश्लेषण करने और उन्हें अपलोड करने का ज़रूरी कौशल होना चाहिए. इससे सरकारी कर्मचारियों में सक्रिय रूप से मानकीकृत डेटासेट्स को साझा करने को लेकर मौजूदा प्रतिरोध पर क़ाबू पाने में मदद मिलेगी. डेटा कंट्रीब्यूटर एक मंत्रालय के भीतर और तमाम मंत्रालयों के बीच गठजोड़ को बढ़ावा देने के लिए परियोजनाओं की पहचान करने में भी मदद कर सकता है.

भारत में डेटा को व्यापक तौर पर गुमनाम बनाने और उसकी हिफ़ाज़त से जुड़े व्यापक परिदृश्य का अभाव है. ऐसे में केंद्र सरकार को ये सुनिश्चित करना होगा कि डेटा को दिए गए मूल्य का मौजूदा नियम-क़ायदों से तालमेल हो; वो डेटा गवर्नेंस के ढांचों से मेल खाते हों, और उनमें व्यक्तिगत निजता को पर्याप्त रूप से प्राथमिकता दी जा रही हो.

आम लोगों की दिलचस्पी हासिल करने के लिए OGD हैकेथॉन्स और दूसरी प्रतिस्पर्धाओं का आयोजन करने के साथ-साथ भारत सरकार को मांग में बने हुए डेटासेट्स के लिए प्लेटफ़ॉर्म/प्लेटफ़ॉर्मों की भीतरी कार्यप्रणालियों पर भी निगरानी करनी चाहिए. इसके अलावा जून 2016 में लॉन्च किए गए डेटा-संचालित निर्णय प्रक्रिया संग्रह की तरह प्रयोग के तमाम मौजूदा और संभावित प्रकरणों से सालाना केस स्टडीज़ पेश करने चाहिए. इसके अलावा बेशक़ीमती डेटासेट्स को नीति आयोग द्वारा पेश आर्टिफ़िशियल इंटेलिजेंस पर राष्ट्रीय रणनीति में पहचान किए गए पांच सेक्टरों के भीतर प्रयोग में आ रहे मसलों के हिसाब से संचालित किया जा सकता है. इनमें स्वास्थ्य सेवाएं, शिक्षा, कृषि, स्मार्ट सिटीज़ और बुनियादी ढांचे के साथ-साथ स्मार्ट मोबिलिटी और परिवहन शामिल हैं. इन डेटासेट्स को वरीयता के आधार पर अपलोड किया जा सकता है.

इस साल MeitY ने ड्राफ़्ट इंडिया डेटा एक्सेसिबिलिटी एंड यूज़ पॉलिसी 2022 प्रकाशित की. डेटा प्रबंधन ढांचे को मानकीकृत करने और ग़ैर-निजी सरकारी डेटासेट्स की गुणवत्ता सुधारने और उनतक पहुंच बनाने के लिए समान मेटाडेटा मानकों की स्थापना के लिए ये क़वायद हुई. बहरहाल जारी होने के फ़ौरन बाद इस नीति को वापस ले लिया गया और उसकी जगह ड्राफ़्ट नेशनल डेटा गवर्नेंस फ़्रेमवर्क पॉलिसी लाई गई. दरअसल, पूर्ववर्ती मसौदे में सरकारी डेटासेट्स का वाणिज्यिक उपयोग किए जाने के विचार को चौतरफ़ा आलोचनाओं का सामना करना पड़ा था. तमाम स्टेकहोल्डर्स ने मसौदे में निजता के ऊपर वाणिज्यिक हितों को प्राथमिकता दिए जाने पर चिंता जताई थी. दरअसल सरकार की ओर से निजी क्षेत्र को डेटा लाइसेंस करने से जुड़ा रुझान दिखाया गया था. ओडिशा और कर्नाटक जैसे राज्यों की सरकारों ने भी ओडिशा स्टेट डेटा पॉलिसी और कर्नाटक ओपन डेटा पॉलिसी में OGD को मुद्रीकृत करने के विचार के साथ सुर में सुर मिलाया है.

भारत में डेटा को व्यापक तौर पर गुमनाम बनाने और उसकी हिफ़ाज़त से जुड़े व्यापक परिदृश्य का अभाव है. ऐसे में केंद्र सरकार को ये सुनिश्चित करना होगा कि डेटा को दिए गए मूल्य का मौजूदा नियम-क़ायदों से तालमेल हो; वो डेटा गवर्नेंस के ढांचों से मेल खाते हों, और उनमें व्यक्तिगत निजता को पर्याप्त रूप से प्राथमिकता दी जा रही हो. इसके साथ ही डेटा गवर्नेंस फ़्रेमवर्क के अंतिम मसौदे में डेटा संग्रहण और अपलोड करने की क़वायदों में धोखे से बचने के लिए स्पष्ट प्रोटोकॉल भी निश्चित रूप से सामने रखे जाने चाहिए.       

The views expressed above belong to the author(s). ORF research and analyses now available on Telegram! Click here to access our curated content — blogs, longforms and interviews.