Author : Anulekha Nandi

Expert Speak Raisina Debates
Published on Jul 12, 2024 Updated 1 Hours ago

डेटाची कमतरता किंवा अभाव ही समस्या राष्ट्रीय लोकसंख्या आकडेवारी आणि बिग डेटा या दोन्हीमध्ये आहे. यामुळे अलगावची समस्या निर्माण होते ज्याचे मूल्यांकन केले जात नाही. या संस्थात्मक उणिवा स्वीकारल्यानंतरच त्यावर उपाय शोधता येईल.

डेटाच्या अभावामुळे निर्माण होणारी सामाजिक असमानता

हा लेख जागतिक लोकसंख्या दिन 2024 या मालिकेचा भाग आहे. 


जगातील सुमारे 85 कोटी लोकांकडे कोणत्याही प्रकारचे कायदेशीर ओळखपत्र नाही. यापैकी बहुतेक लोक उप-सहारा आफ्रिका आणि दक्षिण आशियातील कमी आणि निम्न-मध्यम-उत्पन्न असलेल्या देशांमध्ये राहतात, जेथे नागरिक नोंदणी प्रणाली अपुरी आहे. यापैकी जवळपास निम्म्या लोकसंख्येला जन्म नोंदणी नसल्यामुळे राष्ट्रीय ओळखपत्र मिळू शकले नाही. देशाच्या मुख्य प्रवाहापासून अलिप्त राहण्याच्या या समस्येचा लोकांच्या सामाजिक-आर्थिक स्थितीवर खोलवर परिणाम होतो आणि पुरुषांच्या तुलनेत महिलांकडे ओळखपत्र असण्याची शक्यता 8 टक्क्यांनी कमी होते. हे अंतर 25 वर्षांपेक्षा कमी वयाच्या प्रौढांसाठी अधिक तीव्र होते. त्यांना कमी शिक्षण मिळते. त्यांना बेरोजगारी किंवा कमी उत्पन्नाचा सामना करावा लागतो आणि ते देशातील 40 टक्के लोकांचा भाग बनतात ज्यांना उत्पन्न वितरणाचा सर्वात कमी वाटा मिळतो. लोकांना अर्थव्यवस्थेत आणि समाजात सहभागी होण्यासाठी, त्यांच्याकडे ओळख आणि ओळखीची प्रणाली असणे आवश्यक आहे. मग तो रोजगार असो, मतदानाचा हक्क असो, बँक खाते उघडणे असो किंवा सामाजिक संरक्षण मिळवणे असो. ओळखपत्र हे अंतर कमी करतात आणि एखाद्याचा देश आणि बाजारपेठेशी संवादाचा खर्च कमी करतात. ज्यांच्याकडे ओळखपत्र नाही अशांपैकी सुमारे 40 टक्के प्रौढांनी तक्रार केली की त्यांना सिम कार्ड किंवा मोबाईल फोन मिळविण्यात खूप समस्या आल्या. आणि त्यापैकी 25 टक्के लोकांना आरोग्य सेवा मिळण्यात अडचणी आल्या.

युनायटेड नेशन्स पॉप्युलेशन फंड (UNFPA) च्या अंदाजानुसार हजारो जन्म आणि जगातील दोन तृतीयांश मृत्यू नोंदणीकृत नाहीत. त्यामुळे कालबाह्य झालेल्या लोकसंख्येच्या आकडेवारीत अधिक गुंतागुंत निर्माण होते.

युनायटेड नेशन्स पॉप्युलेशन फंड (UNFPA) च्या अंदाजानुसार हजारो जन्म आणि जगातील दोन तृतीयांश मृत्यू नोंदणीकृत नाहीत. त्यामुळे कालबाह्य झालेल्या लोकसंख्येच्या आकडेवारीत अधिक गुंतागुंत निर्माण होते. युनायटेड नेशन्स स्टॅटिस्टिक्स डिव्हिजन (UNSD) नुसार, कोविड-19 साथीच्या काळात, 2020 किंवा 2021 मध्ये ज्यांची जनगणना होणार होती अशा 121 देशांपैकी सुमारे 50 टक्के देशांनी जनगणना 2021 पर्यंत पुढे ढकलली. तर 15 टक्के देशांनी त्यांची जनगणना 2022 किंवा नंतर पुढे ढकलली आहे. आरोग्य सेवा, सामाजिक संरक्षण आणि इतर सुविधांचा प्रवेश जनगणनेच्या आकडेवारीच्या आधारे निश्चित केला जातो. नवीन जनगणनेच्या आकडेवारी अभावी, कल्याणकारी योजनांचे लाभ जुन्या आकडेवारीच्या आधारे वितरित केले जात आहेत, त्यामुळे लोकसंख्येचा मोठा भाग त्याचा लाभ घेण्यापासून वंचित आहे.
 
उदाहरणार्थ, भारतात, 2013 च्या राष्ट्रीय अन्न सुरक्षा कायद्यानुसार , सार्वजनिक वितरण प्रणाली अनुदानित दराने अन्नधान्य पुरवते आणि ग्रामीण भागातील 75 टक्के लोकसंख्येला आणि 50 टक्के शहरी भागातील लोकांना याचा लाभ मिळणे अपेक्षित आहे. सार्वजनिक डेटा गोळा करून आणि राष्ट्रीय आकडेवारीचे मोजमाप करून, नागरिक कायदेशीर किंवा सरकारच्या नजरेत येतात, जेणेकरून सार्वजनिक सेवा व्यवस्थापित केल्या जाऊ शकतात किंवा त्यांच्यासाठी प्रदान केल्या जाऊ शकतात. आता, अगणित किंवा वंचित लोकांबद्दल डेटा नसल्याने, उपलब्ध डेटामध्ये कमतरता आणि वास्तवापेक्षा फरक असल्याने, लोकसंख्येमध्ये वंचित लोकांचा एक वर्ग तयार झाला आहे, ज्याबद्दल कोणतीही जनगणना किंवा अधिकृत माहिती नाही. 

बिग डेटा आणि लहान डेटा: शक्यता आणि कमतरतांचा विरोधाभास

डिजिटल तंत्रज्ञानाच्या वाढत्या वापरामुळे डिजिटल क्षेत्र किंवा बिग डेटामधून निर्माण होणाऱ्या डेटाचा साठा वाढला आहे. अनेक प्रकारे, देशांच्या लोकसंख्येतील फरकासाठी बिग डेटा हा पर्याय मानला जात असे. तथापि, बिग डेटा करू शकणारे परिमाणवाचक योगदान पाहता, त्यात ग्रॅन्युलॅरिटीचा अभाव असल्याचे अनेकदा म्हटले जाते आणि विकासकांना स्वारस्य असलेल्या अनेक पॅरामीटर्सवरील डेटाच्या अभावाचा सामना करावा लागतो. या कमतरतेमुळे अनेकदा खोटे आणि तात्पुरते नाते ओळखण्याची समस्या उद्भवते. 2014-16 च्या इबोला विषाणू संकटादरम्यान, कॉल डेटा रेकॉर्डला रोग प्रतिबंधक उपाय म्हणून एक मोठा डेटा उपाय म्हणून गौरवण्यात आले. कारण कॉल रेकॉर्डद्वारे मोबाईल फोनच्या सिग्नलचा मागोवा घेणे आणि त्यावर आधारित रोगाचा भौगोलिक प्रसार निश्चित केला गेला. सिएरा लिओनमध्ये केलेल्या अभ्यासात असे दिसून आले की हा प्रयत्न अयशस्वी ठरला आहे. कारण ग्लोबल नॉर्थमधील तज्ञ आणि विकास व्यावसायिक देशातील मोबाईल फोन वापराचा ट्रेंड समजून घेण्यात अयशस्वी ठरले होते. सिएरा लिओनमध्ये, मोबाईल फोन एक सामान्य वस्तू म्हणून वापरला जात होता, मित्र आणि कुटुंबातील सदस्यांमध्ये सामायिक आणि व्यापार केला जात होता आणि अनेक व्यक्तींचे एकाच वेळी अनेक मोबाइल कनेक्शन होते, जेणेकरून आम्ही जास्तीत जास्त डेटा खर्च करू शकतो.

त्याच वेळी, बिग डेटा अतिशय गुंतागुंतीचा आणि गोंधळात टाकणारा आहे, आणि त्याचा वापर करून घेण्याच्या प्रयत्नांमुळे विविध प्रकारची कमतरता निर्माण होते . मॉडेलिंग आणि विश्लेषणासाठी मोठा डेटा योग्य बनवण्यासाठी साफसफाई, डि-क्लटरिंग, वर्गीकरण आणि विशिष्ट गरजांनुसार ते तयार करणे आवश्यक आहे. त्यात डेटा कसा तयार करायचा, म्हणजे काय समाविष्ट करायचं आणि काय बाहेर ठेवायचं हे ठरवणं देखील समाविष्ट आहे. उदाहरणार्थ, स्त्री-पुरुष बायनरी कमी करण्याच्या प्रयत्नांमुळे लैंगिक अल्पसंख्याकांना वेगळे केले गेले आहे. यामुळे डेटाच्या श्रेण्या तयार झाल्या ज्या व्याख्येमध्ये बसत नाहीत आणि जेथे पूर्व-अस्तित्वात असलेल्या विचारांमध्ये बसण्यासाठी डेटाची फेरफार केली गेली. बऱ्याचदा, नॉन-स्टँडर्ड डेटाची ही श्रेणी डेटाचा फक्त एक छोटासा भाग असते आणि बहुतेकदा तो महत्त्वाचा मानला जात नाही. याचा परिणाम असा होतो की डेटाचे कच्चे भांडार अर्थपूर्ण आणि गरजेनुसार अशा श्रेणींमध्ये विभागले जाऊ शकत नाही. लोकसंख्येच्या काही विभागांशी संबंधित डेटाच्या अभावामुळे त्यांची गणना कमी होते किंवा त्यांची अजिबात गणना होत नाही.
 
डेटामधील अंतर अनेकदा आम्ही वर नमूद केलेल्या खोट्या संबंधांमुळे भरले जाते. तथापि, बऱ्याच वेळा निष्कर्ष काढलेल्या परस्परसंवादाचा परिणाम उच्च पातळीवरील पूर्वग्रह आणि भेदभावात होतो. उदाहरणार्थ, एखाद्या व्यक्तीचा पोस्टकोड किंवा भाषा त्यांच्या कर्ज घेण्याच्या किंवा नोकरीत राहण्याच्या क्षमतेचे मूल्यांकन करण्यासाठी लिंक केले जाऊ शकते . 2008 च्या जागतिक आर्थिक मंदीपूर्वी आफ्रिकन अमेरिकन आणि हिस्पॅनिक समुदायातील लोक हे सब-प्राइम कर्जाचे मुख्य लक्ष्य होते. आफ्रिकन अमेरिकन लोकांना गृहकर्ज नाकारले जाण्याची शक्यता 2.8 पट अधिक होती, तर हिस्पॅनिकना त्याच्या दुप्पट शक्यता होती. कोणत्याही श्वेत अमेरिकन लोकांपेक्षा या समुदायातील लोकांना सब-प्राइम लोन मिळण्याची शक्यता 2.4 पट अधिक होती. हे डेटा कमतरतेचे स्वरूप समजून घेण्याचे महत्त्व अधोरेखित करते जेणेकरून त्यांचे प्रतिकूल परिणाम कमी करता येतील.

डेटा मौन दीर्घकालीन संस्थात्मक समस्यांमधून उद्भवते आणि काळजीपूर्वक मूल्यांकन करणे, मान्य करणे आणि संबोधित करणे आवश्यक आहे. विश्लेषक, धोरण निर्माते आणि विकास व्यावसायिकांना संदर्भाची चांगली समज असणे आवश्यक आहे, जेणेकरून ते विशिष्ट विकास परिणाम किंवा धोरणात्मक दृष्टिकोनासाठी योग्य मापदंड ओळखू शकतील आणि चुकीच्या संबंधांचे मॉडेलिंग टाळू शकतील. गहाळ डेटा ही एक वास्तविकता आहे जी टाळता येत नाही. या कमतरतेची भरपाई अनेकदा कमतरतेच्या विरुद्ध परिस्थितीचा अंदाज लावणे, त्यामुळे त्रुटी दर लपविण्यासारख्या पद्धतींनी भरून काढता येते. डेटा सायलोची समस्या कमी करण्याचा एक मार्ग म्हणजे विविध सार्वजनिक क्षेत्रातील विभागांमध्ये डेटा एक्सचेंजसाठी मानके आणि प्रोटोकॉल तयार करणे आणि डेटाच्या विद्यमान स्टोअरला एकमेकांशी जोडणे आणि ते उपलब्ध असलेल्या डेटाशी जोडणे हा सार्वजनिकरित्या उपलब्ध मार्ग आहे.


अनुलेखा नंदी या ऑब्झर्व्हर रिसर्च फाउंडेशनच्या फेलो आहेत.

The views expressed above belong to the author(s). ORF research and analyses now available on Telegram! Click here to access our curated content — blogs, longforms and interviews.

Author

Anulekha Nandi

Anulekha Nandi

Dr. Anulekha Nandi is a Fellow in Technology, Economy, and Society at ORF. Her primary area of research includes digital innovation management and governance focusing ...

Read More +