डेटाच्या अभावामुळे निर्माण होणारी सामाजिक असमानता

डेटाची कमतरता किंवा अभाव ही समस्या राष्ट्रीय लोकसंख्या आकडेवारी आणि बिग डेटा या दोन्हीमध्ये आहे. यामुळे अलगावची समस्या निर्माण होते ज्याचे मूल्यांकन केले जात नाही. या संस्थात्मक उणिवा स्वीकारल्यानंतरच त्यावर उपाय शोधता येईल.

हा लेख जागतिक लोकसंख्या दिन 2024 या मालिकेचा भाग आहे.

जगातील सुमारे 85 कोटी लोकांकडे कोणत्याही प्रकारचे कायदेशीर ओळखपत्र नाही. यापैकी बहुतेक लोक उप-सहारा आफ्रिका आणि दक्षिण आशियातील कमी आणि निम्न-मध्यम-उत्पन्न असलेल्या देशांमध्ये राहतात, जेथे नागरिक नोंदणी प्रणाली अपुरी आहे. यापैकी जवळपास निम्म्या लोकसंख्येला जन्म नोंदणी नसल्यामुळे राष्ट्रीय ओळखपत्र मिळू शकले नाही. देशाच्या मुख्य प्रवाहापासून अलिप्त राहण्याच्या या समस्येचा लोकांच्या सामाजिक-आर्थिक स्थितीवर खोलवर परिणाम होतो आणि पुरुषांच्या तुलनेत महिलांकडे ओळखपत्र असण्याची शक्यता 8 टक्क्यांनी कमी होते. हे अंतर 25 वर्षांपेक्षा कमी वयाच्या प्रौढांसाठी अधिक तीव्र होते. त्यांना कमी शिक्षण मिळते. त्यांना बेरोजगारी किंवा कमी उत्पन्नाचा सामना करावा लागतो आणि ते देशातील 40 टक्के लोकांचा भाग बनतात ज्यांना उत्पन्न वितरणाचा सर्वात कमी वाटा मिळतो. लोकांना अर्थव्यवस्थेत आणि समाजात सहभागी होण्यासाठी, त्यांच्याकडे ओळख आणि ओळखीची प्रणाली असणे आवश्यक आहे. मग तो रोजगार असो, मतदानाचा हक्क असो, बँक खाते उघडणे असो किंवा सामाजिक संरक्षण मिळवणे असो. ओळखपत्र हे अंतर कमी करतात आणि एखाद्याचा देश आणि बाजारपेठेशी संवादाचा खर्च कमी करतात. ज्यांच्याकडे ओळखपत्र नाही अशांपैकी सुमारे 40 टक्के प्रौढांनी तक्रार केली की त्यांना सिम कार्ड किंवा मोबाईल फोन मिळविण्यात खूप समस्या आल्या. आणि त्यापैकी 25 टक्के लोकांना आरोग्य सेवा मिळण्यात अडचणी आल्या.

युनायटेड नेशन्स पॉप्युलेशन फंड (UNFPA) च्या अंदाजानुसार हजारो जन्म आणि जगातील दोन तृतीयांश मृत्यू नोंदणीकृत नाहीत. त्यामुळे कालबाह्य झालेल्या लोकसंख्येच्या आकडेवारीत अधिक गुंतागुंत निर्माण होते.

युनायटेड नेशन्स पॉप्युलेशन फंड (UNFPA) च्या अंदाजानुसार हजारो जन्म आणि जगातील दोन तृतीयांश मृत्यू नोंदणीकृत नाहीत. त्यामुळे कालबाह्य झालेल्या लोकसंख्येच्या आकडेवारीत अधिक गुंतागुंत निर्माण होते. युनायटेड नेशन्स स्टॅटिस्टिक्स डिव्हिजन (UNSD) नुसार, कोविड-19 साथीच्या काळात, 2020 किंवा 2021 मध्ये ज्यांची जनगणना होणार होती अशा 121 देशांपैकी सुमारे 50 टक्के देशांनी जनगणना 2021 पर्यंत पुढे ढकलली. तर 15 टक्के देशांनी त्यांची जनगणना 2022 किंवा नंतर पुढे ढकलली आहे. आरोग्य सेवा, सामाजिक संरक्षण आणि इतर सुविधांचा प्रवेश जनगणनेच्या आकडेवारीच्या आधारे निश्चित केला जातो. नवीन जनगणनेच्या आकडेवारी अभावी, कल्याणकारी योजनांचे लाभ जुन्या आकडेवारीच्या आधारे वितरित केले जात आहेत, त्यामुळे लोकसंख्येचा मोठा भाग त्याचा लाभ घेण्यापासून वंचित आहे.

उदाहरणार्थ, भारतात, 2013 च्या राष्ट्रीय अन्न सुरक्षा कायद्यानुसार , सार्वजनिक वितरण प्रणाली अनुदानित दराने अन्नधान्य पुरवते आणि ग्रामीण भागातील 75 टक्के लोकसंख्येला आणि 50 टक्के शहरी भागातील लोकांना याचा लाभ मिळणे अपेक्षित आहे. सार्वजनिक डेटा गोळा करून आणि राष्ट्रीय आकडेवारीचे मोजमाप करून, नागरिक कायदेशीर किंवा सरकारच्या नजरेत येतात, जेणेकरून सार्वजनिक सेवा व्यवस्थापित केल्या जाऊ शकतात किंवा त्यांच्यासाठी प्रदान केल्या जाऊ शकतात. आता, अगणित किंवा वंचित लोकांबद्दल डेटा नसल्याने, उपलब्ध डेटामध्ये कमतरता आणि वास्तवापेक्षा फरक असल्याने, लोकसंख्येमध्ये वंचित लोकांचा एक वर्ग तयार झाला आहे, ज्याबद्दल कोणतीही जनगणना किंवा अधिकृत माहिती नाही.

बिग डेटा आणि लहान डेटा: शक्यता आणि कमतरतांचा विरोधाभास

डिजिटल तंत्रज्ञानाच्या वाढत्या वापरामुळे डिजिटल क्षेत्र किंवा बिग डेटामधून निर्माण होणाऱ्या डेटाचा साठा वाढला आहे. अनेक प्रकारे, देशांच्या लोकसंख्येतील फरकासाठी बिग डेटा हा पर्याय मानला जात असे. तथापि, बिग डेटा करू शकणारे परिमाणवाचक योगदान पाहता, त्यात ग्रॅन्युलॅरिटीचा अभाव असल्याचे अनेकदा म्हटले जाते आणि विकासकांना स्वारस्य असलेल्या अनेक पॅरामीटर्सवरील डेटाच्या अभावाचा सामना करावा लागतो. या कमतरतेमुळे अनेकदा खोटे आणि तात्पुरते नाते ओळखण्याची समस्या उद्भवते. 2014-16 च्या इबोला विषाणू संकटादरम्यान, कॉल डेटा रेकॉर्डला रोग प्रतिबंधक उपाय म्हणून एक मोठा डेटा उपाय म्हणून गौरवण्यात आले. कारण कॉल रेकॉर्डद्वारे मोबाईल फोनच्या सिग्नलचा मागोवा घेणे आणि त्यावर आधारित रोगाचा भौगोलिक प्रसार निश्चित केला गेला. सिएरा लिओनमध्ये केलेल्या अभ्यासात असे दिसून आले की हा प्रयत्न अयशस्वी ठरला आहे. कारण ग्लोबल नॉर्थमधील तज्ञ आणि विकास व्यावसायिक देशातील मोबाईल फोन वापराचा ट्रेंड समजून घेण्यात अयशस्वी ठरले होते. सिएरा लिओनमध्ये, मोबाईल फोन एक सामान्य वस्तू म्हणून वापरला जात होता, मित्र आणि कुटुंबातील सदस्यांमध्ये सामायिक आणि व्यापार केला जात होता आणि अनेक व्यक्तींचे एकाच वेळी अनेक मोबाइल कनेक्शन होते, जेणेकरून आम्ही जास्तीत जास्त डेटा खर्च करू शकतो.

त्याच वेळी, बिग डेटा अतिशय गुंतागुंतीचा आणि गोंधळात टाकणारा आहे, आणि त्याचा वापर करून घेण्याच्या प्रयत्नांमुळे विविध प्रकारची कमतरता निर्माण होते . मॉडेलिंग आणि विश्लेषणासाठी मोठा डेटा योग्य बनवण्यासाठी साफसफाई, डि-क्लटरिंग, वर्गीकरण आणि विशिष्ट गरजांनुसार ते तयार करणे आवश्यक आहे. त्यात डेटा कसा तयार करायचा, म्हणजे काय समाविष्ट करायचं आणि काय बाहेर ठेवायचं हे ठरवणं देखील समाविष्ट आहे. उदाहरणार्थ, स्त्री-पुरुष बायनरी कमी करण्याच्या प्रयत्नांमुळे लैंगिक अल्पसंख्याकांना वेगळे केले गेले आहे. यामुळे डेटाच्या श्रेण्या तयार झाल्या ज्या व्याख्येमध्ये बसत नाहीत आणि जेथे पूर्व-अस्तित्वात असलेल्या विचारांमध्ये बसण्यासाठी डेटाची फेरफार केली गेली. बऱ्याचदा, नॉन-स्टँडर्ड डेटाची ही श्रेणी डेटाचा फक्त एक छोटासा भाग असते आणि बहुतेकदा तो महत्त्वाचा मानला जात नाही. याचा परिणाम असा होतो की डेटाचे कच्चे भांडार अर्थपूर्ण आणि गरजेनुसार अशा श्रेणींमध्ये विभागले जाऊ शकत नाही. लोकसंख्येच्या काही विभागांशी संबंधित डेटाच्या अभावामुळे त्यांची गणना कमी होते किंवा त्यांची अजिबात गणना होत नाही.

डेटामधील अंतर अनेकदा आम्ही वर नमूद केलेल्या खोट्या संबंधांमुळे भरले जाते. तथापि, बऱ्याच वेळा निष्कर्ष काढलेल्या परस्परसंवादाचा परिणाम उच्च पातळीवरील पूर्वग्रह आणि भेदभावात होतो. उदाहरणार्थ, एखाद्या व्यक्तीचा पोस्टकोड किंवा भाषा त्यांच्या कर्ज घेण्याच्या किंवा नोकरीत राहण्याच्या क्षमतेचे मूल्यांकन करण्यासाठी लिंक केले जाऊ शकते . 2008 च्या जागतिक आर्थिक मंदीपूर्वी आफ्रिकन अमेरिकन आणि हिस्पॅनिक समुदायातील लोक हे सब-प्राइम कर्जाचे मुख्य लक्ष्य होते. आफ्रिकन अमेरिकन लोकांना गृहकर्ज नाकारले जाण्याची शक्यता 2.8 पट अधिक होती, तर हिस्पॅनिकना त्याच्या दुप्पट शक्यता होती. कोणत्याही श्वेत अमेरिकन लोकांपेक्षा या समुदायातील लोकांना सब-प्राइम लोन मिळण्याची शक्यता 2.4 पट अधिक होती. हे डेटा कमतरतेचे स्वरूप समजून घेण्याचे महत्त्व अधोरेखित करते जेणेकरून त्यांचे प्रतिकूल परिणाम कमी करता येतील.

डेटा मौन दीर्घकालीन संस्थात्मक समस्यांमधून उद्भवते आणि काळजीपूर्वक मूल्यांकन करणे, मान्य करणे आणि संबोधित करणे आवश्यक आहे. विश्लेषक, धोरण निर्माते आणि विकास व्यावसायिकांना संदर्भाची चांगली समज असणे आवश्यक आहे, जेणेकरून ते विशिष्ट विकास परिणाम किंवा धोरणात्मक दृष्टिकोनासाठी योग्य मापदंड ओळखू शकतील आणि चुकीच्या संबंधांचे मॉडेलिंग टाळू शकतील. गहाळ डेटा ही एक वास्तविकता आहे जी टाळता येत नाही. या कमतरतेची भरपाई अनेकदा कमतरतेच्या विरुद्ध परिस्थितीचा अंदाज लावणे, त्यामुळे त्रुटी दर लपविण्यासारख्या पद्धतींनी भरून काढता येते. डेटा सायलोची समस्या कमी करण्याचा एक मार्ग म्हणजे विविध सार्वजनिक क्षेत्रातील विभागांमध्ये डेटा एक्सचेंजसाठी मानके आणि प्रोटोकॉल तयार करणे आणि डेटाच्या विद्यमान स्टोअरला एकमेकांशी जोडणे आणि ते उपलब्ध असलेल्या डेटाशी जोडणे हा सार्वजनिकरित्या उपलब्ध मार्ग आहे.

अनुलेखा नंदी या ऑब्झर्व्हर रिसर्च फाउंडेशनच्या फेलो आहेत.

The views expressed above belong to the author(s). ORF research and analyses now available on Telegram! Click here to access our curated content — blogs, longforms and interviews.

The Fault In Our Data Data Silences And Inequalities0

PREV NEXT

Author

Anulekha Nandi

Dr. Anulekha Nandi is a Fellow - Centre for Security, Strategy and Technology at ORF. Her primary area of research includes digital innovation management and ...

Expert Speak Raisina Debates

Published on Jul 12, 2024 Updated 1 Hours ago

बिग डेटा आणि लहान डेटा: शक्यता आणि कमतरतांचा विरोधाभास

Author

Anulekha Nandi

Publications

SDGs संकटात! आता तारणहार कोण?

Sustainable Development

Nov 18, 2025

रक्त आहे… पण वेळेवर नाही: भारताच्या रक्तसुरक्षेला अडवणारी अदृश्य दरी

Healthcare

Nov 18, 2025

Essay Series

Long-form

Progammes & Centres

Location

About ORF

Engage

People

डेटाच्या अभावामुळे निर्माण होणारी सामाजिक असमानता

Expert Speak Raisina Debates

Published on Jul 12, 2024 Updated 1 Hours ago

बिग डेटा आणि लहान डेटा: शक्यता आणि कमतरतांचा विरोधाभास

Author

Anulekha Nandi

Publications

Nov 18, 2025

Nov 18, 2025