दुनिया में लगभग 85 करोड़ लोगों के पास पहचान का किसी भी तरह का क़ानूनी दस्तावेज़ नहीं है. इनमें से ज़्यादातर लोग अफ्रीका के सहारा क्षेत्र और दक्षिणी एशिया के निम्न और निम्न मध्यम आमदनी वाले देशों के रहने वाले हैं, जहां नागरिकों के पंजीकरण की व्यवस्थाएं अपर्याप्त हैं. इनमें से लगभग आधी आबादी को जन्म का रजिस्ट्रेशन न होने से कोई राष्ट्रीय पहचान पत्र हासिल नहीं हो सका था. देश की मुख्यधारा से अलग थलग होने की इस समस्या का और गहरा असर लोगों के सामाजिक आर्थिक स्तर पर पड़ता है और पुरुषों की तुलना में महिलाओं के पास कोई पहचान पत्र होने की संभावना 8 प्रतिशत और कम हो जाती है. 25 साल से कम उम्र के वयस्कों के लिए ये फ़ासला और बिगड़ जाता है. वो कम शिक्षा हासिल कर पाते हैं. बेरोज़गारी का सामना करते हैं या फिर कम आमदनी की वजह से देश के उन 40 प्रतिशत लोगों का हिस्सा बन जाते हैं, जिनको आमदनी के वितरण का सबसे कम हिस्सा मिलता है. लोगों के लिए अर्थव्यवस्था और समाज में भागीदारी करने के लिए, उनके पास पहचान और पहचान की व्यवस्था होना ज़रूरी है. फिर चाहे वो रोज़गार हो, मतदान का अधिकार हो, बैंक में खाता खोलना हो या फिर सामाजिक संरक्षण प्राप्त करना ही क्यों न हो.
दुनिया में लगभग 85 करोड़ लोगों के पास पहचान का किसी भी तरह का क़ानूनी दस्तावेज़ नहीं है. इनमें से ज़्यादातर लोग अफ्रीका के सहारा क्षेत्र और दक्षिणी एशिया के निम्न और निम्न मध्यम आमदनी वाले देशों के रहने वाले हैं, जहां नागरिकों के पंजीकरण की व्यवस्थाएं अपर्याप्त हैं.
पहचान पत्रों से ये अंतर कम होता है और किसी व्यक्ति के देश और बाज़ार से संवाद की लागत कम होती है. जिन लोगों के पास कोई पहचान पत्र नहीं होता, उनमें से लगभग 40 प्रतिशत वयस्कों ने शिकायत की कि उसकी वजह से उनको सिम कार्ड या मोबाइल फोन हासिल करने में बहुत परेशानियां हुईं. वहीं इनमें से 25 प्रतिशत को स्वास्थ्य सेवाएं हासिल करने में दिक़्क़तें पेश आईं.
संयुक्त राष्ट्र जनसंख्या फंड (UNFPA) का आकलन है कि दसियों हज़ार बच्चों के जन्म और दुनिया की लगभग दो तिहाई मौतों का पंजीकरण नहीं कराया जाता है. इसकी वजह से जनसंख्या के पुराने पड़ चुके आंकड़ों में और जटिलताएं आती हैं. संयुक्त राष्ट्र के सांख्यिकी विभाग (UNSD) के मुताबिक़, कोविड-19 महामारी के दौरान जिन 121 देशों में 2020 या 2021 में जनगणना होनी थी, उनमें से लगभग 50 प्रतिशत ने जनगणना को 2021 के लिए टाल दिया. वहीं 15 फ़ीसद देशों ने अपने यहां जनगणना को 2022 या उसके बाद के लिए टाल दिया. स्वास्थ्य सेवा तक पहुंच, सामाजिक संरक्षण और दूसरी सुविधाओं का निर्धारण जनगणना के आंकड़ों के आधार पर होता है. जनगणना के नए आंकड़े न होने की वजह से कल्याणकारी योजनाओं के लाभों का वितरण पुराने आंकड़ों के आधार पर हो रहा है, जिससे आबादी का एक बड़ा हिस्सा इसका लाभ लेने से वंचित रह जाता है.
मिसाल के तौर पर, भारत में 2013 के राष्ट्रीय खाद्य सुरक्षा क़ानून के मुताबिक़, सार्वजनिक वितरण प्रणाली रियायती दरों पर खाद्यान्न उपलब्ध कराती है और माना जाता है कि इससे ग्रामीण इलाक़ों की 75 फ़ीसद और शहरी क्षेत्रों की 50 प्रतिशत आबादी को लाभ मिलता है. सार्वजनिक आंकड़ों को जुटाकर और राष्ट्रीय सांख्यिकी के आकलन से नागरिक वैध होते हैं या सरकार की नज़र में आते हैं, ताकि उनके लिए जनसेवाओं का प्रबंधन या व्यवस्था की जा सके. अब चूंकि गिनती से बाहर रह गए या वंचित लोगों के बारे में आंकड़े ख़ामोश हैं, ऐसे में जो आंकड़े उपलब्ध हैं उनमें कमियां और असलियत से अंतर है. इस वजह से आबादी के बीच वंचितों का ऐसा वर्ग तैयार हो जाता है, जिसकी कोई गिनती या आधिकारिक जानकारी नहीं होती है.
बिग डेटा और छोटे आंकड़े: संभावनाओं और कमियों के विरोधाभास
डिजिटल तकनीकों के बढ़ते इस्तेमाल की वजह से डिजिटल क्षेत्र से पैदा हुए आंकड़े या बिग डेटा के विशाल भंडार को जन्म दिया है. बहुत से मायनों में बिग डेटा को देशों की जनसंख्या के आंकड़ों के अंतर का विकल्प माना गया था. हालांकि, बिग डेटा तादाद के मामले में जो योगदान दे सकता है, उसको देखते हुए ये कहा जा रहा है कि इसमें बारीक़ जानकारियां नहीं होतीं और डेवेलपर्स को अक्सर अपनी दिलचस्पी वाले कई मानकों से जुड़े आंकड़ों की कमी का सामना करना पड़ता है. इस कमी की वजह से अक्सर ग़लत और अस्थायी संबंधों की शिनाख़्त की समस्या पैदा होती है. 2014-16 के दौरान इबोला वायरस के संकट के बीच, कॉल डेटा रिकॉर्ड को इस बीमारी की रोकथाम के लिए बिग डेटा के समाधान के तौर पर सराहा गया था. क्योंकि कॉल रिकॉर्ड के ज़रिये मोबाइल फोन के सिग्नल की ट्रैकिंग और उसके आधार पर बीमारी के भौगोलिक विस्तार का पता लगाया गया था. सियरा लियोन में किए गए एक अध्ययन में पता चला है कि ये कोशिश नाकाम साबित हुई थी. क्योंकि, ग्लोबल नॉर्थ के विशेषज्ञ और विकास संबंधी मामलों के पेशेवर, देश के भीतर मोबाइल फोन के इस्तेमाल के चलन को समझ पाने में असफल रहे थे. सियरा लियोन में मोबाइल फोन साझा वस्तु की तरह इस्तेमाल किए जा रहे थे, जिसे दोस्तों और परिवार के सदस्यों के बीच साझा किया जाता था और आपस में लेन-देन किया जाता था, और कई व्यक्तियों ने एक साथ कई मोबाइल कनेक्शन ले रखे थे, ताकि डेटा की लागत का अधिकतम उपभोग कर सकें.
कई बार, मानकों के मुताबिक़ न होने वाले आंकड़ों का ये वर्ग, डेटा के एक छोटा सा ही हिस्सा होता है, और अक्सर इसे अहम नहीं माना जाता है. इसका नतीजा ये होता है कि, आंकड़ों के अधकचरे भंडार को ऐसे वर्गों में नहीं बांटा जा सकता, जो अर्थपूर्ण और ज़रूरतों के मुताबिक़ हैं.
इसके साथ साथ बिग डेटा बड़ा उलट-पुलट और भड़कीला होता है, और इस्तेमाल करने के लिए इस पर क़ाबू पाने की कोशिशों में कुछ अलग तरह की कमियों वाले बर्ताव शुरू हो जाते हैं. मॉडलिंग और विश्लेषण के लिए बिग डेटा को अनुकूल बनाने के लिए उसे साफ़ सुथरा करने, उलझाव हटाने, काटने छांटने और ख़ास ज़रूरत के हिसाब से ढालने की ज़रूरत होती है. इनमें ये फ़ैसला लेना भी होता है कि डेटा को किस तरह तैयार किया जाए, मतलब क्या शामिल किया जाए और किसे अलग रखा जाए. मिसाल के तौर पर पुरुष और महिला के दोहरे चश्मे को घटाने की कोशिशों की वजह से लैंगिक रूप से अल्पसंख्यक अलग-थलग कर दिए गए. इसकी वजह से आंकड़ों के ऐसे वर्ग तैयार हो गए, जो परिभाषा के अनुकूल नहीं थे और जहां पहले से मौजूद सोच के मुताबिक़ आंकड़ों को ढालने के लिए उनमें तोड़ मरोड़ की गई. कई बार, मानकों के मुताबिक़ न होने वाले आंकड़ों का ये वर्ग, डेटा के एक छोटा सा ही हिस्सा होता है, और अक्सर इसे अहम नहीं माना जाता है. इसका नतीजा ये होता है कि, आंकड़ों के अधकचरे भंडार को ऐसे वर्गों में नहीं बांटा जा सकता, जो अर्थपूर्ण और ज़रूरतों के मुताबिक़ हैं. कुछ ख़ास वर्गों से जुड़े आंकड़ों का ये अभाव आबादी के किसी वर्ग की गिनती कम करने या उनकी गिनती ही न करने के नतीजे के तौर पर सामने आता है.
ख़ामोशियों को सुनना: दूसरे आंकड़ों के साथ मेल-जोल और संदर्भों के मुताबिक़ ढालना
आंकड़ों की कमियों को अक्सर उन ग़लत संबंधों से भरा जाता है, जिनका ज़िक्र हमने ऊपर किया है. हालांकि, कई बार जिन आपसी संबंधों के निष्कर्ष निकाले जाते हैं, उनका नतीजा उच्च स्तर के पूर्वाग्रहों और भेदभाव के रूप में सामने आता है. मिसाल के तौर पर किसी व्यक्ति के पिन कोड या भाषा को उनके क़र्ज़ लेने की क्षमता के मूल्यांकन या फिर किसी नौकरी में बने रहने से जोड़ दिया जाए. 2008 की वैश्विक आर्थिक मंदी से पहले अफ्रीकी अमेरिकी और हिस्पैनिक समुदाय के लोगों को, सब-प्राइम लोन का प्रमुख लक्ष्य बनाया गया था. अफ्रीकी अमेरिकी समुदाय के लोगों को घर का क़र्ज़ देने से मना करने की आशंका 2.8 गुना अधिक थी, तो हिस्पैनिक समुदाय के लिए दो गुना अधिक थी. किसी श्वेत अमेरिकी की तुलना में इन समुदायों के लोगों के सब-प्राइम लोन हासिल करने की संभावना 2.4 गुना अधिक थी. इससे डेटा की कमी के मिज़ाज को समझने की अहमियत रेखांकित होती है, ताकि उनके बुरे प्रभावों को कम किया जा सके.
डेटा की ख़ामोशी की दिक़्क़त को कम करने का एक तरीक़ा ये हो सकता है कि सार्वजनिक क्षेत्र के अलग अलग विभागों के बीच आंकड़ों के आदान प्रदान के मानक और प्रोटोकॉल बनाकर आंकड़ों मौजूदा भंडारों को आपस में जोड़ा जाए और इनको उस डेटा से भी जोड़ा जाए जो कंपनियां और बहुपक्षीय संगठन सार्वजनिक रूप से उपलब्ध करा सकते हैं.
डेटा की ख़ामोशी, लंबे समय से चले आ रहे संस्थागत मसलों से पैदा होती है और इसका सावधानी से मूल्यांकन करने, स्वीकार करने और कमी को दूर करने की ज़रूरत को मानना होगा. विश्लेषकों, नीति निर्माताओं और विकास से जुड़े पेशेवरों को संदर्भों की बेहतर समझ होनी चाहिए, ताकि वो विकास के किसी ख़ास निष्कर्ष या नीतिगत मंज़र की ज़रूरत के लिए उचित मानकों की पहचान कर सकें और ग़लत आपसी संबंधों की मॉडलिंग से बच सकें. गुम आंकड़े ऐसी हक़ीक़त हैं जिनसे बचा नहीं जा सकता है. इस कमी को अक्सर कमी के उलट की परिस्थिति का अंदाज़ा लगाने जैसे तरीक़ों से पूरा किया जा सकता है, जिससे ग़लती की दर छुप जाए. डेटा की ख़ामोशी की दिक़्क़त को कम करने का एक तरीक़ा ये हो सकता है कि सार्वजनिक क्षेत्र के अलग अलग विभागों के बीच आंकड़ों के आदान प्रदान के मानक और प्रोटोकॉल बनाकर आंकड़ों मौजूदा भंडारों को आपस में जोड़ा जाए और इनको उस डेटा से भी जोड़ा जाए जो कंपनियां और बहुपक्षीय संगठन सार्वजनिक रूप से उपलब्ध करा सकते हैं.
The views expressed above belong to the author(s). ORF research and analyses now available on Telegram! Click here to access our curated content — blogs, longforms and interviews.