इनपुट, आउटपुट, प्रॉसेसिंग और डेटा भंडारण में बढ़ती दक्षता से प्रौद्योगिकी के क्षेत्र में नवाचार की जानकारी मिलती है. किसी भी प्रौद्योगिकीय नवाचार में एक प्रमुख क्षमताकारी ज़रूरत के तौर पर डेटा भंडारण की अहमियत जस की तस बनी हुई है. एक समय पर ब्लॉकचेन प्रौद्योगिकियों ने सुरक्षित डेटा भंडारण के संदर्भ में मुमकिन समाधान पेश किए. हालांकि ब्लॉकचेन प्रौद्योगिकियों के जलवायु पर गंभीर प्रभावों ने इसकी चमक फीकी कर दी है.
1950 के दशक से डेटा को चुंबकीय टेपों के रील्स में भंडारित कर रखा जाता रहा है. नवाचार से जुड़े कुछ अन्य उपायों ने ऐसे वैकल्पिक समाधान मुहैया कराए, जिनकी लागत कम है और जो अपेक्षाकृत कम जगह लेते हैं.
1950 के दशक से डेटा को चुंबकीय टेपों के रील्स में भंडारित कर रखा जाता रहा है. नवाचार से जुड़े कुछ अन्य उपायों ने ऐसे वैकल्पिक समाधान मुहैया कराए, जिनकी लागत कम है और जो अपेक्षाकृत कम जगह लेते हैं. नतीजतन डेटा भंडारण अपेक्षाकृत अपरिवर्तनीय रहा है और अपनी बुनियाद के तौर पर (0 और 1) द्विचर का इस्तेमाल करता है. 2021 तक के आंकड़ों के मुताबिक उस साल तक तक़रीबन 10 खरब गीगाबाइट्स डेटा भंडार था, जिसमें रोज़ाना बढ़ोतरी हो रही है. इस डेटा को चुंबकीय टेपों में भंडारित करने में स्थान ख़र्च होता है. इतना ही नहीं समय के साथ-साथ ये ख़राब भी हो सकता है. इस प्रक्रिया में ये अनेक संसाधनों का बड़ी तादाद में उपभोग कर लेता है- जैसे स्थान, जलवायु नियंत्रण, ईंधन, चुंबकीय टेप्स और धातु. डेटा हानि से बचने के लिए नियमित तौर पर ऐसे संसाधन ख़र्च हो जाते हैं.
DNA में डेटा भंडारण
पिछले दशक में जैव-अभियंत्रण (bioengineering) के क्षेत्र में डेटा को DNA के तौर पर सहेज कर रखने की संभावनाओं पर शोध की शुरुआत हुई थी. DNA अच्छे से अनुसंधान किया हुआ और ठीक तरीक़े से समझा गया ढांचागत रुझान है, जो द्विचर कोड के समान ढांचा प्रस्तुत करता है. DNA तैयार करने वाले अणु चार प्रकार के होते हैं, एडेनिन (A), थायमिन (T), गुवानिन (G), और सायटोसिन (C). ये चार रसायन सभी DNA कोड्स के बुनियादी आधार होते हैं. इस प्रकार ये धरती पर जीवन तैयार करने की नींव मुहैया कराते हैं. ये अणु, द्विचर के समान आधार प्रस्तुत करते हैं. इस प्रकार ये भंडारण के विकल्प की छूट दे देते हैं. सैद्धांतिक रूप से अपने आकार से जुड़े फ़ायदों के चलते DNA दुनिया के सभी डेटा को कॉफ़ी के प्याले के आकार वाले स्वरूप में भंडारित करके रख सकता है. चुंबकीय टेप भंडारण पद्धति में इसके लिए फ़ुटबॉल के अनेक मैदानों के बराबर स्थान की दरकार होगी.
DNA का भंडारण फ़िलहाल एक महंगी क़वायद है. इस कड़ी में DNA से आंकड़े जुटाने के लिए भारी निवेश की भी दरकार होती है.
DNA अणुओं के आकार और ढांचे सिर्फ़ A और T, और C और G के बीच ही जोड़ियों का निर्माण करते हैं. साथ ही ये पूरक क्रमों में घटित होते हैं, जिसे वाटसन-क्रिक पूरकता कहा जाता है. इस जुगलबंदी से संकेत मिलते हैं कि एक जोड़ी की मौजूदगी इस बात का सटीक पूर्वानुमान लगा सकती है कि इसके बाद कौन सी जोड़ी आएगी. लिहाज़ा पुनर्निर्माण के दौरान भी जोड़ों में और उसके नतीजतन द्विचर कोड को सटीक तरीक़े से दोबारा उत्पन्न (बिना डेटा का नुक़सान झेले) कराया जा सकता है. इसके तहत जोड़ी निर्माण की ज़रूरतों के मायने ये हैं कि DNA के क्रम की क्लोनिंग और पुनरुत्पादन के दौरान पूर्वानुमान लगाए जा सकते हैं. इस प्रक्रिया में प्रवेश कराए गए सिंथेटिक DNA डेटा की सटीक तरीक़े से नक़ल उतारी जा सकेगी. नतीजतन DNA को रखरखाव की ऊंची लागत या क़वायदों के बग़ैर प्रबंधित किया जा सकता है. इसके लिए भौतिक रूप से भरी जाने वाली प्रणालियों की दरकार नहीं होती. इतना ही नहीं DNA में भंडारित कर रखे गए डेटा की नगण्य लागत पर आसानी से नक़ल भी उतारी जा सकती है. DNA पुनरुत्पादन की तमाम पीढ़ियों में बग़ैर डेटा नुक़सान या ख़राबी के इसे अंजाम दिया जा सकता है.
DNA का भंडारण फ़िलहाल एक महंगी क़वायद है. इस कड़ी में DNA से आंकड़े जुटाने के लिए भारी निवेश की भी दरकार होती है. हालांकि अभिलेखीय उद्देश्यों से ये प्रक्रिया संभावित तौर पर लागत, ऊर्जा और समय की बचत करती है. इतना ही नहीं, नमक में पर्याप्त रूप से संजोए जाने पर इसे दशकों तक संरक्षित रखा जा सकता है. इस प्रक्रिया में जलवायु नियंत्रण से जुड़ी असीमित क़वायदों की भी दरकार नहीं पड़ती. साथ ही इस प्रक्रिया से संरक्षित डेटा, नियंत्रित डेटा सेंटरों के मुक़ाबले दीर्घकाल तक बरक़रार रहते हैं. मिसाल के तौर पर पौधों के बीजों में संरक्षित किए गए डेटा के लिए तापमान नियंत्रण की ज़रूरत नहीं पड़ेगी. ये लंबा जीवनकाल सुनिश्चित करती है, साथ ही डेटा का नुक़सान हुए बिना इसे आसानी से दोहराया जा सकता है.
सीमाएं और विकल्प
हरित समाधानों और प्रौद्योगिकीय नवाचारों के लिए DNA भंडारण आगे की ओर बढ़ाया गया ज़बरदस्त क़दम है. हालांकि इस प्रक्रिया में कुछ ख़ामियां भी हैं. प्राथमिक रूप से DNA सिंथेसिस प्रणालियां जैव रसायन पर निर्भर करती है. ये नए क़िस्म के नवाचार हैं. इस प्रक्रिया को कम ख़र्चीला बनाए जाने की ज़रूरत बरक़रार है. नियमित प्रयोगकर्ताओं के दैनिक समाधानों के तौर पर उभरने के लिए अभी इसे एक लंबा रास्ता तय करना होगा. इसमें भारी मौद्रिक निवेश की ज़रूरत होती है. साथ ही DNA में डेटा को क्रमित करने और उससे डेटा बाहर निकालने, इन दोनों कार्यों में काफ़ी समय भी ख़र्च होता है. इन दो वजहों के चलते मौजूदा सलाह यही है कि DNA भंडारण को अभिलेखीय मक़सदों से इस्तेमाल में लाया जाए या नाज़ुक और संवेदनशील डेटा (जैसे ब्लॉकचेन पासवर्ड्स) के बैकअप्स तैयार करने में इसे प्रयोग में लाया जाए.
भले ही DNA डेटा भंडारण में प्राकृतिक रूप से घटने वाले DNA (जैसे पौधों) के लिए जलवायु नियंत्रण की दरकार नहीं होती, लेकिन सिंथेटिक DNA के लिए ठंडे और अंधकारमय भंडारण की ज़रूरत पड़ती है. इससे भंडारण क्षेत्रों से जुड़ी समस्या (जैसा चुंबकीय टेप्स के साथ है) एक बार फिर सामने आ खड़ी होती है. पारंपरिक इलेक्ट्रॉनिक डेटा के स्थान पर बार-बार DNA-आधारित डेटा भंडारण के सुझाव दिए जाते हैं. इससे जुड़े टिकाऊपन, सस्ती लागत और जगहों से जुड़ी ज़रूरतों के मद्देनज़र ऐसा होता है. बहरहाल कृत्रिम DNA और सूक्ष्मजीवों में भंडारण के लिए बदलावों और जेनेटिक कोडिंग की ज़रूरत पड़ती है, लिहाज़ा इस सिलसिले में वैकल्पिक रुख़ के सुझाव दिए जाते हैं. मसलन पौधों या सिंथेटिक डेटा में भंडारण की बजाए बीजों में डेटा को भंडारित किए जाने की सलाह दी जाती है.
फ़िलहाल डेटा स्टोरेज के लिए पौधों के बीजों में डेटा का भंडारण सबसे सस्ता और टिकाऊ समाधान है. इतना ही नहीं ये समाधान पूर्व में वर्णित सीमाओं की काट करते हैं. दरअसल स्रोत ख़ुद ही अपने बचावकारी उपाय करते हैं और उन्हें बहुतायत में सिंथेटिक रक्षा के बग़ैर भी भंडारित किया जा सकता है.
इन ख़ामियों के बावजूद इसी क्षेत्र में भावी वैकल्पिक नवाचारों के चलते पिछले पांच वर्षों में कई कंपनियों ने इन सेवाओं की बिक्री का काम शुरू कर दिया है. वो डेटा को प्राकृतिक रूप से घटित होने वाले DNA और सिंथेटिक DNA, दोनों स्वरूपों में भंडारित कर रहे हैं.
DNA डेटा भंडारण में सरकारी निवेश
अमेरिका में साल 2017 में मॉलिक्यूलर इंफ़ॉर्मेटिक्स प्रोग्राम का एलान किया गया था. इसने DNA-आधारित डेटा भंडारण में अनुसंधान का वित्त-पोषण किया था. इसी तरह के एक और कार्यक्रम- मॉलिक्यूलर इंफ़ॉर्मेशन स्टोरेज टेक्नोलॉजी (MIST) 2018 का लक्ष्य भी DNA भंडारण के आकार को और आगे बढ़ाकर लेखन में रोज़ाना 1 TB और पठन/दोबारा प्राप्ति में 10 TB डेटा प्रतिदिन तक ले जाना है. यूरोपीय संघ में भी द यूरोपियन बायोइंफ़ॉर्मेटिक्स इंस्टीट्यूट को साल 2013 से इस क्षेत्र में शोध के लिए वित्त मिलता रहा है.
वैसे तो DNA डेटा भंडारण की क़वायद रोज़मर्रा या अल्पकाल में वाणिज्यिक इस्तेमाल के लिए समाधान नहीं है, लेकिन ये अभिलेखों को पहले से ज़्यादा टिकाऊ बनाने में मददगार रहती है.
शोध के इन क्षेत्रों में सरकारी वित्त पोषण से ज़ाहिर है कि प्रौद्योगिकीय नवाचारों से डेटा को पढ़ने वाले उपकरणों का आविष्कार होगा. ये डेटा को आज के मुक़ाबले कहीं ज़्यादा तेज़ गति से प्रॉसेस कर सकेंगे. इसके साथ ही इन उपकरणों में पहुंच की दोबारा प्राप्ति से जुड़ी प्रणालियों और अचानक प्रदर्शित होने वाले गुण होने चाहिए. इनमें ख़ास उद्देश्यों के लिए तैयार DNA भंडारण उपकरणों के संचालन की योग्यता भी होनी चाहिए. ये नवाचार DNA डेटा भंडारण के लिए नाज़ुक हैं और डेटा भंडारण उद्योग को ज़बरदस्त रूप से प्रभावित करने के लिए तत्पर हैं.
वैसे तो DNA डेटा भंडारण की क़वायद रोज़मर्रा या अल्पकाल में वाणिज्यिक इस्तेमाल के लिए समाधान नहीं है, लेकिन ये अभिलेखों को पहले से ज़्यादा टिकाऊ बनाने में मददगार रहती है. साथ ही जलवायु दक्षता की ओर आगे बढ़ने में भी सहायक साबित होती है. प्रौद्योगिकीय विकास के बुनियादी प्रश्नों से सामना होने पर ये स्थान और अन्य संसाधनों का किफ़ायती इस्तेमाल भी करते हैं.
इससे पहले कि ये नवाचार रोज़मर्रा की प्रौद्योगिकी का हिस्सा बन जाए, इसे पहले अभिलेखीय और बहीखातों के रखरखाव से जुड़ी क़वायदों के साथ जोड़ा जाना चाहिए. इस तरह विशाल डेटाबैंक्स को हटाना मुमकिन हो सकेगा. यही भंडारगृह अब तक विश्व की सूचनाओं को इकट्ठा कर रखते रहे हैं. इतना ही नहीं ये क़वायद कई और अहम मसलों का भी निपटारा कर देगी. चूंकि डेटा भंडारण और ब्लॉकचेन प्रौद्योगिकियों का जलवायु पर प्रभाव होता है, लिहाज़ा ऊपर बताए गए नवाचार के ज़रिए दीर्घकाल में डेटा केंद्रों के आर्थिक और सामाजिक लागतों को घटाया जा सकेगा.
The views expressed above belong to the author(s). ORF research and analyses now available on Telegram! Click here to access our curated content — blogs, longforms and interviews.