Published on Apr 15, 2023 Updated 0 Hours ago

DNA में डेटा भंडारण से विशाल डेटाबैंकों की ज़रूरत ख़त्म करने और दीर्घकाल में डेटा भंडारण के जलवायु पर पड़ने वाले प्रभावों को कम करने में मदद मिलेगी.

नवाचार की दुनिया: DNA में इंटरनेट के भंडारण की तैयारी

इनपुट, आउटपुट, प्रॉसेसिंग और डेटा भंडारण में बढ़ती दक्षता से प्रौद्योगिकी के क्षेत्र में नवाचार की जानकारी मिलती है. किसी भी प्रौद्योगिकीय नवाचार में एक प्रमुख क्षमताकारी ज़रूरत के तौर पर डेटा भंडारण की अहमियत जस की तस बनी हुई है. एक समय पर ब्लॉकचेन प्रौद्योगिकियों ने सुरक्षित डेटा भंडारण के संदर्भ में मुमकिन समाधान पेश किए. हालांकि ब्लॉकचेन प्रौद्योगिकियों के जलवायु पर गंभीर प्रभावों ने इसकी चमक फीकी कर दी है. 

1950 के दशक से डेटा को चुंबकीय टेपों के रील्स में भंडारित कर रखा जाता रहा है. नवाचार से जुड़े कुछ अन्य उपायों ने ऐसे वैकल्पिक समाधान मुहैया कराए, जिनकी लागत कम है और जो अपेक्षाकृत कम जगह लेते हैं.

1950 के दशक से डेटा को चुंबकीय टेपों के रील्स में भंडारित कर रखा जाता रहा है. नवाचार से जुड़े कुछ अन्य उपायों ने ऐसे वैकल्पिक समाधान मुहैया कराए, जिनकी लागत कम है और जो अपेक्षाकृत कम जगह लेते हैं. नतीजतन डेटा भंडारण अपेक्षाकृत अपरिवर्तनीय रहा है और अपनी बुनियाद के तौर पर (0 और 1) द्विचर का इस्तेमाल करता है. 2021 तक के आंकड़ों के मुताबिक उस साल तक तक़रीबन 10 खरब गीगाबाइट्स डेटा भंडार था, जिसमें रोज़ाना बढ़ोतरी हो रही है. इस डेटा को चुंबकीय टेपों में भंडारित करने में स्थान ख़र्च होता है. इतना ही नहीं समय के साथ-साथ ये ख़राब भी हो सकता है. इस प्रक्रिया में ये अनेक संसाधनों का बड़ी तादाद में उपभोग कर लेता है- जैसे स्थान, जलवायु नियंत्रण, ईंधन, चुंबकीय टेप्स और धातु. डेटा हानि से बचने के लिए नियमित तौर पर ऐसे संसाधन ख़र्च हो जाते हैं.  

DNA में डेटा भंडारण 

पिछले दशक में जैव-अभियंत्रण (bioengineering) के क्षेत्र में डेटा को DNA के तौर पर सहेज कर रखने की संभावनाओं पर शोध की शुरुआत हुई थी. DNA अच्छे से अनुसंधान किया हुआ और ठीक तरीक़े से समझा गया ढांचागत रुझान है, जो द्विचर कोड के समान ढांचा प्रस्तुत करता है. DNA तैयार करने वाले अणु चार प्रकार के होते हैं, एडेनिन (A), थायमिन (T), गुवानिन (G), और सायटोसिन (C). ये चार रसायन सभी DNA कोड्स के बुनियादी आधार होते हैं. इस प्रकार ये धरती पर जीवन तैयार करने की नींव मुहैया कराते हैं. ये अणु, द्विचर के समान आधार प्रस्तुत करते हैं. इस प्रकार ये भंडारण के विकल्प की छूट दे देते हैं. सैद्धांतिक रूप से अपने आकार से जुड़े फ़ायदों के चलते DNA दुनिया के सभी डेटा को कॉफ़ी के प्याले के आकार वाले स्वरूप में भंडारित करके रख सकता है. चुंबकीय टेप भंडारण पद्धति में इसके लिए फ़ुटबॉल के अनेक मैदानों के बराबर स्थान की दरकार होगी. 

DNA का भंडारण फ़िलहाल एक महंगी क़वायद है. इस कड़ी में DNA से आंकड़े जुटाने के लिए भारी निवेश की भी दरकार होती है.

DNA अणुओं के आकार और ढांचे सिर्फ़ A और T, और C और G के बीच ही जोड़ियों का निर्माण करते हैं. साथ ही ये पूरक क्रमों में घटित होते हैं, जिसे वाटसन-क्रिक पूरकता कहा जाता है. इस जुगलबंदी से संकेत मिलते हैं कि एक जोड़ी की मौजूदगी इस बात का सटीक पूर्वानुमान लगा सकती है कि इसके बाद कौन सी जोड़ी आएगी. लिहाज़ा पुनर्निर्माण के दौरान भी जोड़ों में और उसके नतीजतन द्विचर कोड को सटीक तरीक़े से दोबारा उत्पन्न (बिना डेटा का नुक़सान झेले) कराया जा सकता है. इसके तहत जोड़ी निर्माण की ज़रूरतों के मायने ये हैं कि DNA के क्रम की क्लोनिंग और पुनरुत्पादन के दौरान पूर्वानुमान लगाए जा सकते हैं. इस प्रक्रिया में प्रवेश कराए गए सिंथेटिक DNA डेटा की सटीक तरीक़े से नक़ल उतारी जा सकेगी. नतीजतन DNA को रखरखाव की ऊंची लागत या क़वायदों के बग़ैर प्रबंधित किया जा सकता है. इसके लिए भौतिक रूप से भरी जाने वाली प्रणालियों की दरकार नहीं होती. इतना ही नहीं DNA में भंडारित कर रखे गए डेटा की नगण्य लागत पर आसानी से नक़ल भी उतारी जा सकती है. DNA पुनरुत्पादन की तमाम पीढ़ियों में बग़ैर डेटा नुक़सान या ख़राबी के इसे अंजाम दिया जा सकता है.

DNA का भंडारण फ़िलहाल एक महंगी क़वायद है. इस कड़ी में DNA से आंकड़े जुटाने के लिए भारी निवेश की भी दरकार होती है. हालांकि अभिलेखीय उद्देश्यों से ये प्रक्रिया संभावित तौर पर लागत, ऊर्जा और समय की बचत करती है. इतना ही नहीं, नमक में पर्याप्त रूप से संजोए जाने पर इसे दशकों तक संरक्षित रखा जा सकता है. इस प्रक्रिया में जलवायु नियंत्रण से जुड़ी असीमित क़वायदों की भी दरकार नहीं पड़ती. साथ ही इस प्रक्रिया से संरक्षित डेटा, नियंत्रित डेटा सेंटरों के मुक़ाबले दीर्घकाल तक बरक़रार रहते हैं. मिसाल के तौर पर पौधों के बीजों में संरक्षित किए गए डेटा के लिए तापमान नियंत्रण की ज़रूरत नहीं पड़ेगी. ये लंबा जीवनकाल सुनिश्चित करती है, साथ ही डेटा का नुक़सान हुए बिना इसे आसानी से दोहराया जा सकता है.

सीमाएं और विकल्प

हरित समाधानों और प्रौद्योगिकीय नवाचारों के लिए DNA भंडारण आगे की ओर बढ़ाया गया ज़बरदस्त क़दम है. हालांकि इस प्रक्रिया में कुछ ख़ामियां भी हैं. प्राथमिक रूप से DNA सिंथेसिस प्रणालियां जैव रसायन पर निर्भर करती है. ये नए क़िस्म के नवाचार हैं. इस प्रक्रिया को कम ख़र्चीला बनाए जाने की ज़रूरत बरक़रार है. नियमित प्रयोगकर्ताओं के दैनिक समाधानों के तौर पर उभरने के लिए अभी इसे एक लंबा रास्ता तय करना होगा. इसमें भारी मौद्रिक निवेश की ज़रूरत होती है. साथ ही DNA में डेटा को क्रमित करने और उससे डेटा बाहर निकालने, इन दोनों कार्यों में काफ़ी समय भी ख़र्च होता है. इन दो वजहों के चलते मौजूदा सलाह यही है कि DNA भंडारण को अभिलेखीय मक़सदों से इस्तेमाल में लाया जाए या नाज़ुक और संवेदनशील डेटा (जैसे ब्लॉकचेन पासवर्ड्स) के बैकअप्स तैयार करने में इसे प्रयोग में लाया जाए.     

भले ही DNA डेटा भंडारण में प्राकृतिक रूप से घटने वाले DNA (जैसे पौधों) के लिए जलवायु नियंत्रण की दरकार नहीं होती, लेकिन सिंथेटिक DNA के लिए ठंडे और अंधकारमय भंडारण की ज़रूरत पड़ती है. इससे भंडारण क्षेत्रों से जुड़ी समस्या (जैसा चुंबकीय टेप्स के साथ है) एक बार फिर सामने आ खड़ी होती है. पारंपरिक इलेक्ट्रॉनिक डेटा के स्थान पर बार-बार DNA-आधारित डेटा भंडारण के सुझाव दिए जाते हैं. इससे जुड़े टिकाऊपन, सस्ती लागत और जगहों से जुड़ी ज़रूरतों के मद्देनज़र ऐसा होता है. बहरहाल कृत्रिम DNA और सूक्ष्मजीवों में भंडारण के लिए बदलावों और जेनेटिक कोडिंग की ज़रूरत पड़ती है, लिहाज़ा इस सिलसिले में वैकल्पिक रुख़ के सुझाव दिए जाते हैं. मसलन पौधों या सिंथेटिक डेटा में भंडारण की बजाए बीजों में डेटा को भंडारित किए जाने की सलाह दी जाती है.

फ़िलहाल डेटा स्टोरेज के लिए पौधों के बीजों में डेटा का भंडारण सबसे सस्ता और टिकाऊ समाधान है. इतना ही नहीं ये समाधान पूर्व में वर्णित सीमाओं की काट करते हैं. दरअसल स्रोत ख़ुद ही अपने बचावकारी उपाय करते हैं और उन्हें बहुतायत में सिंथेटिक रक्षा के बग़ैर भी भंडारित किया जा सकता है. 

इन ख़ामियों के बावजूद इसी क्षेत्र में भावी वैकल्पिक नवाचारों के चलते पिछले पांच वर्षों में कई कंपनियों ने इन सेवाओं की बिक्री का काम शुरू कर दिया है. वो डेटा को प्राकृतिक रूप से घटित होने वाले DNA और सिंथेटिक DNA, दोनों स्वरूपों में भंडारित कर रहे हैं.

DNA डेटा भंडारण में सरकारी निवेश     

अमेरिका में साल 2017 में मॉलिक्यूलर इंफ़ॉर्मेटिक्स प्रोग्राम का एलान किया गया था. इसने DNA-आधारित डेटा भंडारण में अनुसंधान का वित्त-पोषण किया था. इसी तरह के एक और कार्यक्रम- मॉलिक्यूलर इंफ़ॉर्मेशन स्टोरेज टेक्नोलॉजी (MIST) 2018 का लक्ष्य भी DNA भंडारण के आकार को और आगे बढ़ाकर लेखन में रोज़ाना 1 TB और पठन/दोबारा प्राप्ति में 10 TB डेटा प्रतिदिन तक ले जाना है. यूरोपीय संघ में भी द यूरोपियन बायोइंफ़ॉर्मेटिक्स इंस्टीट्यूट को साल 2013 से इस क्षेत्र में शोध के लिए वित्त मिलता रहा है. 

वैसे तो DNA डेटा भंडारण की क़वायद रोज़मर्रा या अल्पकाल में वाणिज्यिक इस्तेमाल के लिए समाधान नहीं है, लेकिन ये अभिलेखों को पहले से ज़्यादा टिकाऊ बनाने में मददगार रहती है.

शोध के इन क्षेत्रों में सरकारी वित्त पोषण से ज़ाहिर है कि प्रौद्योगिकीय नवाचारों से डेटा को पढ़ने वाले उपकरणों का आविष्कार होगा. ये डेटा को आज के मुक़ाबले कहीं ज़्यादा तेज़ गति से प्रॉसेस कर सकेंगे. इसके साथ ही इन उपकरणों में पहुंच की दोबारा प्राप्ति से जुड़ी प्रणालियों और अचानक प्रदर्शित होने वाले गुण होने चाहिए. इनमें ख़ास उद्देश्यों के लिए तैयार DNA भंडारण उपकरणों के संचालन की योग्यता भी होनी चाहिए. ये नवाचार DNA डेटा भंडारण के लिए नाज़ुक हैं और डेटा भंडारण उद्योग को ज़बरदस्त रूप से प्रभावित करने के लिए तत्पर हैं.

वैसे तो DNA डेटा भंडारण की क़वायद रोज़मर्रा या अल्पकाल में वाणिज्यिक इस्तेमाल के लिए समाधान नहीं है, लेकिन ये अभिलेखों को पहले से ज़्यादा टिकाऊ बनाने में मददगार रहती है. साथ ही जलवायु दक्षता की ओर आगे बढ़ने में भी सहायक साबित होती है. प्रौद्योगिकीय विकास के बुनियादी प्रश्नों से सामना होने पर ये स्थान और अन्य संसाधनों का किफ़ायती इस्तेमाल भी करते हैं.

इससे पहले कि ये नवाचार रोज़मर्रा की प्रौद्योगिकी का हिस्सा बन जाए, इसे पहले अभिलेखीय और बहीखातों के रखरखाव से जुड़ी क़वायदों के साथ जोड़ा जाना चाहिए. इस तरह विशाल डेटाबैंक्स को हटाना मुमकिन हो सकेगा. यही भंडारगृह अब तक विश्व की सूचनाओं को इकट्ठा कर रखते रहे हैं. इतना ही नहीं ये क़वायद कई और अहम मसलों का भी निपटारा कर देगी. चूंकि डेटा भंडारण और ब्लॉकचेन प्रौद्योगिकियों का जलवायु पर प्रभाव होता है, लिहाज़ा ऊपर बताए गए नवाचार के ज़रिए दीर्घकाल में डेटा केंद्रों के आर्थिक और सामाजिक लागतों को घटाया जा सकेगा. 

The views expressed above belong to the author(s). ORF research and analyses now available on Telegram! Click here to access our curated content — blogs, longforms and interviews.