Image Source: Getty
रक्षा मंत्रालय ने साल 2025 को ‘सुधारों के वर्ष’ के रूप में मनाने का फ़ैसला किया है. उसने इस साल उभरती हुई तकनीक, ख़ास तौर से रोबोटिक्स, मशीन लर्निंग और कृत्रिम बुद्धिमत्ता (आर्टिफिशियल इंटेलिजेंस-एआई) पर काम करने का संकल्प लिया है. यह थीम निश्चय ही 2024 के संकल्प की अगली कड़ी है, जिसे ‘तकनीकी समावेशन का वर्ष, सैनिकों का सशक्तिकरण’ के रूप में मनाया गया था. आम सोच यही है कि सैनिकों को केवल जंग के मैदान में और युद्ध के दौरान दक्ष बनाने की आवश्यकता होती है, लेकिन यह पूरी तरह सच नहीं है. ग़ैर-युद्ध संबंधी मामलों में, जैसे आंतरिक प्रशासन में, मंत्रालयों-विभागों-सचिवालयों जैसे सरकारी कार्यालयों के कामकाज में, रसद आपूर्ति में, कमांड और बिग्रेड स्तर की ख़रीद-प्रक्रिया में, कर्मियों को फिर से शिक्षित और प्रशिक्षित करने में, युद्ध अभ्यास में, आपदा राहत व बचाव अभियानों में, सैन्य सिद्धांतों के पालन में और तकनीकी नैतिकता आदि में सैनिकों की सहायता करके हम सेना को कहीं अधिक कुशल बनाने का एक लंबा रास्ता तय कर सकते हैं. भारतीय सशस्त्र बलों के भीतर आर्टिफिशियल इंटेलिजेंस का ‘समावेशन’, यानी AI को शामिल करने का काम पहले से ही शुरू हो चुका है. मगर हमारे सुरक्षा बल सिर्फ एआई उपयोगकर्ता की भूमिका नहीं निभा सकते, उनके पास AI क्षमताओं को स्वयं विकसित करने और उसे बढ़ाने की ताक़त है. हमें उनकी इस शक्ति का उपयोग करना चाहिए.
भारतीय सशस्त्र बलों के भीतर आर्टिफिशियल इंटेलिजेंस का ‘समावेशन’, यानी AI को शामिल करने का काम पहले से ही शुरू हो चुका है. मगर हमारे सुरक्षा बल सिर्फ एआई उपयोगकर्ता की भूमिका नहीं निभा सकते, उनके पास AI क्षमताओं को स्वयं विकसित करने और उसे बढ़ाने की ताक़त है. हमें उनकी इस शक्ति का उपयोग करना चाहिए.
साल 2018 में अपने गठन के बाद से ही, रक्षा मंत्रालय की रक्षा कृत्रिम बुद्धिमत्ता परियोजना एजेंसी (डीएआईपीए) ने भारतीय सशस्त्र बलों के साथ मिलकर चैटबॉट, ऑडियोबॉट और वीडियोबॉट जैसे कई AI उपकरण बनाए हैं, जिनका उपयोग दुनिया भर की सेनाओं की तरह ग़ैर-युद्ध क्षेत्रों में सैनिकों को वर्चुअली सहायता देने में किया जाता है. अप्रैल, 2024 में भारतीय सेना के दक्षिणी कमान ने अपने ‘तकनीकी समावेशन’ अभियान के तहत ‘समाधान’ नामक एक एआई चैटबॉट बनाया, जो हथियारों व सैन्य उपकरणों की ख़रीद और उससे जुड़ी नीतियों पर संबंधित अधिकारियों की उलझनों को दूर करने में मदद करता है.
भारतीय सेना का ही एक अन्य चैटबॉट ‘संबंध’ युद्ध के बहादुर सैनिकों और जान गंवाने वाले जाबांज़ों की विधवाओं को समर्पित है, जिसका काम उनके सवालों और शिकायतों को सीधे संबंधित अधिकारियों तक पहुंचाकर उन समस्याओं का समाधान करने और उनके बीच ज़रूरी जानकारियों को प्रसारित करने में सहायता करना है. ‘समाधान’ और ‘संबंध’ की तरह साल 2023 में अमेरिका की सूचना प्रौद्योगिकी कंपनी वर्ल्ड वाइड टेक्नोलॉजी ने ‘सार्जेंट एआई’ नामक एक AI मॉडल बनाया था, जो सैनिकों, ख़ास तौर से ग़ैर-कमीशन वाले अधिकारियों को अमेरिकी सैन्य नियमों के पालन में मदद करता है.
चीन का वर्चुअल AI कमांडर
इसी तरह, चीन की नेशनल डिफेंस यूनिवर्सिटी ने ‘वर्चुअल एआई कमांडर’ बनाया है, जो असली दुनिया के चीनी कमांडर का AI अवतार है. यह निचले रैंक के सैनिकों को कमांडर के न रहने पर आपातकालीन परिस्थितियों में जवाबी प्रतिक्रिया देने और वर्चुअल वार गेम में मदद करता है. चीनी सेना- पीपुल्स लिबरेशन आर्मी (पीएलए) की एकेडमी ऑफ़ मिलिट्री साइंसेज ने भी एक एआई चैटबॉट विकसित की है, जिसका मक़सद सैनिकों और खुफ़िया अधिकारियों को उनके सैन्य खुफ़िया अभियानों में सहायता करना और निर्णय लेने की उनकी क्षमता को बेहतर बनाना है. इस चैटबॉट का नाम ‘चैटबीआईटी’ है.
एआई अपनाने का पहला चरण था, AI वर्चुअल सहायक को अपनाना. अब दूसरे चरण में रक्षा क्षेत्र के लिए पूरी तरह समर्पित लार्ज लैंग्वेज मॉडल (एलएलएम) बनाया जा रहा है. अमेरिकी एआई कंपनी ‘स्केल एआई’ ने नवंबर, 2024 में ‘डिफेंस लामा’ लॉन्च किया, जो मेटा की लामा-3 पर आधारित एक लार्ज लैंग्वेंज मॉडल है. इसे अमेरिकी सुरक्षा अभियानों, विशेष रूप से खुफ़िया अभियानों, जवाबी सैन्य कार्रवाइयों की तैयारियों और विरोधियों की कमज़ोरियों को समझने के लिए बनाया गया है. कहा जाता है कि डिफेंस लामा एक विशाल डेटासेट पर प्रशिक्षित किया गया है, जिसमें सैन्य समझौतों/सिद्धांतों, अमेरिकी रक्षा विभाग की नीतियों, दिशा-निर्देशों और आर्टिफिशियल इंटेलिजेंस के नैतिक सिद्धांतों को शामिल किया गया है. इसका इस्तेमाल वे लोग कर रहे हैं, जो कमांड और कंट्रोल वाले प्लेटफ़ॉर्म, खुफ़िया एजेंसियां और फ़ैसले लेने वाले तंत्रों पर नियंत्रण रखते हैं.
इसी तरह, चीन की सेना, जो स्वदेशी ‘डीपसीक वी3एलएलएम’ की सफलता के बाद आत्मविश्वास से भरी हुई है, अब अपनी सैन्य ज़रूरतों के लिए मेटा या किसी अन्य अमेरिकी मॉडल पर शायद ही निर्भर रहना चाहेगी. यी, क्वेन, बाइचुआन, एक्सवर्स जैसी चीनी AI कंपनियों द्वारा निर्मित मंदारिन भाषा वाले लार्ज लैंग्वेज मॉडल पहले से ही सामान्य और पारंपरिक मंदारिन के साथ-साथ कजाख़, जिंगपो, ल्हासा तिब्बती जैसी चीन की जातीय अल्पसंख्यक भाषाओं और कुछ अन्य पूर्वी एशियाई भाषाओं में अच्छा काम कर रहे हैं. चीनी सेना जल्द ही सिनिटिक भाषाओं में अपनी श्रेष्ठता का लाभ उठाते हुए अपने लिए सिनिटिक भाषा वाले लार्ज लैंग्वेज मॉडल बना सकती है. इस तरह के मॉडल ग़ैर-युद्ध क्षेत्रों में व्यापक तौर पर फ़ायदेमंद हो सकते हैं. चीन की इस रणनीति को देखते हुए भारतीय रक्षा मंत्रालय को भी भारतीय भाषाओं वाले बहुभाषी लार्ज लैंग्वेंज मॉडल का लाभ उठाना चाहिए.
कोई भी AI भाषा मॉडल आमतौर पर आंटोलॉजी यानी वस्तुरूप विज्ञान, व्याकरण, शब्दकोष और कॉर्पर (लिखित या मौखिक रचनाओं या अभिव्यक्तियों के संग्रह) जैसे मापदंडों पर आधारित होता है, जो ख़ास बोली और लिखित भाषा से जुड़े तथ्यों की बुनियाद पर तैयार होते हैं. इन्हीं डेटाबेस के आधार पर एआई मॉडल में पैरामीटर, यानी मापदंड तय किए जाते हैं.
कोई भी AI भाषा मॉडल आमतौर पर आंटोलॉजी यानी वस्तुरूप विज्ञान, व्याकरण, शब्दकोष और कॉर्पर (लिखित या मौखिक रचनाओं या अभिव्यक्तियों के संग्रह) जैसे मापदंडों पर आधारित होता है, जो ख़ास बोली और लिखित भाषा से जुड़े तथ्यों की बुनियाद पर तैयार होते हैं. इन्हीं डेटाबेस के आधार पर एआई मॉडल में पैरामीटर, यानी मापदंड तय किए जाते हैं. जनवरी, 2025 तक मौजूदा अत्याधुनिक एलएलएम में 1.56 ट्रिलियन से अधिक मापदंड तैयार हो चुके थे, जो निश्चय ही अंग्रेजी भाषा के डेटाबेस के आधार पर तैयार किए गए हैं. हालांकि, भारत चाहे तो भारतीय भाषा में स्वदेशी मॉडल विकसित कर पूरी दुनिया में अपनी श्रेष्ठता साबित कर सकता है. मगर इसके लिए ज़रूरी होगा कि सार्वजनिक क्षेत्र की संस्थाओं के पास मौजूद विशाल पाठ्य व दृश्य-श्रव्य डेटा से इन स्वदेशी मॉडल का पैरामीटर तैयार किया जाए. इसलिए, देश में सबसे बड़ा नियोक्ता होने के कारण रक्षा मंत्रालय को स्वदेशी भारतीय भाषा वाले मॉडल बनाने की पहल करनी चाहिए, क्योंकि उसके पास भारतीय भाषा और अंग्रेजी भाषा का समृद्ध भंडार है.
भारत के सामने चुनौती
यह सही है कि भारत द्वारा स्वदेशी एलएमएम बनाने की राह में कुछ चुनौतियां हैं, लेकिन भारतीय एआई कंपनियों के पास भारतीय भाषा में दबदबा हासिल करने की काफी संभावना है. यहां भारतीय भाषाओं से मतलब हिंदी और देश की अन्य 21 आधिकारिक भाषाएं हैं. भारतीय ओपन-सोर्स AI स्टार्टअप ‘सर्वम 2बी’ का भारतीय भाषा का स्मॉल लैंग्वेंज मॉडल भले ही लामा के संशोधित ढांचे पर आधारित है, लेकिन यह अमेरिकी बुनियादी मॉडल की तुलना में भारतीय भाषाओं पर बहुत बेहतर काम करता है. लिहाज़ा, रक्षा मंत्रालय यदि भारतीय भाषा के बड़े-बड़े मॉडल (डेटा की संवेदनशीलता और नेटवर्क की सुरक्षा को देखते हुए क्लोज्ड-सोर्स मॉडल के रूप में) का लाभ उठाना चाहता है और एआई मॉडल के पैरामीटर बनाने के लिए अपने विशाल डेटाबेस को देने के लिए तैयार हो जाता है, तो वह न सिर्फ आंतरिक उपयोग के लिए क्लोज्ड-सोर्स रक्षा मॉडल बना सकता है, बल्कि अन्य क्षेत्रों में भी भारतीय भाषाओं के व्यापक उपयोग वाले AI मॉडल के निर्माण को प्रोत्साहित कर सकता है. मगर सवाल यह है कि रक्षा मंत्रालय को किस तरह इस दिशा में आगे बढ़ना चाहिए?
वास्तव में, उभरती हुई प्रौद्योगिकी में कुशलता हासिल करने और क्षमता निर्माण की दिशा में, जिसमें एआई भी शामिल है, बड़े कदमों की घोषणा भारतीय सेना ने पिछले दिनों की थी, जब उसने सेना शिक्षा कोर के माध्यम से 2025 के मध्य तक संभावनाशील तकनीकी क्षेत्रों में विशेषज्ञता हासिल करने की अपनी योजनाओं का एलान किया था. अब शिक्षा कोर का नाम बदलकर सेना ज्ञान और सक्षमता कोर (आर्मी नॉलेज ऐंड एनेबलर्स क्रॉप्स) कर दिया गया है. इस योजना के तहत स्नातकोत्तर डिग्री वाले डोमेन विशेषज्ञों को कमीशन अधिकारी रैंक में शामिल किया जाएगा, जबकि स्नातक डिग्री वाले विशेषज्ञों को जूनियर कमीशन अधिकारी रैंक दिया जाएगा.
रक्षा मंत्रालय के भीतर जूनियर कमीशन और ग़ैर-कमीशन रैंक के कर्मी ही नहीं, ग़ैर-सैन्य कर्मियों की एक बड़ी संख्या, अग्निवीर, प्रादेशिक सेना और राष्ट्रीय कैडेट कोर (एनसीसी) के कर्मी भी भारतीय भाषाओं, ख़ास तौर से हिंदी में ज़्यादा संचार करते हैं या सामग्रियों का उपभोग करते हैं.
रक्षा मंत्रालय के भीतर जूनियर कमीशन और ग़ैर-कमीशन रैंक के कर्मी ही नहीं, ग़ैर-सैन्य कर्मियों की एक बड़ी संख्या, अग्निवीर, प्रादेशिक सेना और राष्ट्रीय कैडेट कोर (एनसीसी) के कर्मी भी भारतीय भाषाओं, ख़ास तौर से हिंदी में ज़्यादा संचार करते हैं या सामग्रियों का उपभोग करते हैं. यह डेटा उपभोग और उत्पादन 1963 के राजभाषा अधिनियम के अनुरूप है, जो कई दशकों में और रक्षा मंत्रालय के तमाम विभागों व अन्य सरकारी संस्थानों के सामंजस्य से तैयार हुआ है. इसे डिजिटल बनाया जा सकता है और इसका उपयोग क्लोज्ड-सोर्स भारतीय भाषा रक्षा मॉडल में मापदंड बनाने में किया जा सकता है. इसमें अंग्रेजी भाषा के डेटा भंडार का अनुवाद उसी तरह किया जा सकता है, जिस तरह आईआईटी, बॉम्बे द्वारा AI प्रोजेक्ट ‘उड़ान’ के तहत ‘STEM’ (साइंस, टेक्नोलॉजी, इंजीनियरिंग और मैथ्स के शुरुआती वर्णों का संक्षेप शब्द) की किताबों का हिंदी और अन्य भारतीय भाषाओं में अनुवाद किया जा रहा है. यह मापदंडों को और विशाल बना देगा, जो एक समृद्ध लार्ज लैंग्वेज मॉडल की अनिवार्य ज़रूरत मानी जाती है.
सेना ज्ञान और सक्षमता कोर डीAIपीए, डीआरडीओ, निजी AI कंपनियों और असैन्य सरकारी प्रयोगशालाओं के साथ मिलकर इसके लिए ज़रूरी पारिस्थितिकी तंत्र बना सकता है. अगर हमारे सैनिकों को समय-अंतरिक्ष-बल-सूचना, यानी आधुनिक युद्ध लड़ना है या इंसान को सहयोग देने वाले उन्नत तकनीक का हिस्सा बनना है, तो एआई से उनका परिचय करना काफी ज़रूरी है. मगर इस AI को भी उसी भाषा में काम करना चाहिए, जिसमें हमारे सैनिक सोचते और बोलते हैं. इसके अलावा, प्रोजेक्ट ‘उद्धव’ के लिए भी भारतीय भाषा वाले रक्षा एआई मॉडल फायदेमंद हो सकते हैं, जिसकी शुरुआत भारतीय सेना द्वारा इसलिए की गई है, ताकि प्राचीन भारतीय ग्रंथों से प्राप्त युद्ध कला, राज्य कला, ऐतिहासिक अभियानों और नैतिकता संबंधी रणनीति को खोजकर उसका इस्तेमाल आधुनिक समय के सैन्य अभियानों में किया जा सके. इतना ही नहीं, सेना प्रशिक्षण कमान और रक्षा प्रबंधन कॉलेज के प्रशिक्षण एवं कौशल विकास पाठ्यक्रमों में संस्कृत और अन्य भारतीय भाषाओं की किताबों को शामिल करने से सैनिकों को दक्ष बनाने में भी काफी मदद मिलेगी. ज़ाहिर है, केंद्र सरकार के लिए इस तरह के भारतीय भाषा वाले लार्ज लैंग्वेज मॉडल को बढ़ावा देना उसकी सुरक्षा प्रतिबद्धता की दिशा में मील का पत्थर साबित होगा.
(जुई मराठे ऑब्ज़र्वर रिसर्च फ़ाउंडेशन में रिसर्च इंटर्न हैं)
(चैतन्य गिरि ऑब्ज़र्वर रिसर्च फ़ाउंडेशन में सुरक्षा, रणनीति और प्रौद्योगिकी केंद्र के फ़ेलो हैं)
The views expressed above belong to the author(s). ORF research and analyses now available on Telegram! Click here to access our curated content — blogs, longforms and interviews.