डीपसीक गाथा में भारत के लिए मौजूद सबक
डीपसीक की धूमधाम के तुरंत बाद, भारत ने बुनियादी मॉडल विकसित करने के लिए परियोजनाओं का एक समुच्चय घोषित किया। हालांकि डीपसीक व्यावसायिक उद्यम है, जिसका मकसद वैश्विक बाजारों में मुनाफा कमाना है। वहीं, भारतजेन रणनीतिक राष्ट्रीय मिशन है, जो...
डीपसीक की धूमधाम के तुरंत बाद, भारत ने बुनियादी मॉडल विकसित करने के लिए परियोजनाओं का एक समुच्चय घोषित किया। हालांकि डीपसीक व्यावसायिक उद्यम है, जिसका मकसद वैश्विक बाजारों में मुनाफा कमाना है। वहीं, भारतजेन रणनीतिक राष्ट्रीय मिशन है, जो तकनीकी संप्रभुता प्राप्ति पर केंद्रित है। इसके जरिये सार्वजनिक भलाई में संतुलन बनाकर चलना होगा।
इस वर्ष जनवरी में, एक अल्पज्ञात चीनी स्टार्टअप ने नाटकीय घोषणा की, जिसने कृत्रिम बुद्धिमत्ता (एआई) की दुनिया को हिला दिया। कंपनी थी ‘डीपसीक’, जिसने अपने लार्ज लेंग्वेज मॉडल यानी एलएलएम को अमेरिकी तकनीकी दिग्गजों, जैसे कि चैट जीपीटी के विकसित मॉडलों के साथ प्रतिस्पर्धा करने के लिए जारी किया।
जिस चीज़ ने सब को हैरान किया, वह था इसको विकसित करने में आई बेहद कम लागत, यह सैकड़ों अरब डॉलर खर्च करके सिलिकॉन वैली के दिग्गजों द्वारा विकसित किए एआई की तुलना में अंश मात्र है। इस नई घटना ने दुनिया को दिखा दिया कि एआई क्षेत्र में चीन बहुत आगे है और अमेरिका तकनीकी विकास में एकमात्र प्रभावी शक्ति नहीं रहा। अब, विज्ञान पत्रिका ‘नेचर’ ने डीपसीक के संस्थापक लियांग वेनफेंग को 2025 के दौरान वैश्विक स्तर के प्रमुख वैज्ञानिक विकास के पीछे के शीर्ष 10 लोगों में नामित किया है।
डीपसीक का सामान्य उद्देश्य ‘वी-3 मॉडल’ और उन्नत मॉडल, ‘आर-1’ ने केवल सनसनीखेज सुर्खियां बटोरी बल्कि करीब एक वर्ष में एआई परिदृश्य में महत्वपूर्ण बदलाव भी लाए हैं। ‘आर-1’ एक तर्कशील एलएलएम है जो गणित और कोडिंग में जटिल कार्यों को संभाल सकता है। चीनी फर्म ने अमेरिकी कंपनियों से एक कदम आगे बढ़ते हुए डीपसीक को एक ओपन मॉडल बना दिया, जिसके तहत शोधकर्ताओं को विभिन्न क्षेत्रों के लिए मॉडल के एल्गोरिद्म अपने अनुसार अनुकूलित करने की अनुमति है। कंपनी ने यह राज़ भी खोला कि वह ‘प्रशिक्षण’ लागत इतनी कम कैसे रख पाई।
सभी एलएलएम को पहले विशाल मात्रा में डेटा भरना पड़ता है या उन्हें कुशल बनाने के लिए ‘डेटा-प्रशिक्षित’ करना पड़ता है। एक उद्योग सर्वेक्षण से पता चला है कि इस वर्ष चीनी मॉडल एआई बाजार में तेजी से आगे बढ़े हैं, जिसकी बदौलत वे इस तकनीक के वैश्विक उपयोग का एक-तिहाई हिस्सा बन चुके हैं। टोकन वॉल्यूम में इंग्लिश के बाद चीनी भाषा के प्रॉम्प्ट दूसरे स्थान पर हैं। यह दर्शाता है, चीनी मॉडल वैश्विक स्तर पर अच्छा कर रहे हैं और चीन के भीतर भी व्यापक रूप से उपयोग किए जा रहे। टोकन डेटा की वे इकाइयां हैं जिन्हें एआई मॉडल द्वारा ट्रेनिंग और अनुमान के दौरान संसाधित किया जाता है व ये भविष्यवाणी, सृजन और तर्क को सक्षम करने में मदद करते हैं।
डीपसीक की धूमधाम के तुरंत बाद, भारत ने भी बुनियादी मॉडल विकसित करने के लिए परियोजनाओं का एक समुच्चय घोषित किया, जिसमें एलएलएम, लघुभाषा मॉडल और भारतीय आवश्यकताओं के लिए उपयुक्त समस्या-विशिष्ट एआई समाधान शामिल हैं। इस योजना में ‘डिजिटल इंडिया भाषिणी’ (भारतीय भाषाओं के लिए एआई भाषा अनुवाद प्लेटफॉर्म), भारतजेन (सार्वजनिक सेवा वितरण के लिए मल्टीमॉडल एलएलएम), सर्वम-1 एआई मॉडल (10 भारतीय भाषाओं के लिए एलएलएम), चित्रलेखा (वीडियो ट्रांसक्रिएशन प्लेटफॉर्म) और ‘हनुमान’स एवरेस्ट’ 1.0 (35 भारतीय भाषाओं के लिए बहुभाषाई एआई प्रणाली) का विकास करना शामिल है। प्रौद्योगिकी संस्थानों का संघ यानी ‘भारतजेन’ मुख्यालय आईआईटी-बॉम्बे में स्थापित किया गया है; इसे विभिन्न मंत्रालयों से वित्त पोषण के साथ ‘संप्रभु बहुभाषी एलएलएम’ विकास का कार्य सौंपा गया, जिसमें राष्ट्रीय एआई मिशन से 980 करोड़ रुपये शामिल हैं। यह वित्तीय मदद भारतजेन को एलएलएम विकसित करने के लिए राष्ट्रीय लक्ष्य के रूप में पहला ऐसा उद्यम बनाती है।
चूंकि भारतीय घोषणा डीपसीक के ऐलान के तुरंत बाद आई, भारतजेन को चीनी पहल के सीधे जवाब के रूप में देखा गया। हालांकि, महत्वपूर्ण अंतर हैं। डीपसीक एक व्यावसायिक उद्यम है, जो स्टार्टअप मोड में निर्मित है और जिसका मंतव्य वैश्विक बाजारों में उपयोग है। वहीं, भारतजेन रणनीतिक राष्ट्रीय मिशन है, जो पूरा सरकार द्वारा वित्त पोषित होगा और तकनीकी संप्रभुता प्राप्ति पर केंद्रित है। चैट जीपीटी और डीपसीक जैसे वैश्विक मॉडलों की प्रमुख चुनौती भारत की जटिल भाषाई व सांस्कृतिक विविधता समझना है। भारतजेन यह अंतर भरने का प्रयास करेगा क्योंकि इसे भारतीय-विशिष्ट डेटा की विशाल मात्रा पर प्रशिक्षित किया जाएगा। डीपसीक के मॉडल सामान्य उद्देश्य के हैं और वैश्विक उपभोग के लिए बनाए हैं, जबकि भारतजेन भारत-विशिष्ट होगा। सबसे बड़ा अंतर यह है कि डीपसीक पहले से बाजार में है, जबकि भारतजेन ने अभी ठोस समय सीमा की घोषणा नहीं की। चैट जीपीटी, डीपसीक और अन्य ऐसे एलएलएम मॉडल विकसित करने वाली कंपनियों के विपरीत, भारतजेन वाणिज्यिक उद्यम नहीं। इसे इस महीने आईआईटी-बॉम्बे द्वारा एक गैर-लाभकारी कंपनी के रूप में पंजीकृत किया गया। भले यह पूरी तरह सरकारी वित्तपोषित है, तथापि यह एक कॉर्पोरेट इकाई होगा। आईआईटी प्रोफेसर गणेश रामकृष्णन जो भारतजेन टेक्नोलॉजी फाउंडेशन के प्रमुख हैं, ने स्पष्ट किया कि एआई मॉडल को प्रयोगशाला से बाजार में लाया जा सके इसके लिए स्वायत्तता और संचालन लचीलापन आवश्यक है।
भारतजेन दिलचस्प उदाहरण है जिसे ‘सरकारी उद्यमिता’ कहा जा सकता है—1970 और 1980 के दशक का एक मॉडल। उस समय के दो सफलतम तकनीकी उद्यम -कंप्यूटर मेंटेनेंस कॉर्पोरेशन (सीएमसी) और सेंटर फॉर टेलीमैटिक्स (सी-डॉट)- ने इस मॉडल का पालन किया। दोनों का गठन तकनीकी संप्रभुता स्थापित करना और रणनीतिक क्षेत्रों में आत्मनिर्भरता बढ़ाने के लिए किया गया था। दोनों मामलों में, आईआईटी और टाटा इंस्टीट्यूट ऑफ फंडामेंटल रिसर्च जैसे शोध संस्थानों का योगदान अहम रहा। आधारभूत मॉडलों के विकास में भारतीय तकनीकी निजी कंपनियों की बेरुखी रोचक है, हालांकि निजी क्षेत्र ने डेटा केंद्रों जैसी एआई अवसंरचना बनाने में वैश्विक कंपनियों के साथ सहयोग करने के लिए उत्साह दिखाया। भारतीय तकनीकी सेवा उद्योग, जिसकी आय करीब 200 अरब डॉलर है, को तेजी से बदलते एआई परिदृश्य में मात्र दर्शक या बाहरी तकनीक अपनाने वाले के रूप में नहीं रहना चाहिए। इसके पास प्रतिभा, अनुभव और वित्तीय शक्ति है जिसका उपयोग भारतजेन जैसे राष्ट्रीय उद्यमों हेतु करना चाहिए।
डीपसीक एक चीनी मात्रात्मक हेज फंड, हाई फ्लेयर के स्वामित्व वाला और वित्तपोषित है। दोनों कंपनियों के संस्थापक व सीईओ लियांगवेनफेंग हैं। इसे सरकार द्वारा वित्तीय मदद नहीं मिलती, लेकिन इसके द्वारा विकसित मॉडल सरकारी सेंसरशिप नियमों का पालन करते हैं। वर्तमान चीनी नियमों के अनुसार सभी एआई सेवाओं के लिए जरूरी है कि वे समाजवादी बुनियादी मूल्य प्रतिबिंबित करने वाली हो और उन्हें ऐसी सामग्री वितरित करने से बचना चाहिए जो ‘राज्य शक्ति को कमजोर’ करें’ या ‘राष्ट्रीय एकता को चोट पहुंचाने वाली’ हों। यही वजह है, चीनी एआई मॉडल तियानमिन स्क्वायर प्रदर्शन, ताइवान की स्थिति, मानवाधिकार उल्लंघन और चीनी कम्युनिस्ट पार्टी नेतृत्व की आलोचना जैसे विषय पर चुप्पी साध लेते हैं या आधिकारिक दृष्टि प्रदान करते हैं।
भारत एआई गवर्नेंस गाइडलाइंस, जो कि पिछले महीने जारी की गई थीं, ‘जिम्मेदार एआई विकास’ की बात कहती हैं और जवाबदेही, निष्पक्षता, सुरक्षा और मानव निगरानी की जरूरत रेखांकित करती हैं। राज्य-वित्त पोषित भारतजेन को सरकारी समर्थन और सार्वजनिक भलाई के बीच संतुलन बनाते हुए कड़ी परीक्षा से गुजरना होगा। इसके मॉडल को पश्चिमी मॉडलों में देखे गए एल्गोरिद्मिक पूर्वाग्रहों से बचना होगा और चीनी मॉडलों में मौजूद भ्रामक सूचनाओं व संभावित राजनीतिक प्रभाव से भी दूर रहना होगा।
क्योंकि इसे करदाता के पैसे से वित्तपोषित किया जा रहा है, सो भारतजेन को विभिन्न भाषा मॉडलों के लिए अपने एलएलएम मॉडल विकसित करते समय पारदर्शिता और जवाबदेही के सिद्धांतों का अवश्य पालन करना होगा। इसके विकास में भाषा वैज्ञानिकों, सामाजिक-वैज्ञानिकों और विभिन्न क्षेत्रों के विशेषज्ञों को साथ जोड़ना मजबूत एआई मॉडल विकसित करने और दूसरों की गलतियों से बचने में मददगार रहेगा।
लेखक विज्ञान संबंधी विषयों के विशेषज्ञ हैं।

