एआई मॉडल और कॉपीराइट कंटेंट के दुरुपयोग का सवाल
एआई कंपनियां कॉपीराइट वाले कंटेंट के उपयोग से एलएलएम मॉडल प्रशिक्षित कर बिजनेस कर रही हैं जो सवालों के घेरे में है। बेशक एलएलएम व अन्य मॉडल तकनीकी नवोन्मेष का नतीजा है, लेकिन यह दशकों से लाखों रचनाकारों द्वारा निर्मित...
एआई कंपनियां कॉपीराइट वाले कंटेंट के उपयोग से एलएलएम मॉडल प्रशिक्षित कर बिजनेस कर रही हैं जो सवालों के घेरे में है। बेशक एलएलएम व अन्य मॉडल तकनीकी नवोन्मेष का नतीजा है, लेकिन यह दशकों से लाखों रचनाकारों द्वारा निर्मित काम की डिजिटल चोरी पर टिका है। प्रस्तावित कॉपीराइट फ्रेमवर्क में रचनाकारों के हितों को प्राथमिकता देनी चाहिए।
जैसे ही साल खत्म हो रहा था, उद्योग और आंतरिक व्यापार संवर्धन विभाग ने ‘जेनरेटिव एआई एंड कॉपीराइट’ पर एक कार्यपत्र प्रकाशित किया। यह अप्रैल, 2025 में आर्टिफिशियल इंटेलिजेंस के युग में कॉपीराइट सुरक्षा के जटिल सवाल की जांच के लिए गठित की गई एक विशेषज्ञ समिति की रिपोर्ट है, और इसके निष्कर्षों से निकट भविष्य में कॉपीराइट और जेनरेटिव एआई के संबंध में भारत की आधिकारिक नीति का आधार बनने की सर्वाधिक संभावना है। जेनरेटिव एआई उत्पाद जैसे कि चैटजीपीटी, जेमिनी, परप्लेक्सिटी इत्यादि लार्ज लैंग्वेज मॉडल (एलएलएम) हैं, जो यूजर्स द्वारा दिए गए प्रॉम्पट्स (निर्देश) के आधार पर कंटेंट उत्पन्न करके देते हैं। मसलन, कोई व्यक्ति चैट जीपीटी को कहे कि आरके नारायण या मुंशी प्रेमचंद की शैली में एक लघु कहानी लिखकर दो, और वह उसे उत्पन्न कर दे। इसी तरह, डाल-ई, मिडजर्नी (और इस जैसे टेक्स्ट-टू-इमेज और टेक्स्ट-टू-वीडियो जेनरेशन मॉडल) दिए गए विषय पर पेंटिंग बनाकर पेश कर सकते हैं, जिसके लिए निर्देश दिए जाएं कि इनकी शैली जैमिनी रॉय या एमएफ हुसैन जैसी हो। या फिर सत्यजीत रे की शैली में एक लघु फिल्म क्लिप बनाने को कहा जाए। जेनरेटिव एआई मॉडल से उत्पन्न होने वाली सामग्री उनके प्रशिक्षण पर आधारित होती है, जिसमें विभिन्न प्रकार के स्रोत (जैसे नारायण के उपन्यास या हुसैन और अन्य की पेंटिंग) से प्राप्त डेटा का उपयोग किया जाता है।
एआई मॉडल को प्रशिक्षित करने के लिए उपयोग किया जाने वाला डेटा विभिन्न श्रेणियों वाला हो सकता है- कॉपीराइटेड, कॉपीराइट-समाप्त और सार्वजनिक डोमेन में ‘उचित उपयोग’ की अनुमति वाला उपलब्ध डेटा। जब से प्रौद्योगिकी फर्मों ने जेनरेटिव एआई उत्पादों के व्यावसायिक संस्करण लॉन्च किए हैं, किताबों, शोधपत्रों, तस्वीरों, फिल्मों और रचनात्मक अभिव्यक्तियों के विभिन्न रूपों जैसी कॉपीराइटेड सामग्री में उनके उपयोग का सवाल एआई बहस का केंद्र बन गया है। इसने जटिल कानूनी, नैतिक और औचित्य संबंधी प्रश्न खड़े कर दिए। एक और अनसुलझा मुद्दा एआई-जनित आउटपुट की कॉपीराइट-योग्यता और लेखक का अधिकार है।
कई देशों में सरकारें और अदालतें इस नए चलन -एआई मॉडल का डेटा प्रशिक्षण- से निपटने के लिए जूझ रही हैं। भारत सहित दुनियाभर की प्रौद्योगिकी कंपनियों की दलील है कि एआई मॉडल कॉपीराइट कानूनों का उल्लंघन नहीं करते क्योंकि वे कॉपीराइटेड किताबों, तस्वीरों आदि की नकल या साहित्यिक चोरी नहीं कर रहे हैं, बल्कि केवल अलग डेटासेट के रूप में एल्गोरिद्म को प्रशिक्षित करने के लिए पैटर्न, शैलियों, संरचनाओं का उपयोग करके सांख्यिकीय संबंध के संदर्भ में उन्हें नई सामग्री उत्पन्न करने में सक्षम बनाने को कर रहे हैं। उनका दावा है कि यह रचनात्मक कार्यों का ‘उचित उपयोग’ वाले सर्वमान्य सिद्धांत के अनुरूप है।
यह तर्क देना कि एआई मॉडल मूल कामों की ‘नकल’ नहीं कर रहे, बल्कि उनसे सिर्फ़ ‘सीख’ रहे हैं, सही नहीं। क्योंकि एक एआई सिस्टम को प्रशिक्षित करने की प्रक्रिया में कई चरण होते हैं, जिसमें डेटा (मूल सामग्री) की कॉपी करना और स्टोर करना शामिल है, जो वस्तुतः कॉपीराइट का उल्लंघन है। जबकि एआई उद्योग का कहना है कि इसे ‘तकनीकी उल्लंघन’ माना जा सकता है, कानूनी नहीं।
यह धारणा खारिज करते हुए कि किसी कॉपीराइट लाइसेंसिंग की ज़रूरत नहीं, दुनिया के दूसरे हिस्सों में इस पर चल रही चर्चा या लागू किए जा चुके अलग-अलग मॉडलों का अध्ययन करने के बाद, विशेषज्ञ समिति ने भारत के लिए हाइब्रिड फ्रेमवर्क की सिफारिश की है। इसने एआई डेवलपर्स को एआई सिस्टम को प्रशिक्षित करने में कानूनन एक्सेस किए गए कॉपीराइट-सुरक्षित कामों के इस्तेमाल के लिए एक ब्लैंकेट लाइसेंस दिए जाने का सुझाव दिया है, बशर्ते कॉपीराइट धारकों को रॉयल्टी का भुगतान किया जाए। लेकिन अधिकार धारकों के पास एआई सिस्टम को प्रशिक्षित करने में अपने कामों का इस्तेमाल करने से रोकने का विकल्प नहीं होगा।
अधिकार धारक संगठनों की उपस्थिति और सरकार द्वारा नामित एक केंद्रित नॉन-प्रॉफिट संस्था एआई डेवलपर्स से पेमेंट उगाहने के लिए ज़िम्मेदार होगी। इस संस्था में कॉपीराइट सोसायटी और उद्योग संगठन इसके सदस्य होंगे, और निजी रचनाकारों तक रॉयल्टी पहुंचाने के काम के लिए इस प्रकार के सदस्य-संगठन ज़िम्मेदार होंगे। कॉपीराइट सामग्री से प्रशिक्षित कर बने एआई सिस्टम से कमाई का एक निश्चित प्रतिशत बतौर रॉयल्टी देय होगा और दरें एक सरकारी समिति तय करेगी।
तकनीक विकसित करने वाली कंपनियों का तर्क है कि रचनात्मक कामों के उपयोग को नियंत्रित करना व लाइसेंसिंग को अनिवार्य बनाने के लिए नए कॉपीराइट कानून लागू करना तकनीकी नवाचार में बाधा डालेगा। वे एआई मॉडल को प्रशिक्षण मुमकिन बनाने को कॉपीराइट कानूनों में टेक्स्ट और डेटा माइनिंग (टीडीएम) को छूट देने की मांग करते हैं। उद्योग संस्थानों के प्रतिनिधि, नैसकॉम, ने विशेषज्ञ कमेटी में इसकी सिफारिशों से असहमति जताई। एआई मॉडल से कमाई पर आधारित कॉपीराइट सिस्टम के बजाय वह कॉपीराइटेड कंटेंट का इस्तेमाल करने को एक लेयर्ड सिस्टम चाहता है।
नैसकॉम ने सुझाव दिया कि टीडीएम के लिए सार्वजनिक उपलब्ध अपने काम का इस्तेमाल रोकने की जिम्मेवारी राइट्स होल्डर्स की थी, और इसके लिए, उन्हें अपने काम की उपलब्धता के समय ‘ऑप्ट आउट’ का विकल्प दिया जाए। जो कंटेंट सार्वजनिक उपलब्ध नहीं, उसके लिए राइट्स होल्डर्स कॉन्ट्रैक्ट या लाइसेंस शर्तों के ज़रिए अपने हकों की रक्षा कर सकते हैं। ये सब अधिकारधारकों पर अपने काम की रक्षा का जिम्मा डालता है, जो मौजूदा हालात में होना बेहद मुश्किल है क्योंकि कॉपीराइट का खुलेआम उल्लंघन जारी है व संरक्षित सामग्री अवैध रूप से ऑनलाइन उपलब्ध है। तकनीक निर्माण कंपनियों ने ऑनलाइन उपलब्ध लाखों किताबों से डेटा पहले ही कॉपी कर लिया। इस परिदृश्य में ‘ऑप्ट आउट’ ऑप्शन भी अव्यावहारिक लगता है।
दोनों सूरतों में, जो लोग नूतन काम उत्पन्न करते हैं (राइट्स होल्डर्स) नुकसान उन्हें ही होगा। विशेषज्ञ पैनल एआई सिस्टम के प्रशिक्षण हेतु कॉपीराइट-संरक्षित कामों की स्वचालित उपलब्धता चाहता है और यह एआई इंडस्ट्री की मदद के लिए इसे कानूनी निश्चिंतता देगा, जबकि कॉपीराइट धारकों के पास टीडीएम सिस्टम से ऑप्ट आउट करने का अधिकार नहीं होगा। दूसरी ओर, एआई उद्योग सरकार द्वारा प्रस्तावित रॉयल्टी-आधारित सिस्टम स्वीकार करने को तैयार नहीं, बल्कि कॉपीराइट धारकों को ‘ऑप्ट आउट’ या निजी कॉन्ट्रैक्ट जैसे तरीकों से अपने कामों की रक्षा खुद करने के लिए ज़िम्मेदार बनाना चाहता है। दोनों प्रकार के तरीके मूल सामग्री के सृजनकारों के लिए अनुचित हैं। किसी भी सूरत में, रचयिता को उन प्लेटफॉर्मों (और अन्य बिचौलियों) की नीतियों व मनमर्ज़ी पर निर्भर होना होगा जहां उनका कंटेंट पेश किया जाएगा।
एआई कंपनियों ने अरबों डॉलर के बिजनेस बनाने शुरू कर दिए और इसका आकार बढ़ने के अनुमान हैं। हां, एलएलएम और अन्य मॉडल तकनीकी नवोन्मेष का नतीजा हैं, लेकिन यह दुनियाभर में दशकों से लाखों रचनाकारों द्वारा निर्मित काम की डिजिटल चोरी पर टिका है। जो कॉपीराइट फ्रेमवर्क भारत प्रस्तावित कर रहा है, उसे उद्योग के हितों से पहले रचनाकारों के हितों को प्राथमिकता देनी चाहिए।
लेखक विज्ञान संबंधी मामलों के विशेषज्ञ हैं।

