Tribune
PT
Subscribe To Print Edition About the Dainik Tribune Code Of Ethics Advertise with us Classifieds Download App
search-icon-img
Advertisement

एआई मॉडल और कॉपीराइट कंटेंट के दुरुपयोग का सवाल

एआई कंपनियां कॉपीराइट वाले कंटेंट के उपयोग से एलएलएम मॉडल प्रशिक्षित कर बिजनेस कर रही हैं जो सवालों के घेरे में है। बेशक एलएलएम व अन्य मॉडल तकनीकी नवोन्मेष का नतीजा है, लेकिन यह दशकों से लाखों रचनाकारों द्वारा निर्मित...

  • fb
  • twitter
  • whatsapp
  • whatsapp
Advertisement

एआई कंपनियां कॉपीराइट वाले कंटेंट के उपयोग से एलएलएम मॉडल प्रशिक्षित कर बिजनेस कर रही हैं जो सवालों के घेरे में है। बेशक एलएलएम व अन्य मॉडल तकनीकी नवोन्मेष का नतीजा है, लेकिन यह दशकों से लाखों रचनाकारों द्वारा निर्मित काम की डिजिटल चोरी पर टिका है। प्रस्तावित कॉपीराइट फ्रेमवर्क में रचनाकारों के हितों को प्राथमिकता देनी चाहिए।

जैसे ही साल खत्म हो रहा था, उद्योग और आंतरिक व्यापार संवर्धन विभाग ने ‘जेनरेटिव एआई एंड कॉपीराइट’ पर एक कार्यपत्र प्रकाशित किया। यह अप्रैल, 2025 में आर्टिफिशियल इंटेलिजेंस के युग में कॉपीराइट सुरक्षा के जटिल सवाल की जांच के लिए गठित की गई एक विशेषज्ञ समिति की रिपोर्ट है, और इसके निष्कर्षों से निकट भविष्य में कॉपीराइट और जेनरेटिव एआई के संबंध में भारत की आधिकारिक नीति का आधार बनने की सर्वाधिक संभावना है। जेनरेटिव एआई उत्पाद जैसे कि चैटजीपीटी, जेमिनी, परप्लेक्सिटी इत्यादि लार्ज लैंग्वेज मॉडल (एलएलएम) हैं, जो यूजर्स द्वारा दिए गए प्रॉम्पट्स (निर्देश) के आधार पर कंटेंट उत्पन्न करके देते हैं। मसलन, कोई व्यक्ति चैट जीपीटी को कहे कि आरके नारायण या मुंशी प्रेमचंद की शैली में एक लघु कहानी लिखकर दो, और वह उसे उत्पन्न कर दे। इसी तरह, डाल-ई, मिडजर्नी (और इस जैसे टेक्स्ट-टू-इमेज और टेक्स्ट-टू-वीडियो जेनरेशन मॉडल) दिए गए विषय पर पेंटिंग बनाकर पेश कर सकते हैं, जिसके लिए निर्देश दिए जाएं कि इनकी शैली जैमिनी रॉय या एमएफ हुसैन जैसी हो। या फिर सत्यजीत रे की शैली में एक लघु फिल्म क्लिप बनाने को कहा जाए। जेनरेटिव एआई मॉडल से उत्पन्न होने वाली सामग्री उनके प्रशिक्षण पर आधारित होती है, जिसमें विभिन्न प्रकार के स्रोत (जैसे नारायण के उपन्यास या हुसैन और अन्य की पेंटिंग) से प्राप्त डेटा का उपयोग किया जाता है।

एआई मॉडल को प्रशिक्षित करने के लिए उपयोग किया जाने वाला डेटा विभिन्न श्रेणियों वाला हो सकता है- कॉपीराइटेड, कॉपीराइट-समाप्त और सार्वजनिक डोमेन में ‘उचित उपयोग’ की अनुमति वाला उपलब्ध डेटा। जब से प्रौद्योगिकी फर्मों ने जेनरेटिव एआई उत्पादों के व्यावसायिक संस्करण लॉन्च किए हैं, किताबों, शोधपत्रों, तस्वीरों, फिल्मों और रचनात्मक अभिव्यक्तियों के विभिन्न रूपों जैसी कॉपीराइटेड सामग्री में उनके उपयोग का सवाल एआई बहस का केंद्र बन गया है। इसने जटिल कानूनी, नैतिक और औचित्य संबंधी प्रश्न खड़े कर दिए। एक और अनसुलझा मुद्दा एआई-जनित आउटपुट की कॉपीराइट-योग्यता और लेखक का अधिकार है।

Advertisement

कई देशों में सरकारें और अदालतें इस नए चलन -एआई मॉडल का डेटा प्रशिक्षण- से निपटने के लिए जूझ रही हैं। भारत सहित दुनियाभर की प्रौद्योगिकी कंपनियों की दलील है कि एआई मॉडल कॉपीराइट कानूनों का उल्लंघन नहीं करते क्योंकि वे कॉपीराइटेड किताबों, तस्वीरों आदि की नकल या साहित्यिक चोरी नहीं कर रहे हैं, बल्कि केवल अलग डेटासेट के रूप में एल्गोरिद्म को प्रशिक्षित करने के लिए पैटर्न, शैलियों, संरचनाओं का उपयोग करके सांख्यिकीय संबंध के संदर्भ में उन्हें नई सामग्री उत्पन्न करने में सक्षम बनाने को कर रहे हैं। उनका दावा है कि यह रचनात्मक कार्यों का ‘उचित उपयोग’ वाले सर्वमान्य सिद्धांत के अनुरूप है।

Advertisement

यह तर्क देना कि एआई मॉडल मूल कामों की ‘नकल’ नहीं कर रहे, बल्कि उनसे सिर्फ़ ‘सीख’ रहे हैं, सही नहीं। क्योंकि एक एआई सिस्टम को प्रशिक्षित करने की प्रक्रिया में कई चरण होते हैं, जिसमें डेटा (मूल सामग्री) की कॉपी करना और स्टोर करना शामिल है, जो वस्तुतः कॉपीराइट का उल्लंघन है। जबकि एआई उद्योग का कहना है कि इसे ‘तकनीकी उल्लंघन’ माना जा सकता है, कानूनी नहीं।

यह धारणा खारिज करते हुए कि किसी कॉपीराइट लाइसेंसिंग की ज़रूरत नहीं, दुनिया के दूसरे हिस्सों में इस पर चल रही चर्चा या लागू किए जा चुके अलग-अलग मॉडलों का अध्ययन करने के बाद, विशेषज्ञ समिति ने भारत के लिए हाइब्रिड फ्रेमवर्क की सिफारिश की है। इसने एआई डेवलपर्स को एआई सिस्टम को प्रशिक्षित करने में कानूनन एक्सेस किए गए कॉपीराइट-सुरक्षित कामों के इस्तेमाल के लिए एक ब्लैंकेट लाइसेंस दिए जाने का सुझाव दिया है, बशर्ते कॉपीराइट धारकों को रॉयल्टी का भुगतान किया जाए। लेकिन अधिकार धारकों के पास एआई सिस्टम को प्रशिक्षित करने में अपने कामों का इस्तेमाल करने से रोकने का विकल्प नहीं होगा।

अधिकार धारक संगठनों की उपस्थिति और सरकार द्वारा नामित एक केंद्रित नॉन-प्रॉफिट संस्था एआई डेवलपर्स से पेमेंट उगाहने के लिए ज़िम्मेदार होगी। इस संस्था में कॉपीराइट सोसायटी और उद्योग संगठन इसके सदस्य होंगे, और निजी रचनाकारों तक रॉयल्टी पहुंचाने के काम के लिए इस प्रकार के सदस्य-संगठन ज़िम्मेदार होंगे। कॉपीराइट सामग्री से प्रशिक्षित कर बने एआई सिस्टम से कमाई का एक निश्चित प्रतिशत बतौर रॉयल्टी देय होगा और दरें एक सरकारी समिति तय करेगी।

तकनीक विकसित करने वाली कंपनियों का तर्क है कि रचनात्मक कामों के उपयोग को नियंत्रित करना व लाइसेंसिंग को अनिवार्य बनाने के लिए नए कॉपीराइट कानून लागू करना तकनीकी नवाचार में बाधा डालेगा। वे एआई मॉडल को प्रशिक्षण मुमकिन बनाने को कॉपीराइट कानूनों में टेक्स्ट और डेटा माइनिंग (टीडीएम) को छूट देने की मांग करते हैं। उद्योग संस्थानों के प्रतिनिधि, नैसकॉम, ने विशेषज्ञ कमेटी में इसकी सिफारिशों से असहमति जताई। एआई मॉडल से कमाई पर आधारित कॉपीराइट सिस्टम के बजाय वह कॉपीराइटेड कंटेंट का इस्तेमाल करने को एक लेयर्ड सिस्टम चाहता है।

नैसकॉम ने सुझाव दिया कि टीडीएम के लिए सार्वजनिक उपलब्ध अपने काम का इस्तेमाल रोकने की जिम्मेवारी राइट्स होल्डर्स की थी, और इसके लिए, उन्हें अपने काम की उपलब्धता के समय ‘ऑप्ट आउट’ का विकल्प दिया जाए। जो कंटेंट सार्वजनिक उपलब्ध नहीं, उसके लिए राइट्स होल्डर्स कॉन्ट्रैक्ट या लाइसेंस शर्तों के ज़रिए अपने हकों की रक्षा कर सकते हैं। ये सब अधिकारधारकों पर अपने काम की रक्षा का जिम्मा डालता है, जो मौजूदा हालात में होना बेहद मुश्किल है क्योंकि कॉपीराइट का खुलेआम उल्लंघन जारी है व संरक्षित सामग्री अवैध रूप से ऑनलाइन उपलब्ध है। तकनीक निर्माण कंपनियों ने ऑनलाइन उपलब्ध लाखों किताबों से डेटा पहले ही कॉपी कर लिया। इस परिदृश्य में ‘ऑप्ट आउट’ ऑप्शन भी अव्यावहारिक लगता है।

दोनों सूरतों में, जो लोग नूतन काम उत्पन्न करते हैं (राइट्स होल्डर्स) नुकसान उन्हें ही होगा। विशेषज्ञ पैनल एआई सिस्टम के प्रशिक्षण हेतु कॉपीराइट-संरक्षित कामों की स्वचालित उपलब्धता चाहता है और यह एआई इंडस्ट्री की मदद के लिए इसे कानूनी निश्चिंतता देगा, जबकि कॉपीराइट धारकों के पास टीडीएम सिस्टम से ऑप्ट आउट करने का अधिकार नहीं होगा। दूसरी ओर, एआई उद्योग सरकार द्वारा प्रस्तावित रॉयल्टी-आधारित सिस्टम स्वीकार करने को तैयार नहीं, बल्कि कॉपीराइट धारकों को ‘ऑप्ट आउट’ या निजी कॉन्ट्रैक्ट जैसे तरीकों से अपने कामों की रक्षा खुद करने के लिए ज़िम्मेदार बनाना चाहता है। दोनों प्रकार के तरीके मूल सामग्री के सृजनकारों के लिए अनुचित हैं। किसी भी सूरत में, रचयिता को उन प्लेटफॉर्मों (और अन्य बिचौलियों) की नीतियों व मनमर्ज़ी पर निर्भर होना होगा जहां उनका कंटेंट पेश किया जाएगा।

एआई कंपनियों ने अरबों डॉलर के बिजनेस बनाने शुरू कर दिए और इसका आकार बढ़ने के अनुमान हैं। हां, एलएलएम और अन्य मॉडल तकनीकी नवोन्मेष का नतीजा हैं, लेकिन यह दुनियाभर में दशकों से लाखों रचनाकारों द्वारा निर्मित काम की डिजिटल चोरी पर टिका है। जो कॉपीराइट फ्रेमवर्क भारत प्रस्तावित कर रहा है, उसे उद्योग के हितों से पहले रचनाकारों के हितों को प्राथमिकता देनी चाहिए।

लेखक विज्ञान संबंधी मामलों के विशेषज्ञ हैं।

Advertisement
×