संदर्भ संस्थाएं वापसी करती हैं
एनसाइक्लोपिडिया ब्रिटानिका और मेरियम-वेबस्टर, अंग्रेजी भाषी दुनिया के दो सबसे सम्मानित संदर्भ प्रकाशक, ओपनएआई के खिलाफ मुकदमा दायर किया है, यह दावा करते हुए कि कंपनी ने बिना अनुमति के उनकी कॉपीराइट सामग्री पर ChatGPT मॉडल को प्रशिक्षित किया है। मुकदमे में तर्क दिया गया है कि ओपनएआई ने प्रभावी रूप से संपादकों, शब्दकोश विशेषज्ञों और विषय विशेषज्ञों की पीढ़ियों के बौद्धिक कार्य को एक वाणिज्यिक AI प्रणाली के प्रशिक्षण डेटा में बदल दिया है — और अब परिणामी क्षमताओं का उपयोग करके मूल प्रकाशकों के साथ वेब ट्रैफिक और विज्ञापन राजस्व के लिए सीधे प्रतिस्पर्धा कर रहा है।
मूल दावा AI कॉपीराइट मुकदमों के बढ़ते शरीर से परिचित है: कि बड़े भाषा मॉडल को कॉपीराइट पाठ पर प्रशिक्षित करना कॉपीराइट उल्लंघन है, चाहे मॉडल विशिष्ट मार्ग को याद रखे या केवल प्रशिक्षण कार्पस से पैटर्न और ज्ञान को शामिल करे। इस मुकदमे को अलग करने वाली बात प्रतिस्पर्धात्मक नुकसान के तर्क की सरलता है — ये ऐसे संगठन हैं जिनके व्यावसायिक मॉडल उपयोगकर्ताओं के अपनी वेबसाइटों पर आने पर निर्भर करते हैं, ऐसे उपयोगकर्ता जो अब ChatGPT से अपने प्रश्नों के उत्तर प्राप्त कर रहे हैं।
ट्रैफिक नाश की समस्या
वादीदावेदार दावा करते हैं कि ChatGPT उनके ट्रैफिक को नष्ट कर रहा है — कई क्षेत्रों में सूचना अर्थशास्त्र को पुनर्निर्माण करने वाली घटना के लिए एक स्पष्ट शब्द। जब कोई उपयोगकर्ता ChatGPT से किसी ऐतिहासिक घटना की व्याख्या करने, किसी शब्द को परिभाषित करने या किसी विषय को सारांश देने के लिए कहता है, और एक प्रवाह सारांश उत्तर प्राप्त करता है, तो उस उपयोगकर्ता को ब्रिटानिका या मेरियम-वेबस्टर पर जाने का कोई कारण नहीं है। संदर्भ लुकअप जो एक पृष्ठ दृश्य और विज्ञापन राजस्व उत्पन्न कर सकता है अब पूरी तरह से ChatGPT इंटरफेस के भीतर होता है।
यह गतिविधि समाचार संगठनों या रचनात्मक सामग्री निर्माताओं की तुलना में संदर्भ प्रकाशकों के लिए अस्तित्वगत है। ब्रिटानिका का व्यावसायिक मॉडल — जो इंटरनेट के उदय के बाद प्रिंट एनसाइक्लोपीडिया बिक्री से डिजिटल सदस्यता में बदल गया — उपयोगकर्ताओं के विशेष रूप से ब्रिटानिका पर आने के कारण पर निर्भर करता है। यदि AI सहायक विश्वकोश-स्तरीय प्रश्नों का विश्वसनीय ढंग से उत्तर दे सकते हैं, तो ब्रिटानिका सदस्यता के ट्रैफिक कारण पूरी तरह से कम हो सकते हैं।
मेरियम-वेबस्टर को एक समान समस्या का सामना करना पड़ता है। शब्दकोश लुकअप प्रारंभिक इंटरनेट युग से वेब ट्रैफिक का एक प्रमुख स्रोत रहे हैं, विज्ञापन-समर्थित शब्दकोश साइटों को बनाए रखते हैं। AI मॉडल जो शब्दों को परिभाषित कर सकते हैं, व्युत्पत्ति की व्याख्या कर सकते हैं, उपयोग के उदाहरण प्रदान कर सकते हैं और अर्थ के सूक्ष्मताओं को स्पष्ट कर सकते हैं — प्रशिक्षण डेटा से निकाले गए जो लगभग निश्चित रूप से मेरियम-वेबस्टर की शब्दकोश सामग्री को शामिल करते हैं — मेरियम-वेबस्टर बेचता है उस उत्पाद के लिए एक सीधा विकल्प हैं।
कानूनी सिद्धांत और इसके पूर्वज
न्यूयॉर्क टाइम्स ने 2023 के अंत में ओपनएआई और माइक्रोसॉफ्ट के खिलाफ अपना ऐतिहासिक मुकदमा दायर करने के बाद से AI प्रशिक्षण मामलों में कॉपीराइट उल्लंघन के सिद्धांत को कई मोर्चों पर विरोधी किया गया है। ओपनएआई की प्राथमिक बचाव — कि सार्वजनिक रूप से उपलब्ध सामग्री पर प्रशिक्षण न्यायसंगत उपयोग है — अभी तक पूरी तरह से निर्णय नहीं हुआ है, और अदालतों ने तर्क की शक्ति के बारे में मिश्रित संकेत जारी किए हैं।
न्यायसंगत उपयोग विश्लेषण चार कारकों को शामिल करता है: उपयोग का उद्देश्य और चरित्र, कॉपीराइट किए गए कार्य की प्रकृति, उपयोग की मात्रा, और मूल कार्य के बाजार पर प्रभाव। संदर्भ प्रकाशकों के लिए विशेष रूप से, चौथा कारक — बाजार प्रभाव — उनके मामले का सबसे सम्मोहक तत्व हो सकता है। यदि वे ओपनएआई की उनकी सामग्री पर प्रशिक्षण से कार्यकारी रूप से जुड़े ट्रैफिक और राजस्व में मापने योग्य गिरावट प्रदर्शित कर सकते हैं, तो उनके पास काल्पनिक नुकसान के अनुमान से परे साक्ष्य है।
एक ही समय में, ओपनएआई का न्यायसंगत उपयोग तर्क रचनात्मक कार्यों की तुलना में तथ्यात्मक संदर्भ सामग्री के लिए मजबूत है। कॉपीराइट अभिव्यक्ति की रक्षा करता है, तथ्यों को नहीं — एनसाइक्लोपीडिया ऐतिहासिक घटनाओं या वैज्ञानिक निष्कर्षों में कॉपीराइट दावा नहीं कर सकते, केवल उन्हें वर्णित करने के लिए उपयोग किए जाने वाले विशिष्ट भाषा में। यह ब्रिटानिका और मेरियम-वेबस्टर की स्कोप को सीमित कर सकता है, यहां तक कि अगर उनके उल्लंघन दावे सफल होते हैं, तो वे राहत प्राप्त कर सकते हैं।
यह लेख Gizmodo की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें।

