তথ্য প্রতিষ্ঠানগুলির বিপরীত আঘাত
এনসাইক্লোপিডিয়া ব্রিটানিকা এবং মেরিয়াম-ওয়েবস্টার, ইংরেজি-ভাষী বিশ্বের দুটি সবচেয়ে সম্মানিত তথ্য প্রকাশক, OpenAI এর বিরুদ্ধে মামলা দায়ের করেছেন, দাবি করে যে কোম্পানি তাদের অনুমতি ছাড়াই তাদের কপিরাইটযুক্ত সামগ্রীতে ChatGPT মডেলগুলি প্রশিক্ষিত করেছে। মামলায় যুক্তি দেওয়া হয় যে OpenAI কার্যকরভাবে প্রজন্মের পর প্রজন্ম ধরে সম্পাদক, লেক্সিকোগ্রাফার এবং বিষয় বিশেষজ্ঞদের বুদ্ধিবৃত্তিক কাজকে একটি বাণিজ্যিক AI সিস্টেমের প্রশিক্ষণ ডেটায় পরিণত করেছে — এবং এখন ফলস্বরূপ ক্ষমতাগুলি ব্যবহার করে মূল প্রকাশকদের সাথে ওয়েব ট্রাফিক এবং বিজ্ঞাপন রাজস্বের জন্য সরাসরি প্রতিযোগিতা করছে যা তাদের কার্যক্রম টিকিয়ে রাখে।
মূল দাবিটি ক্রমবর্ধমান AI কপিরাইট মামলার দেহ থেকে পরিচিত: যে একটি বড় ভাষা মডেলকে কপিরাইটযুক্ত পাঠে প্রশিক্ষিত করা কপিরাইট লঙ্ঘন গঠন করে, তা নির্বিশেষে মডেল নির্দিষ্ট অনুচ্ছেদগুলি স্মরণ করে বা কেবল প্রশিক্ষণ কর্পাস থেকে প্যাটার্ন এবং জ্ঞান অন্তর্ভুক্ত করে। এই মামলাকে আলাদা করে তোলে প্রতিযোগিতামূলক ক্ষতির যুক্তির সরাসরিতা — এগুলি এমন সংস্থা যাদের ব্যবসায়িক মডেল ব্যবহারকারীদের তাদের ওয়েবসাইটে আসার উপর নির্ভর করে তথ্য খুঁজতে, ব্যবহারকারী যারা এখন ChatGPT থেকে তাদের প্রশ্নের উত্তর পাচ্ছেন।
ট্রাফিক ক্যানিবালাইজেশন সমস্যা
বাদীরা অভিযোগ করেন যে ChatGPT তাদের ট্রাফিক ক্যানিবালাইজ করছে — অনেক সেক্টর জুড়ে তথ্য অর্থনীতি পুনর্নির্মাণ করা একটি প্রবণতার জন্য একটি স্পষ্ট শব্দ। যখন একজন ব্যবহারকারী ChatGPT কে একটি ঐতিহাসিক ঘটনা ব্যাখ্যা করতে, একটি শব্দ সংজ্ঞায়িত করতে বা একটি বিষয়ের সংক্ষিপ্ত বিবরণ প্রদান করতে বলেন এবং একটি প্রবাহী ব্যাপক উত্তর পান, সেই ব্যবহারকারীর ব্রিটানিকা বা মেরিয়াম-ওয়েবস্টার পরিদর্শন করার কোনো কারণ নেই। রেফারেন্স অনুসন্ধান যা একটি পৃষ্ঠা দৃশ্য এবং বিজ্ঞাপন রাজস্ব তৈরি করতে পারে এখন সম্পূর্ণভাবে ChatGPT ইন্টারফেসের মধ্যে ঘটে।
এই গতিশীলতা রেফারেন্স প্রকাশকদের জন্য অস্তিত্বগত যেভাবে এটি সংবাদ সংস্থা বা সৃজনশীল সামগ্রী নির্মাতাদের জন্য নাও হতে পারে। ব্রিটানিকার ব্যবসায়িক মডেল — যা ইন্টারনেট উদ্ভূত হওয়ার পর থেকে মুদ্রিত বিশ্বকোষ বিক্রয় থেকে ডিজিটাল সাবস্ক্রিপশনে পিভট করেছে — ব্যবহারকারীদের ব্রিটানিকায় বিশেষভাবে আসার একটি কারণ থাকার উপর নির্ভর করে। যদি AI সহায়করা নির্ভরযোগ্যভাবে এনসাইক্লোপিডিয়া স্তরের প্রশ্নের উত্তর দিতে পারে, তাহলে ব্রিটানিকা সাবস্ক্রিপশনের ট্রাফিক যুক্তি সম্পূর্ণভাবে ক্ষয় হতে পারে।
মেরিয়াম-ওয়েবস্টার একটি অনুরূপ সমস্যার মুখোমুখি। অনুমান বিরতি বছরের পর বছর ধরে ওয়েব ট্রাফিকের একটি প্রধান ছিল, বিজ্ঞাপন-সমর্থিত অনুমান সাইট বজায় রেখে। AI মডেল যা শব্দগুলি সংজ্ঞায়িত করতে পারে, ব্যুৎপত্তি ব্যাখ্যা করতে পারে, ব্যবহার উদাহরণ প্রদান করতে পারে এবং অর্থের সূক্ষ্মতা স্পষ্ট করতে পারে — প্রশিক্ষণ ডেটা থেকে আঁকার যা প্রায় নিশ্চিতভাবে মেরিয়াম-ওয়েবস্টার অনুমান সামগ্রী অন্তর্ভুক্ত করেছে — মেরিয়াম-ওয়েবস্টার বিক্রয় করে এমন পণ্যের জন্য একটি সরাসরি বিকল্প।
আইনি তত্ত্ব এবং এর পূর্বসূরী
AI প্রশিক্ষণ কেসে কপিরাইট লঙ্ঘন তত্ত্ব নিউ ইয়র্ক টাইমস 2023 এর শেষে OpenAI এবং মাইক্রোসফটের বিরুদ্ধে এর যুগান্তকারী মামলা দায়ের করার পর থেকে একাধিক সামনে প্রতিদ্বন্দ্বিত হয়েছে। OpenAI এর প্রাথমিক প্রতিরক্ষা — যে জনসাধারণের সামগ্রীতে প্রশিক্ষণ ন্যায্য ব্যবহার গঠন করে — এখনও সম্পূর্ণভাবে সমন্বিত হয়নি, এবং আদালত যুক্তির শক্তির বিষয়ে মিশ্র সংকেত জারি করেছে।
ন্যায্য ব্যবহার বিশ্লেষণে চারটি কারণ রয়েছে: ব্যবহারের উদ্দেশ্য এবং চরিত্র, কপিরাইটযুক্ত কাজের প্রকৃতি, ব্যবহৃত পরিমাণ এবং মূল কাজের বাজারে প্রভাব। রেফারেন্স প্রকাশকদের জন্য বিশেষত, চতুর্থ কারণ — বাজার প্রভাব — তাদের মামলার সবচেয়ে বাধ্যতামূলক উপাদান হতে পারে। যদি তারা OpenAI এর তাদের সামগ্রীতে প্রশিক্ষণের সাথে কার্যকরভাবে সংযুক্ত ট্রাফিক এবং রাজস্বে পরিমাপযোগ্য হ্রাস প্রদর্শন করতে পারে, তাদের কাছে এমন প্রমাণ রয়েছে যা অনুমানমূলক ক্ষতি সম্পর্কে অনুমান অতিক্রম করে।
একই সাথে, OpenAI এর ন্যায্য ব্যবহার যুক্তি সৃজনশীল কাজের জন্য বাস্তবসম্মত রেফারেন্স সামগ্রীর জন্য শক্তিশালী। কপিরাইট অভিব্যক্তি রক্ষা করে, তথ্য নয় — বিশ্বকোষগুলি ঐতিহাসিক ইভেন্ট বা বৈজ্ঞানিক অনুসন্ধানে নিজেদের কপিরাইট দাবি করতে পারে না, শুধুমাত্র তাদের বর্ণনা করতে ব্যবহৃত নির্দিষ্ট ভাষায়। এটি ব্রিটানিকা এবং মেরিয়াম-ওয়েবস্টার তাদের লঙ্ঘন দাবি সফল হলেও সর্বোচ্চ ত্রাণ পেতে পারে তার সুযোগ সীমাবদ্ধ করতে পারে।
প্রকাশক প্রতিরোধের একটি ব্যাপক প্যাটার্ন
মামলা AI কপিরাইট মোকদ্দমার যথেষ্ট দেহে যোগ দেয়। লেখক গিল্ড, বিভিন্ন সংবাদ সংস্থা, রেকর্ড লেবেল, ভিজ্যুয়াল শিল্পী এবং কোড প্ল্যাটফর্মগুলির সবাই মামলা দায়ের করেছে বা হুমকি দিয়েছে। OpenAI কিছু প্রকাশকদের সাথে নিষ্পত্তি করেছে, সবচেয়ে বিশেষত অ্যাসোসিয়েটেড প্রেস, এবং নিউজ কর্প এবং আটলান্টিক সহ অন্যান্যদের থেকে সামগ্রী লাইসেন্স করেছে।
প্যাটার্নটি পরামর্শ দেয় যে OpenAI নির্বাচনীভাবে সামগ্রী নির্মাতাদের সাথে নিষ্পত্তি করছে যাদের চলমান সহযোগিতার কৌশলগত মূল্য রয়েছে — সংবাদ সংস্থা যাদের সামগ্রী মডেলগুলিকে বর্তমান রাখতে পারে — যখন মামলা ঐতিহাসিক বরং চলমান প্রশিক্ষণ ডেটা ছাড়া পক্ষগুলির দাবি প্রতিদ্বন্দ্বিত করছে। ব্রিটানিকা এবং মেরিয়াম-ওয়েবস্টার একটি বিভাগে পড়ে কিনা যেখানে নিষ্পত্তি মোকদ্দমার চেয়ে বেশি মূল্যবান তা আলোচনা করার লিভার, মোকদ্দমা খরচ এবং OpenAI এর মূল্যায়নের উপর নির্ভর করবে আইনি ঝুঁকি মামলা তার বিস্তৃত ন্যায্য ব্যবহার যুক্তি ভঙ্গি করে।
এই নিবন্ধটি Gizmodo দ্বারা রিপোর্টিংয়ের উপর ভিত্তি করে। মূল নিবন্ধটি পড়ুন।

