এনসাইক্লোপিডিয়া ব্রিটানিকা OpenAI কে প্রশিক্ষণ ডেটা ব্যবহার নিয়ে মামলা করছে

তথ্য প্রতিষ্ঠানগুলির বিপরীত আঘাত

এনসাইক্লোপিডিয়া ব্রিটানিকা এবং মেরিয়াম-ওয়েবস্টার, ইংরেজি-ভাষী বিশ্বের দুটি সবচেয়ে সম্মানিত তথ্য প্রকাশক, OpenAI এর বিরুদ্ধে মামলা দায়ের করেছেন, দাবি করে যে কোম্পানি তাদের অনুমতি ছাড়াই তাদের কপিরাইটযুক্ত সামগ্রীতে ChatGPT মডেলগুলি প্রশিক্ষিত করেছে। মামলায় যুক্তি দেওয়া হয় যে OpenAI কার্যকরভাবে প্রজন্মের পর প্রজন্ম ধরে সম্পাদক, লেক্সিকোগ্রাফার এবং বিষয় বিশেষজ্ঞদের বুদ্ধিবৃত্তিক কাজকে একটি বাণিজ্যিক AI সিস্টেমের প্রশিক্ষণ ডেটায় পরিণত করেছে — এবং এখন ফলস্বরূপ ক্ষমতাগুলি ব্যবহার করে মূল প্রকাশকদের সাথে ওয়েব ট্রাফিক এবং বিজ্ঞাপন রাজস্বের জন্য সরাসরি প্রতিযোগিতা করছে যা তাদের কার্যক্রম টিকিয়ে রাখে।

মূল দাবিটি ক্রমবর্ধমান AI কপিরাইট মামলার দেহ থেকে পরিচিত: যে একটি বড় ভাষা মডেলকে কপিরাইটযুক্ত পাঠে প্রশিক্ষিত করা কপিরাইট লঙ্ঘন গঠন করে, তা নির্বিশেষে মডেল নির্দিষ্ট অনুচ্ছেদগুলি স্মরণ করে বা কেবল প্রশিক্ষণ কর্পাস থেকে প্যাটার্ন এবং জ্ঞান অন্তর্ভুক্ত করে। এই মামলাকে আলাদা করে তোলে প্রতিযোগিতামূলক ক্ষতির যুক্তির সরাসরিতা — এগুলি এমন সংস্থা যাদের ব্যবসায়িক মডেল ব্যবহারকারীদের তাদের ওয়েবসাইটে আসার উপর নির্ভর করে তথ্য খুঁজতে, ব্যবহারকারী যারা এখন ChatGPT থেকে তাদের প্রশ্নের উত্তর পাচ্ছেন।

ট্রাফিক ক্যানিবালাইজেশন সমস্যা

বাদীরা অভিযোগ করেন যে ChatGPT তাদের ট্রাফিক ক্যানিবালাইজ করছে — অনেক সেক্টর জুড়ে তথ্য অর্থনীতি পুনর্নির্মাণ করা একটি প্রবণতার জন্য একটি স্পষ্ট শব্দ। যখন একজন ব্যবহারকারী ChatGPT কে একটি ঐতিহাসিক ঘটনা ব্যাখ্যা করতে, একটি শব্দ সংজ্ঞায়িত করতে বা একটি বিষয়ের সংক্ষিপ্ত বিবরণ প্রদান করতে বলেন এবং একটি প্রবাহী ব্যাপক উত্তর পান, সেই ব্যবহারকারীর ব্রিটানিকা বা মেরিয়াম-ওয়েবস্টার পরিদর্শন করার কোনো কারণ নেই। রেফারেন্স অনুসন্ধান যা একটি পৃষ্ঠা দৃশ্য এবং বিজ্ঞাপন রাজস্ব তৈরি করতে পারে এখন সম্পূর্ণভাবে ChatGPT ইন্টারফেসের মধ্যে ঘটে।

এই গতিশীলতা রেফারেন্স প্রকাশকদের জন্য অস্তিত্বগত যেভাবে এটি সংবাদ সংস্থা বা সৃজনশীল সামগ্রী নির্মাতাদের জন্য নাও হতে পারে। ব্রিটানিকার ব্যবসায়িক মডেল — যা ইন্টারনেট উদ্ভূত হওয়ার পর থেকে মুদ্রিত বিশ্বকোষ বিক্রয় থেকে ডিজিটাল সাবস্ক্রিপশনে পিভট করেছে — ব্যবহারকারীদের ব্রিটানিকায় বিশেষভাবে আসার একটি কারণ থাকার উপর নির্ভর করে। যদি AI সহায়করা নির্ভরযোগ্যভাবে এনসাইক্লোপিডিয়া স্তরের প্রশ্নের উত্তর দিতে পারে, তাহলে ব্রিটানিকা সাবস্ক্রিপশনের ট্রাফিক যুক্তি সম্পূর্ণভাবে ক্ষয় হতে পারে।

মেরিয়াম-ওয়েবস্টার একটি অনুরূপ সমস্যার মুখোমুখি। অনুমান বিরতি বছরের পর বছর ধরে ওয়েব ট্রাফিকের একটি প্রধান ছিল, বিজ্ঞাপন-সমর্থিত অনুমান সাইট বজায় রেখে। AI মডেল যা শব্দগুলি সংজ্ঞায়িত করতে পারে, ব্যুৎপত্তি ব্যাখ্যা করতে পারে, ব্যবহার উদাহরণ প্রদান করতে পারে এবং অর্থের সূক্ষ্মতা স্পষ্ট করতে পারে — প্রশিক্ষণ ডেটা থেকে আঁকার যা প্রায় নিশ্চিতভাবে মেরিয়াম-ওয়েবস্টার অনুমান সামগ্রী অন্তর্ভুক্ত করেছে — মেরিয়াম-ওয়েবস্টার বিক্রয় করে এমন পণ্যের জন্য একটি সরাসরি বিকল্প।

China Just Dropped Another Bomb on America's Frontier AI Companies

Moonshot-এর Kimi K3 বড় open model দিয়ে AI প্রতিযোগিতাকে আরও তীব্র করছে

Moonshot বলছে তার নতুন Kimi K3 model কয়েকটি কাজে শীর্ষ proprietary systems-এর কাছাকাছি পৌঁছায়, যা U.S.-China AI gap নিয়ে ধারণার ওপর চাপ বাড়াচ্ছে।

Read article

আইনি তত্ত্ব এবং এর পূর্বসূরী

AI প্রশিক্ষণ কেসে কপিরাইট লঙ্ঘন তত্ত্ব নিউ ইয়র্ক টাইমস 2023 এর শেষে OpenAI এবং মাইক্রোসফটের বিরুদ্ধে এর যুগান্তকারী মামলা দায়ের করার পর থেকে একাধিক সামনে প্রতিদ্বন্দ্বিত হয়েছে। OpenAI এর প্রাথমিক প্রতিরক্ষা — যে জনসাধারণের সামগ্রীতে প্রশিক্ষণ ন্যায্য ব্যবহার গঠন করে — এখনও সম্পূর্ণভাবে সমন্বিত হয়নি, এবং আদালত যুক্তির শক্তির বিষয়ে মিশ্র সংকেত জারি করেছে।

ন্যায্য ব্যবহার বিশ্লেষণে চারটি কারণ রয়েছে: ব্যবহারের উদ্দেশ্য এবং চরিত্র, কপিরাইটযুক্ত কাজের প্রকৃতি, ব্যবহৃত পরিমাণ এবং মূল কাজের বাজারে প্রভাব। রেফারেন্স প্রকাশকদের জন্য বিশেষত, চতুর্থ কারণ — বাজার প্রভাব — তাদের মামলার সবচেয়ে বাধ্যতামূলক উপাদান হতে পারে। যদি তারা OpenAI এর তাদের সামগ্রীতে প্রশিক্ষণের সাথে কার্যকরভাবে সংযুক্ত ট্রাফিক এবং রাজস্বে পরিমাপযোগ্য হ্রাস প্রদর্শন করতে পারে, তাদের কাছে এমন প্রমাণ রয়েছে যা অনুমানমূলক ক্ষতি সম্পর্কে অনুমান অতিক্রম করে।

একই সাথে, OpenAI এর ন্যায্য ব্যবহার যুক্তি সৃজনশীল কাজের জন্য বাস্তবসম্মত রেফারেন্স সামগ্রীর জন্য শক্তিশালী। কপিরাইট অভিব্যক্তি রক্ষা করে, তথ্য নয় — বিশ্বকোষগুলি ঐতিহাসিক ইভেন্ট বা বৈজ্ঞানিক অনুসন্ধানে নিজেদের কপিরাইট দাবি করতে পারে না, শুধুমাত্র তাদের বর্ণনা করতে ব্যবহৃত নির্দিষ্ট ভাষায়। এটি ব্রিটানিকা এবং মেরিয়াম-ওয়েবস্টার তাদের লঙ্ঘন দাবি সফল হলেও সর্বোচ্চ ত্রাণ পেতে পারে তার সুযোগ সীমাবদ্ধ করতে পারে।

প্রকাশক প্রতিরোধের একটি ব্যাপক প্যাটার্ন

মামলা AI কপিরাইট মোকদ্দমার যথেষ্ট দেহে যোগ দেয়। লেখক গিল্ড, বিভিন্ন সংবাদ সংস্থা, রেকর্ড লেবেল, ভিজ্যুয়াল শিল্পী এবং কোড প্ল্যাটফর্মগুলির সবাই মামলা দায়ের করেছে বা হুমকি দিয়েছে। OpenAI কিছু প্রকাশকদের সাথে নিষ্পত্তি করেছে, সবচেয়ে বিশেষত অ্যাসোসিয়েটেড প্রেস, এবং নিউজ কর্প এবং আটলান্টিক সহ অন্যান্যদের থেকে সামগ্রী লাইসেন্স করেছে।

প্যাটার্নটি পরামর্শ দেয় যে OpenAI নির্বাচনীভাবে সামগ্রী নির্মাতাদের সাথে নিষ্পত্তি করছে যাদের চলমান সহযোগিতার কৌশলগত মূল্য রয়েছে — সংবাদ সংস্থা যাদের সামগ্রী মডেলগুলিকে বর্তমান রাখতে পারে — যখন মামলা ঐতিহাসিক বরং চলমান প্রশিক্ষণ ডেটা ছাড়া পক্ষগুলির দাবি প্রতিদ্বন্দ্বিত করছে। ব্রিটানিকা এবং মেরিয়াম-ওয়েবস্টার একটি বিভাগে পড়ে কিনা যেখানে নিষ্পত্তি মোকদ্দমার চেয়ে বেশি মূল্যবান তা আলোচনা করার লিভার, মোকদ্দমা খরচ এবং OpenAI এর মূল্যায়নের উপর নির্ভর করবে আইনি ঝুঁকি মামলা তার বিস্তৃত ন্যায্য ব্যবহার যুক্তি ভঙ্গি করে।

এই নিবন্ধটি Gizmodo দ্বারা রিপোর্টিংয়ের উপর ভিত্তি করে। মূল নিবন্ধটি পড়ুন।

Japan vs. Ireland 2026 livestream: How to watch Nations Championship for free

আইটিভিএক্সে বিনামূল্যে দেখুন জাপান বনাম আয়ারল্যান্ডের ২০২৬ নেশনস চ্যাম্পিয়নশিপ ম্যাচ

আইটিভিএক্সে বিনামূল্যে লাইভ দেখুন জাপান বনাম আয়ারল্যান্ডের ২০২৬ নেশনস চ্যাম্পিয়নশিপ ম্যাচ। যেকোনো স্থান থেকে স্ট্রিম করতে VPN ব্যবহার করুন। ম্যাচটি শুরু হবে ১১ জুলাই, সকাল ১১:১০ টায় BST।

Read article

Originally published on gizmodo.com

এনসাইক্লোপিডিয়া ব্রিটানিকা OpenAI কে প্রশিক্ষণ ডেটা নিয়ে মামলা করছে