ইন্টারনেটে AI-এর ঢল এখন পরিমাপযোগ্য

বছরের পর বছর ধরে “AI slop” নিয়ে অভিযোগ সহজেই পাওয়া গেছে, কিন্তু তা পরিমাপ করা কঠিন ছিল। Imperial College London, Stanford University, এবং Internet Archive-এর গবেষকদের একটি নতুন preprint study এই পরিস্থিতি বদলায়। গবেষণায় বলা হয়েছে, প্রায় 35 শতাংশ নতুন ওয়েবসাইট AI-সৃষ্ট বা AI-সহায়তাযুক্ত; যা দেখায় যে machine-written content ইতিমধ্যে ওয়েবে কতটা গভীরে ঢুকে পড়েছে, তার এখন পর্যন্ত সবচেয়ে স্পষ্ট সংখ্যাগত চিত্রগুলোর একটি।

গবেষকরা Internet Archive-এর Wayback Machine ব্যবহার করে ওয়েব পেজের একটি প্রতিনিধিত্বমূলক নমুনা সংগ্রহ করেন এবং AI শনাক্তকরণের একাধিক পদ্ধতি পরীক্ষা করেন, তারপর Pangram Labs-এর টুল বেছে নেন, যেগুলো তারা তাদের মূল্যায়নে সবচেয়ে সামঞ্জস্যপূর্ণ বলে পান। study-টি এমন গবেষণার একটি কেন্দ্রীয় সীমাবদ্ধতাও খোলাখুলি স্বীকার করে: AI detection tools নিখুঁত নয়। এই সতর্কতা গুরুত্বপূর্ণ, কারণ machine-generated content-এর পরিমাণ সম্পর্কে কোনো দাবিই তা শনাক্ত করার পদ্ধতির মানের ওপর নির্ভরশীল।

এই সতর্কতার পরেও ফলাফলগুলো চমকে দেওয়ার মতো। গবেষকরা শুধু এটিই জানতে চাননি যে ওয়েবের কতটা অংশ AI systems দ্বারা গঠিত, বরং এই লেখার বৈশিষ্ট্য কি মানব-লিখিত কন্টেন্টের থেকে আলাদা কি না, তাও দেখেছেন। অন্তত দুটি বড় বিষয়ে তাদের উত্তর ছিল হ্যাঁ।

AI লেখা অনেক বেশি ইতিবাচক শোনায়

study-টির সবচেয়ে চোখে পড়া ফলগুলোর একটি হলো tone-সংক্রান্ত। sentiment analysis ব্যবহার করে গবেষকরা দেখেছেন, AI-সৃষ্ট বা AI-সহায়তাযুক্ত ওয়েবসাইটের average positive sentiment score, AI-নয় এমন ওয়েবসাইটের তুলনায় 107 শতাংশ বেশি। সহজ ভাষায়, AI-নির্ভর লেখা অনেক বেশি upbeat ছিল।

লেখকদের মতে, এই pattern বর্তমান বড় ভাষা মডেলের “sycophantic and overoptimistic nature”-এর লক্ষণ। যদি তা সত্যি হয়, তাহলে এর প্রভাব বিরক্তিকর marketing copy বা সূত্রবদ্ধ blog posts-এর মধ্যেই সীমিত নয়। এটি ইঙ্গিত করে যে AI systems জনজগতের অনলাইন ভাষার আবেগী স্বর বদলে দিচ্ছে, ভাষাকে আরও polished, আরও approving, এবং কম কঠোর, কম অনিশ্চিত, কম সন্দেহপ্রবণ করে তুলছে।

এ ধরনের tonal shift সূক্ষ্ম, কিন্তু গুরুত্বপূর্ণ। লেখা কেবল তথ্য বহন করে না। এটি গুরুত্ব, সন্দেহ, বিচার, রসবোধ, সংঘাত, এবং দৃষ্টিভঙ্গির সংকেতও দেয়। যদি AI-সহায়তাযুক্ত লেখা নিয়মিতভাবে সেই ধারগুলো মসৃণ করে দেয়, তাহলে ফলাফল কেবল আলাদা style নয়। এটি আলাদা atmosphere। study-টির ভাষায়, ইন্টারনেট “artificially cheerful” হয়ে যাচ্ছে।

এতে অবশ্য এমন নয় যে প্রতিটি ইতিবাচক ওয়েবসাইটই মেশিন-লিখিত, বা প্রতিটি AI system একই কণ্ঠস্বর তৈরি করে। তবে সমষ্টিগতভাবে ফলাফল দেখাচ্ছে, AI content যত বাড়ছে, ওয়েব ততই একটি সংকীর্ণ emotional register-এর দিকে ঠেলে যেতে পারে। এমন একটি medium-এ, যা আগে থেকেই optimization, branding, এবং algorithmic pressure-এ ভরা, এ ধরনের একরৈখিক positivity ডিজিটাল জায়গাগুলোকে আরও সমতল এবং কম বিশ্বাসযোগ্য করে তুলতে পারে।

ওয়েব ideologically-ও কম বৈচিত্র্যময় হয়ে উঠতে পারে

গবেষকরা আরেকটি pattern খুঁজে পেয়েছেন, যা সময়ের সঙ্গে আরও গুরুত্বপূর্ণ হয়ে উঠতে পারে। AI-সৃষ্ট বা AI-সহায়তাযুক্ত ওয়েবসাইটগুলো human-made ওয়েবসাইটের তুলনায় semantic similarity-এর মাপে প্রায় 33 শতাংশ বেশি স্কোর করেছে। তাদের সিদ্ধান্ত ছিল, AI ব্যবহার অনলাইনে উপস্থাপিত অনন্য ধারণা ও বৈচিত্র্যময় দৃষ্টিভঙ্গির পরিসর কমিয়ে দিচ্ছে বলে মনে হয়।

Semantic similarity মানে হুবহু নকল নয়, কিন্তু এটি convergence-এর দিকে ইঙ্গিত করে। যদি AI systems একে অপরের সঙ্গে ওভারল্যাপ করা corpora-তে প্রশিক্ষিত হয় এবং broadly acceptable answers-এর জন্য optimized হয়, তাহলে তাদের output একই রকম শোনাও, একই রকম ভাবাও অস্বাভাবিক নয়। ফলে এমন এক ওয়েব তৈরি হতে পারে যেখানে আরও বেশি পৃষ্ঠা সামান্য ভিন্ন ভাষায়, কিন্তু ধারণাগতভাবে একই রকম, একই বিষয়ই কভার করে।

এই ফলাফল generative AI-কে ঘিরে দীর্ঘদিনের উদ্বেগের কেন্দ্রবিন্দুতে আঘাত করে: কেবল ইন্টারনেটে কন্টেন্টের বন্যা নয়, বরং difference-কে সংকুচিত করে একই সঙ্গে তা ঘটানো। প্রথম দেখায় আলাদা মনে হলেও যেসব পৃষ্ঠা একই rhetorical patterns ও assumptions-এর চারপাশে গুচ্ছবদ্ধ, সেইসব পৃষ্ঠা দিয়ে ভরা ওয়েব একটি দরিদ্রতর বৌদ্ধিক পরিবেশ হবে, এমনকি প্রতিটি পৃষ্ঠা পড়তে সহজ এবং search-friendly হলেও।

AI কন্টেন্ট নিয়ে সব আশঙ্কা সত্যি হয়নি

study-টি শুধু কী পেয়েছে তাই নয়, কী পায়নি সেটির জন্যও উল্লেখযোগ্য। গবেষকরা AI-লিখিত ওয়েব কন্টেন্ট নিয়ে ছয়টি তত্ত্ব পরীক্ষা করেন, এবং চারটি নিশ্চিত হয়নি। বিশেষভাবে, তারা ভেবেছিলেন AI misinformation বাড়াতে পারে, কিন্তু তাদের বিশ্লেষণ সেই ধারণাকে সমর্থন করেনি।

এই নেতিবাচক ফলটি গুরুত্বপূর্ণ। AI slop নিয়ে জনপরিসরের আলোচনায় প্রায়ই ধরে নেওয়া হয়, machine-generated content মানেই আরও বেশি মিথ্যা। study-টি বিপরীতটি প্রমাণ করে না, কিন্তু এটি দেখায় যে ছবিটি আরও জটিল। AI ওয়েবকে পরিমাপযোগ্যভাবে বদলে দিতে পারে, অথচ গবেষকরা যে ধরনের misinformation শনাক্ত করতে চেয়েছিলেন, সেইভাবে তা অবশ্যই বাড়ায় না।

এই সূক্ষ্মতা কাজটিকে আরও কার্যকর করে। এটি online quality-র সব অবনতির জন্য AI-কে সর্বজনীন ব্যাখ্যা হিসেবে ধরে নেওয়ার প্রলোভনকে প্রতিরোধ করে। বরং এটি একটি নির্দিষ্ট diagnosis দেয়: এই study-তে সবচেয়ে শক্তিশালী প্রমাণ tone এবং sameness-এ, সহজভাবে শনাক্তযোগ্য misinformation-এর বিস্ফোরণে নয়।

পরিবর্তনশীল ইন্টারনেট এখন data-তে ধরা পড়ছে

এই study-র বড় মূল্য হলো AI slop বিতর্ককে anecdote-এর বাইরে নিয়ে যাওয়া। 2022 সালে ChatGPT চালুর পর থেকে অনেক internet user-ই অনুভব করেছেন, digital writing যেন আরও সাধারণ, আরও নিরন্তর upbeat, এবং আরও পুনরাবৃত্তিমূলক হয়ে গেছে। এই গবেষণা সেই ধারণাকে চূড়ান্ত করে না, কিন্তু বিশ্লেষণাত্মক কাঠামো দেয়।

যদি প্রায় 35 শতাংশ নতুন ওয়েবসাইট AI-generated বা AI-assisted content ব্যবহার করে, তাহলে generative systems আর অনলাইন publishing-এর পার্শ্বস্রোত নয়। তারা ওয়েব কীভাবে লেখা হচ্ছে, তাতে বড় শক্তি। আর যদি সেই systems content-কে cheerfulness এবং semantic sameness-এর দিকে ঠেলে দেয়, তাহলে পরিবর্তনটি শুধু পরিমাণগত নয়। এটি সাংস্কৃতিক।

সম্ভবত এটাই study-টির সবচেয়ে অস্বস্তিকর ইঙ্গিত। AI slop-এর বিপদ শুধু এই নয় যে এটি ওয়েবকে নিম্নমানের কন্টেন্টে ভরে দিচ্ছে। এটি ওয়েবের ভাষাকেই বদলে দিতে পারে, disagreement, unpredictability, এবং expressive range মসৃণ করে দিয়ে এমন লেখা বাড়িয়ে তুলতে পারে, যা আরও smooth, safe, এবং pleasing। fake-happy internet-ও বদলে যাওয়া internet-ই, আর সেই পরিবর্তন উপেক্ষা করা দিন দিন কঠিন হচ্ছে।

এই নিবন্ধটি Wired-এর প্রতিবেদন অবলম্বনে লেখা। মূল নিবন্ধটি পড়ুন.

Originally published on wired.com