গবেষণায় বলা হয়েছে AI-সৃষ্ট ওয়েবসাইট বেশি প্রফুল্ল ও কম বৈচিত্র্যময়

ইন্টারনেটে AI-এর ঢল এখন পরিমাপযোগ্য

বছরের পর বছর ধরে “AI slop” নিয়ে অভিযোগ সহজেই পাওয়া গেছে, কিন্তু তা পরিমাপ করা কঠিন ছিল। Imperial College London, Stanford University, এবং Internet Archive-এর গবেষকদের একটি নতুন preprint study এই পরিস্থিতি বদলায়। গবেষণায় বলা হয়েছে, প্রায় 35 শতাংশ নতুন ওয়েবসাইট AI-সৃষ্ট বা AI-সহায়তাযুক্ত; যা দেখায় যে machine-written content ইতিমধ্যে ওয়েবে কতটা গভীরে ঢুকে পড়েছে, তার এখন পর্যন্ত সবচেয়ে স্পষ্ট সংখ্যাগত চিত্রগুলোর একটি।

গবেষকরা Internet Archive-এর Wayback Machine ব্যবহার করে ওয়েব পেজের একটি প্রতিনিধিত্বমূলক নমুনা সংগ্রহ করেন এবং AI শনাক্তকরণের একাধিক পদ্ধতি পরীক্ষা করেন, তারপর Pangram Labs-এর টুল বেছে নেন, যেগুলো তারা তাদের মূল্যায়নে সবচেয়ে সামঞ্জস্যপূর্ণ বলে পান। study-টি এমন গবেষণার একটি কেন্দ্রীয় সীমাবদ্ধতাও খোলাখুলি স্বীকার করে: AI detection tools নিখুঁত নয়। এই সতর্কতা গুরুত্বপূর্ণ, কারণ machine-generated content-এর পরিমাণ সম্পর্কে কোনো দাবিই তা শনাক্ত করার পদ্ধতির মানের ওপর নির্ভরশীল।

এই সতর্কতার পরেও ফলাফলগুলো চমকে দেওয়ার মতো। গবেষকরা শুধু এটিই জানতে চাননি যে ওয়েবের কতটা অংশ AI systems দ্বারা গঠিত, বরং এই লেখার বৈশিষ্ট্য কি মানব-লিখিত কন্টেন্টের থেকে আলাদা কি না, তাও দেখেছেন। অন্তত দুটি বড় বিষয়ে তাদের উত্তর ছিল হ্যাঁ।

AI লেখা অনেক বেশি ইতিবাচক শোনায়

study-টির সবচেয়ে চোখে পড়া ফলগুলোর একটি হলো tone-সংক্রান্ত। sentiment analysis ব্যবহার করে গবেষকরা দেখেছেন, AI-সৃষ্ট বা AI-সহায়তাযুক্ত ওয়েবসাইটের average positive sentiment score, AI-নয় এমন ওয়েবসাইটের তুলনায় 107 শতাংশ বেশি। সহজ ভাষায়, AI-নির্ভর লেখা অনেক বেশি upbeat ছিল।

লেখকদের মতে, এই pattern বর্তমান বড় ভাষা মডেলের “sycophantic and overoptimistic nature”-এর লক্ষণ। যদি তা সত্যি হয়, তাহলে এর প্রভাব বিরক্তিকর marketing copy বা সূত্রবদ্ধ blog posts-এর মধ্যেই সীমিত নয়। এটি ইঙ্গিত করে যে AI systems জনজগতের অনলাইন ভাষার আবেগী স্বর বদলে দিচ্ছে, ভাষাকে আরও polished, আরও approving, এবং কম কঠোর, কম অনিশ্চিত, কম সন্দেহপ্রবণ করে তুলছে।

এ ধরনের tonal shift সূক্ষ্ম, কিন্তু গুরুত্বপূর্ণ। লেখা কেবল তথ্য বহন করে না। এটি গুরুত্ব, সন্দেহ, বিচার, রসবোধ, সংঘাত, এবং দৃষ্টিভঙ্গির সংকেতও দেয়। যদি AI-সহায়তাযুক্ত লেখা নিয়মিতভাবে সেই ধারগুলো মসৃণ করে দেয়, তাহলে ফলাফল কেবল আলাদা style নয়। এটি আলাদা atmosphere। study-টির ভাষায়, ইন্টারনেট “artificially cheerful” হয়ে যাচ্ছে।

এতে অবশ্য এমন নয় যে প্রতিটি ইতিবাচক ওয়েবসাইটই মেশিন-লিখিত, বা প্রতিটি AI system একই কণ্ঠস্বর তৈরি করে। তবে সমষ্টিগতভাবে ফলাফল দেখাচ্ছে, AI content যত বাড়ছে, ওয়েব ততই একটি সংকীর্ণ emotional register-এর দিকে ঠেলে যেতে পারে। এমন একটি medium-এ, যা আগে থেকেই optimization, branding, এবং algorithmic pressure-এ ভরা, এ ধরনের একরৈখিক positivity ডিজিটাল জায়গাগুলোকে আরও সমতল এবং কম বিশ্বাসযোগ্য করে তুলতে পারে।

Musk’s xAI fired engineer for raising concerns about Grok chatbot, lawsuit claims

Grok-এর নিরাপত্তা নিয়ে উদ্বেগ তোলার পর xAI প্রকৌশলীকে বরখাস্ত করা হয়েছে বলে মামলা

Grok-এর জন্য আরও শক্তিশালী সুরক্ষা ব্যবস্থা চালুর জন্য চাপ দেওয়ার পর একজন প্রাক্তন xAI প্রকৌশলী দাবি করেছেন যে তাকে বেআইনিভাবে বরখাস্ত করা হয়েছে, যা AI গার্ডরেল এবং কর্পোরেট জবাবদিহি নিয়ে নতুন প্রশ্ন তুলেছে।

Read article

ওয়েব ideologically-ও কম বৈচিত্র্যময় হয়ে উঠতে পারে

গবেষকরা আরেকটি pattern খুঁজে পেয়েছেন, যা সময়ের সঙ্গে আরও গুরুত্বপূর্ণ হয়ে উঠতে পারে। AI-সৃষ্ট বা AI-সহায়তাযুক্ত ওয়েবসাইটগুলো human-made ওয়েবসাইটের তুলনায় semantic similarity-এর মাপে প্রায় 33 শতাংশ বেশি স্কোর করেছে। তাদের সিদ্ধান্ত ছিল, AI ব্যবহার অনলাইনে উপস্থাপিত অনন্য ধারণা ও বৈচিত্র্যময় দৃষ্টিভঙ্গির পরিসর কমিয়ে দিচ্ছে বলে মনে হয়।

Semantic similarity মানে হুবহু নকল নয়, কিন্তু এটি convergence-এর দিকে ইঙ্গিত করে। যদি AI systems একে অপরের সঙ্গে ওভারল্যাপ করা corpora-তে প্রশিক্ষিত হয় এবং broadly acceptable answers-এর জন্য optimized হয়, তাহলে তাদের output একই রকম শোনাও, একই রকম ভাবাও অস্বাভাবিক নয়। ফলে এমন এক ওয়েব তৈরি হতে পারে যেখানে আরও বেশি পৃষ্ঠা সামান্য ভিন্ন ভাষায়, কিন্তু ধারণাগতভাবে একই রকম, একই বিষয়ই কভার করে।

এই ফলাফল generative AI-কে ঘিরে দীর্ঘদিনের উদ্বেগের কেন্দ্রবিন্দুতে আঘাত করে: কেবল ইন্টারনেটে কন্টেন্টের বন্যা নয়, বরং difference-কে সংকুচিত করে একই সঙ্গে তা ঘটানো। প্রথম দেখায় আলাদা মনে হলেও যেসব পৃষ্ঠা একই rhetorical patterns ও assumptions-এর চারপাশে গুচ্ছবদ্ধ, সেইসব পৃষ্ঠা দিয়ে ভরা ওয়েব একটি দরিদ্রতর বৌদ্ধিক পরিবেশ হবে, এমনকি প্রতিটি পৃষ্ঠা পড়তে সহজ এবং search-friendly হলেও।

AI কন্টেন্ট নিয়ে সব আশঙ্কা সত্যি হয়নি

study-টি শুধু কী পেয়েছে তাই নয়, কী পায়নি সেটির জন্যও উল্লেখযোগ্য। গবেষকরা AI-লিখিত ওয়েব কন্টেন্ট নিয়ে ছয়টি তত্ত্ব পরীক্ষা করেন, এবং চারটি নিশ্চিত হয়নি। বিশেষভাবে, তারা ভেবেছিলেন AI misinformation বাড়াতে পারে, কিন্তু তাদের বিশ্লেষণ সেই ধারণাকে সমর্থন করেনি।

এই নেতিবাচক ফলটি গুরুত্বপূর্ণ। AI slop নিয়ে জনপরিসরের আলোচনায় প্রায়ই ধরে নেওয়া হয়, machine-generated content মানেই আরও বেশি মিথ্যা। study-টি বিপরীতটি প্রমাণ করে না, কিন্তু এটি দেখায় যে ছবিটি আরও জটিল। AI ওয়েবকে পরিমাপযোগ্যভাবে বদলে দিতে পারে, অথচ গবেষকরা যে ধরনের misinformation শনাক্ত করতে চেয়েছিলেন, সেইভাবে তা অবশ্যই বাড়ায় না।

এই সূক্ষ্মতা কাজটিকে আরও কার্যকর করে। এটি online quality-র সব অবনতির জন্য AI-কে সর্বজনীন ব্যাখ্যা হিসেবে ধরে নেওয়ার প্রলোভনকে প্রতিরোধ করে। বরং এটি একটি নির্দিষ্ট diagnosis দেয়: এই study-তে সবচেয়ে শক্তিশালী প্রমাণ tone এবং sameness-এ, সহজভাবে শনাক্তযোগ্য misinformation-এর বিস্ফোরণে নয়।

‘You Will Not Speak on Flock Tonight’: County Commissioner Refuses to Let Residents Opposing Flock Speak at Meeting

উত্তর ক্যারোলিনার বাসিন্দাদের Flock ক্যামেরার বিরুদ্ধে কথা বলতে বাধা দেওয়া হয়েছিল

উত্তর ক্যারোলিনার এক কাউন্টি কমিশনার Flock লাইসেন্স প্লেট রিডার নিয়ে জনমতকে একমাত্র একজন বক্তার মধ্যে সীমাবদ্ধ করে দেন, ফলে স্থানীয় নজরদারি বিতর্ক আরও বিস্তৃত হয়ে জনসভায় কারা কথা বলতে পারবেন সেই প্রশ্নে রূপ নেয়।

Read article

পরিবর্তনশীল ইন্টারনেট এখন data-তে ধরা পড়ছে

এই study-র বড় মূল্য হলো AI slop বিতর্ককে anecdote-এর বাইরে নিয়ে যাওয়া। 2022 সালে ChatGPT চালুর পর থেকে অনেক internet user-ই অনুভব করেছেন, digital writing যেন আরও সাধারণ, আরও নিরন্তর upbeat, এবং আরও পুনরাবৃত্তিমূলক হয়ে গেছে। এই গবেষণা সেই ধারণাকে চূড়ান্ত করে না, কিন্তু বিশ্লেষণাত্মক কাঠামো দেয়।

যদি প্রায় 35 শতাংশ নতুন ওয়েবসাইট AI-generated বা AI-assisted content ব্যবহার করে, তাহলে generative systems আর অনলাইন publishing-এর পার্শ্বস্রোত নয়। তারা ওয়েব কীভাবে লেখা হচ্ছে, তাতে বড় শক্তি। আর যদি সেই systems content-কে cheerfulness এবং semantic sameness-এর দিকে ঠেলে দেয়, তাহলে পরিবর্তনটি শুধু পরিমাণগত নয়। এটি সাংস্কৃতিক।

সম্ভবত এটাই study-টির সবচেয়ে অস্বস্তিকর ইঙ্গিত। AI slop-এর বিপদ শুধু এই নয় যে এটি ওয়েবকে নিম্নমানের কন্টেন্টে ভরে দিচ্ছে। এটি ওয়েবের ভাষাকেই বদলে দিতে পারে, disagreement, unpredictability, এবং expressive range মসৃণ করে দিয়ে এমন লেখা বাড়িয়ে তুলতে পারে, যা আরও smooth, safe, এবং pleasing। fake-happy internet-ও বদলে যাওয়া internet-ই, আর সেই পরিবর্তন উপেক্ষা করা দিন দিন কঠিন হচ্ছে।

এই নিবন্ধটি Wired-এর প্রতিবেদন অবলম্বনে লেখা। মূল নিবন্ধটি পড়ুন.

Originally published on wired.com

গবেষণায় দেখা গেছে AI-লেখা ওয়েবসাইটগুলো বেশি প্রফুল্ল এবং কম বৈচিত্র্যময়

ইন্টারনেটে AI-এর ঢল এখন পরিমাপযোগ্য

AI লেখা অনেক বেশি ইতিবাচক শোনায়

Grok-এর নিরাপত্তা নিয়ে উদ্বেগ তোলার পর xAI প্রকৌশলীকে বরখাস্ত করা হয়েছে বলে মামলা

ওয়েব ideologically-ও কম বৈচিত্র্যময় হয়ে উঠতে পারে

AI কন্টেন্ট নিয়ে সব আশঙ্কা সত্যি হয়নি

উত্তর ক্যারোলিনার বাসিন্দাদের Flock ক্যামেরার বিরুদ্ধে কথা বলতে বাধা দেওয়া হয়েছিল

পরিবর্তনশীল ইন্টারনেট এখন data-তে ধরা পড়ছে

Comments (0)

Related Articles

অ্যান্টার্কটিক আইসবার্গ নতুন সমুদ্রতল বাসস্থান তৈরি করছে

AI-ভিত্তিক মূল্য নির্ধারণ নিয়ে Washington Post-এর বিরুদ্ধে মামলা

Keep Reading