এলিয়াস থর্নের রহস্য
একটি চ্যাটবটকে গল্প লিখতে বললে, আপনি লাইটহাউস কিপার এলিয়াস থর্নকে নিয়ে একটি কাহিনি পেতে পারেন। এই বারবার ফিরে আসা চরিত্রটি ব্যবহারকারী এবং গবেষক উভয়ের কাছেই ধাঁধার মতো হয়ে উঠেছে। সফটওয়্যার ইঞ্জিনিয়ার ড্যানিয়েল মে প্রথম এই প্যাটার্নটি লক্ষ্য করেন, যা AI মডেল কেন এই নির্দিষ্ট বয়ানে ডিফল্ট হয়ে যায় তা নিয়ে গভীর অনুসন্ধানের সূচনা করে।
গবেষণায় মাত্রা উন্মোচিত
404 Media-র প্রতিবেদনে জানানো হয়েছে, কর্নেল ইউনিভার্সিটির একটি preprint পেপার OpenAI-এর GPT-5.4 Mini, Anthropic-এর Claude Haiku 4.5, এবং Google-এর Gemini 3.1 Flash-Lite-সহ মডেলগুলো দ্বারা তৈরি 20,000টি গল্প বিশ্লেষণ করে। ফলাফল ছিল চমকপ্রদ: Lighthouse, Keeper, Baker, Mayor, Clockmaker, Fisherman, Librarian, Conductor, Mara, Elias, এবং Elara - এই 11টি শব্দ সব গল্পের 88%-এ দেখা গেছে। সবচেয়ে সাধারণ সংমিশ্রণ ছিল 'Elias the lighthouse keeper', যা দুই-তৃতীয়াংশ গল্পে দেখা যায়।
কেন এমন হয়?
গবেষকরা শুরুতে pre-training ডেটার সন্দেহ করেছিলেন, কিন্তু তারা কোনো প্রমাণ পাননি যে 'Elias the lighthouse keeper' সাহিত্য বা training datasets-এ অস্বাভাবিকভাবে বেশি রয়েছে। বরং তারা এই ঘটনাকে alignment training-এর ফল বলে মনে করেন। AI ল্যাবগুলো নিরাপত্তার জন্য মডেল fine-tune করতে WildChat-এর মতো datasets ব্যবহার করে, যা GPT-3.5-চালিত একটি চ্যাটবটের সঙ্গে হওয়া লক্ষ লক্ষ কথোপকথনের সংগ্রহ। কপিরাইটযুক্ত চরিত্র এবং adult content এড়াতে মডেলগুলোকে 'নিরাপদ' বিকল্পের দিকে পরিচালিত করা হয়। ফলে অনিচ্ছাকৃতভাবে এলিয়াসের মতো চরিত্রগুলো গুরুত্ব পায় এবং গল্প তৈরির সময় সেগুলোই ডিফল্ট পছন্দ হয়ে ওঠে।
AI সৃজনশীলতার ওপর প্রভাব
এলিয়াস থর্নের ঘটনা একটি বড় সমস্যার ইঙ্গিত দেয়: AI মডেলের সত্যিকারের সৃজনশীলতা নেই। তাদের আউটপুট training data এবং safety guardrails দ্বারা ব্যাপকভাবে প্রভাবিত হয়, যার ফলে পুনরাবৃত্তিমূলক এবং অনুমেয় বয়ান তৈরি হয়। এতে AI-উৎপাদিত কনটেন্টের মৌলিকতা এবং বর্তমান alignment কৌশলের কার্যকারিতা নিয়ে প্রশ্ন ওঠে।
চরিত্রের বিস্তার
চ্যাটবটের বাইরে, এলিয়াস থর্ন নামটি ফ্যান্টাসি বইয়েও এবং Amazon-এর ambient music tracks-এ একজন শিল্পী হিসেবেও দেখা গেছে। মে 'Elias Thorne' নামে লেখা বইও খুঁজে পান, যার মধ্যে একটি handbook-ও ছিল। এটি ইঙ্গিত করে যে এই চরিত্রটি অন্য AI-উৎপাদিত কনটেন্টেও ছড়িয়ে পড়ছে, যা সৃজনশীল কাজকে সম্ভাব্যভাবে দূষিত করতে পারে।
ব্যবহারকারীদের জন্য এর অর্থ
বৈচিত্র্যময় ও সৃজনশীল গল্প খুঁজছেন এমন ব্যবহারকারীদের জন্য, চ্যাটবটগুলো অনেক সময় প্রত্যাশা পূরণ করতে পারে না। নিরাপদ, পুনরাবৃত্তিমূলক প্যাটার্নের ওপর নির্ভরতা নতুন কনটেন্ট তৈরি করার ক্ষমতা সীমিত করে। AI যত বেশি সৃজনশীল ক্ষেত্রে একীভূত হচ্ছে, এই পুনরাবৃত্তি মোকাবিলা করা ততই জরুরি হয়ে উঠছে। গবেষকরা আরও বৈচিত্র্যময় training datasets এবং সৃজনশীলতাকে দমিয়ে না রাখা উন্নত alignment পদ্ধতির আহ্বান জানাচ্ছেন।
উপসংহার
এলিয়াস থর্ন ঘটনাটি AI ভাষা মডেলের ভেতরের কাজকর্মের একটি জানালা। এটি দেখায় কীভাবে safety measures অনিচ্ছাকৃতভাবে আউটপুটকে অপ্রত্যাশিতভাবে রূপ দিতে পারে। AI যত এগোবে, এই অদ্ভুততাগুলো বোঝা আরও সৃজনশীল এবং নির্ভরযোগ্য সিস্টেম তৈরির জন্য গুরুত্বপূর্ণ হবে।
এই নিবন্ধটি Gizmodo-র প্রতিবেদনের ভিত্তিতে তৈরি। মূল নিবন্ধটি পড়ুন.
Originally published on gizmodo.com





