একটি অদ্ভুত নির্দেশ, যার মধ্যে আছে একটি গুরুতর বার্তা
এই সপ্তাহে OpenAI-এর coding tooling-এ সবচেয়ে বেশি আলোচিত লাইনগুলোর একটি software quality, security, বা latency নিয়ে ছিল না। ছিল goblins নিয়ে। Wired-এর প্রতিবেদনে বলা হয়েছে, Codex CLI-তে থাকা নির্দেশগুলো model-কে স্পষ্টভাবে বলে: goblins, gremlins, raccoons, trolls, ogres, pigeons, বা অন্য প্রাণীর কথা বলবে না, যদি না বিষয়টি ব্যবহারকারীর অনুরোধের সঙ্গে স্পষ্টভাবে সম্পর্কিত হয়।
প্রথম দর্শনে এটি production-এ ঢুকে পড়া একটি ভিতরের রসিকতার মতো শোনায়। কিন্তু বাস্তবে এটি আরও গুরুত্বপূর্ণ কিছু দেখায়: model behavior এখন শুধু training এবং architecture দ্বারা নয়, বরং খুব নির্দিষ্ট operational guardrails দ্বারা গঠিত হচ্ছে, যেগুলোর উদ্দেশ্য ব্যবহারকারীদের বারবার দেখা recurring patterns দমন করা।
এটি গুরুত্বপূর্ণ, কারণ AI assistants-এর অদ্ভুত edge cases এখন আর research demos-এ সীমাবদ্ধ নেই। Coding agents এখন গুরুতর productivity tools হিসেবে স্থাপন করা হচ্ছে। যখন vendor-রা এগুলোকে command-line environments, desktop automation flows, বা এমন agentic systems-এ নিয়ে যায় যেগুলো applications জুড়ে action নিতে পারে, তখন ছোট recurring quirks-ও product-level সমস্যা হয়ে উঠতে পারে।
Model-এর অদ্ভুততা থেকে product requirement
Wired-এর প্রতিবেদনে বলা হয়েছে, X-এ কিছু ব্যবহারকারী জানিয়েছেন যে OpenAI-এর models কখনও কখনও goblins এবং অনুরূপ প্রাণীর ওপর আটকে যেত, বিশেষ করে OpenClaw-এর সঙ্গে, একটি tool যা AI-কে computer এবং apps নিয়ন্ত্রণ করে task সম্পন্ন করতে দেয়। কিছু ব্যবহারকারী এ আচরণকে মজার বলে মনে করেছেন। অন্যরা এটিকে একটি চেনা failure mode হিসেবে দেখেছেন। যেভাবেই হোক, OpenAI-এর প্রতিক্রিয়া ছিল সোজাসাপটা: নিষেধাজ্ঞাটি সরাসরি নির্দেশনায় লিখে দেওয়া।
এর ফলাফল modern AI products কীভাবে বাস্তবে tune করা হচ্ছে তার একটি উপযোগী snapshot। model capability নিয়ে পরিষ্কার public narrative সাধারণত benchmarks, reasoning, এবং বাস্তব কাজের সাফল্যের ওপর জোর দেয়। তার নিচে আরেকটি স্তর আছে: এমন আচরণ ঠেকাতে instruction engineering, যা প্রযুক্তিগতভাবে ক্ষতিকর নয় কিন্তু ব্যবহারিকভাবে বিঘ্নকারী। যদি কোনো model code লিখতে গিয়ে বারবার অযাচিত metaphors বা whimsical language-এর দিকে ঝুঁকে পড়ে, তবে underlying technical output ঠিক থাকলেও তা trust কমাতে পারে, ব্যবহারকারীকে বিভ্রান্ত করতে পারে, এবং system-কে অস্থির বলে মনে করাতে পারে।
অন্য কথায়, “goblins-এর কথা বলবে না” আসলে goblins নিয়ে নয়। এটি reliability নিয়ে। ব্যবহারকারীরা চান এমন একটি coding assistant, যা task-এ স্থির থাকে, professional tone বজায় রাখে, এবং সময় বাঁচানোর জন্য তৈরি workflows-এ হঠাৎ thematic obsession ঢুকিয়ে দেয় না।


