Amazon-এর অভ্যন্তরীণ AI মেট্রিক ভুল আচরণ তৈরি করেছিল

প্রতিবেদন অনুযায়ী, Amazon একটি অভ্যন্তরীণ AI র‍্যাঙ্কিং সিস্টেম সরিয়ে নিয়েছে, কারণ কর্মীরা বুঝে গিয়েছিলেন যে তারা অর্থহীন কাজে AI টুল ব্যবহার করে লিডারবোর্ডে উঠতে পারেন। বড় কোম্পানিতে দ্রুত চালু করা AI গ্রহণ-সংক্রান্ত মেট্রিক কীভাবে প্রণোদনাকে বিকৃত করতে পারে, এই ঘটনাটি তার একটি কার্যকর উদাহরণ।

দেওয়া উৎস পাঠ অনুযায়ী, কোম্পানিটি “Kirorank” নামে একটি ড্যাশবোর্ড ব্যবহার করত, যা Amazon-এর Kiro ডেভেলপার প্ল্যাটফর্মে কর্মীদের কার্যকলাপের ভিত্তিতে স্কোর দিত। এই মেট্রিকের উদ্দেশ্য ছিল ব্যবহার বাড়ানো, কিন্তু কিছু কর্মী অর্থপূর্ণ আউটপুটের বদলে স্কোরের জন্যই AI ব্যবহার শুরু করেন। ফল ছিল বেশি কার্যকলাপের সংখ্যা, অতিরিক্ত ক্লাউড খরচ, এবং সমতুল্য মূল্যের খুব কম প্রমাণ।

যখন ব্যবহারই লক্ষ্য হয়ে যায়

মূল ব্যর্থতাটি সাংগঠনিক নকশায় পরিচিত: একবার কোনো মেট্রিক লক্ষ্য হয়ে গেলে, মানুষ প্রকৃত লক্ষ্যের বদলে সেই মেট্রিকটিকেই অপ্টিমাইজ করে। এই ক্ষেত্রে, স্পষ্ট লক্ষ্য ছিল ডেভেলপারদের দ্বারা কার্যকর AI গ্রহণ। নির্বাচিত প্রোক্সি ছিল একটি অভ্যন্তরীণ প্ল্যাটফর্মে কার্যকলাপ।

এই পার্থক্যটি ব্যয়বহুল প্রমাণিত হয়েছে। কর্মীরা যদি শুধু বেশি AI-চালিত কাজ চালিয়ে তাদের অবস্থান উন্নত করতে পারেন, তবে কোডের গুণমান, শিপিং গতি বা গ্রাহক প্রভাব না বাড়লেও টোকেন খরচ এবং প্ল্যাটফর্ম ট্রাফিক বেড়ে যেতে পারে। উৎস পাঠে বলা হয়েছে, কিছু কর্মী র‍্যাঙ্কিংয়ে উঠতে AI এজেন্টদের অর্থহীন কাজে লাগিয়েছিলেন।

সিনিয়র ভাইস প্রেসিডেন্ট Dave Treadwell reportedly কর্মীদের বলেছেন, “Please don’t use AI just for the sake of using AI.” এই বক্তব্যটি সমস্যার মূলকে যথাযথভাবে ধরে। নেতৃত্বকে যখন এমন কথা স্পষ্ট করে বলতে হয়, তখন বোঝা যায় যে পরিমাপের কাঠামো ইতিমধ্যেই সেই ব্যবসায়িক ফলাফল থেকে সরে গেছে, যেটিকে এটি সমর্থন করার কথা ছিল।

ড্যাশবোর্ডের পেছনের চাপ

সময়ও গুরুত্বপূর্ণ। উৎস পাঠ অনুযায়ী, Amazon তার 80%-এর বেশি ডেভেলপারকে সাপ্তাহিক ভিত্তিতে AI ব্যবহার করানোর লক্ষ্য স্থির করেছে। 2026 সালে প্রায় $200 billion খরচ করার পরিকল্পনাও রয়েছে, যার বেশিরভাগই AI অবকাঠামোতে যাবে। এই সংখ্যাগুলো বোঝায় কেন অভ্যন্তরীণ গ্রহণ-সংক্রান্ত মেট্রিক এত মনোযোগ পেয়েছিল।

এত আক্রমণাত্মকভাবে AI-তে বিনিয়োগ করা বড় কোম্পানিগুলো দেখতে চায় যে টুলগুলো ব্যবহার হচ্ছে, এবং তারা সেটি দ্রুত দেখতে চায়। ড্যাশবোর্ড একটি স্বাভাবিক ব্যবস্থাপনা প্রতিক্রিয়া, কারণ এটি একটি বিস্তৃত রূপান্তর এজেন্ডাকে একটি দৃশ্যমান সংখ্যায় পরিণত করে। কিন্তু দৃশ্যমানতা মানেই উপযোগিতা নয়। বিশেষ করে সফটওয়্যার সংস্থায়, প্রকৃত গ্রহণকে কাঁচা ব্যবহারের পরিসংখ্যান দিয়ে ধরা কঠিন।

উৎস পাঠে বলা হয়েছে, Meta-তেও অনুরূপ একটি ধারা দেখা গেছে, যেখানে কর্মীরা AI ব্যবহারের স্কোরের পেছনে ছুটেছেন। এটি ইঙ্গিত করে যে সমস্যাটি শুধু Amazon-এর নয়। প্রকৃত লাভ পরিমাপের পরিপক্ব উপায় আসার আগেই AI গ্রহণ ত্বরান্বিত করতে চাওয়া কোম্পানিগুলোর মধ্যে এটি কাঠামোগত হতে পারে।

টোকেন গণনা থেকে কার্যকর ডিপ্লয়মেন্টে

Amazon-এর বিকল্প মেট্রিকটি ইঙ্গিতবহ। কাঁচা টোকেন খরচ ট্র্যাক করার বদলে, কোম্পানি এখন reportedly “normalized deployments” মাপে, অর্থাৎ এমন AI-উৎপাদিত কোড যা সত্যিই কার্যকর প্রমাণিত হয়েছে। এই পরিবর্তনটি ইনপুট মেট্রিক থেকে আউটপুট মেট্রিকের দিকে সরে যাওয়ার ইঙ্গিত দেয়।

এই পরিবর্তন যুক্তিসংগত, তবে সহজ নয়। AI-উৎপাদিত কোড সত্যিই কার্যকর কি না তা মাপতে, শুধু একটি মডেল চালানো হয়েছে তা রেকর্ড করার চেয়ে শক্তিশালী সাফল্যের সংজ্ঞা দরকার। এটি উৎপাদন ফলাফলের সঙ্গে আরও ঘনিষ্ঠ সম্পর্ক, বাস্তব ওয়ার্কফ্লোতে একীকরণ, বা এমন কোনো যাচাইকে বোঝায় যে তৈরি কাজটি শব্দ নয়, বরং কোনো ডিপ্লয়মেন্টে অবদান রেখেছে।

তবু, যেকোনো বিকল্প মেট্রিকেরই সতর্ক নকশা দরকার। যদি কর্মীদের কেবল ডিপ্লয়মেন্ট সংখ্যার জন্য পুরস্কৃত করা হয়, তবে তারা ছোট বা কম-ঝুঁকির ডিপ্লয়মেন্টে অপ্টিমাইজ করতে পারেন। কোডের পরিমাণের জন্য পুরস্কৃত করা হলে, তারা যথাযথভাবে পর্যালোচনা না করেই আরও বেশি কোড তৈরি করতে পারেন। শিক্ষা হলো, মেট্রিক অসম্ভব নয়। শিক্ষা হলো, AI গ্রহণ-সংক্রান্ত মেট্রিককে অনেক প্রতিষ্ঠানের প্রাথমিক ধারণার চেয়েও আরও নিবিড়ভাবে প্রকৃত ইঞ্জিনিয়ারিং মূল্যের সঙ্গে সামঞ্জস্যপূর্ণ হতে হবে।

এন্টারপ্রাইজ AI-এর জন্য এটি কেন গুরুত্বপূর্ণ

Amazon-এর অভিজ্ঞতা দেখায় যে অভ্যন্তরীণ AI রোলআউট এখন আরও কঠিন পর্যায়ে প্রবেশ করছে। শুরুতে চ্যালেঞ্জ ছিল টুলগুলো কর্মীদের হাতে পৌঁছে দেওয়া। পরের চ্যালেঞ্জ হলো প্রমাণ করা যে সেগুলো কেবল এঙ্গেজমেন্ট চার্ট ফুলিয়ে তোলে না, বরং বাস্তব কাজকে উন্নত করে। AI খরচ বাড়ার সঙ্গে সঙ্গে, প্রতীকী গ্রহণের প্রতি নির্বাহী সহনশীলতা কমার সম্ভাবনা রয়েছে।

এটি বিশেষভাবে ডেভেলপমেন্ট পরিবেশে গুরুত্বপূর্ণ, যেখানে অপচয় হওয়া কম্পিউট সরাসরি খরচে পরিণত হয়, এবং কম-মানের জেনারেটেড আউটপুট পরে লুকানো রক্ষণাবেক্ষণ বোঝা তৈরি করতে পারে। একটি লিডারবোর্ড পরীক্ষামূলক ব্যবহারে উৎসাহ দিতে পারে, কিন্তু স্কোরিং সিস্টেম যদি খাপছাড়া হয়, তবে তা প্রদর্শনমূলক আচরণও উস্কে দিতে পারে।

বড় শিক্ষা সোজা: প্রতিষ্ঠানগুলো AI ব্যবহারকেই শেষ লক্ষ্য হিসেবে ধরতে পারে না। তাদের কার্যকলাপ এবং কার্যকারিতার মধ্যে পার্থক্য করতে হবে। Amazon লিডারবোর্ড সরিয়ে দেওয়ার সিদ্ধান্ত থেকে বোঝা যায়, কোম্পানিটি এই শিক্ষা ব্যয়বহুলভাবে পেয়েছে। অন্য প্রতিষ্ঠানগুলো যদি কর্মীদের AI টুলের দিকে ঠেলে দেয়, তবে স্কেল বাড়ানোর আগে আরও ভালো প্রণোদনা দরকার, নইলে ভুল আচরণই বাড়বে।

এই নিবন্ধটি The Decoder-এর প্রতিবেদনের উপর ভিত্তি করে। মূল নিবন্ধটি পড়ুন.

Originally published on the-decoder.com