সরকারি চাপ এবং মডেল নিরাপত্তার সীমা

Fable 5 মডেল প্রকাশকে ঘিরে মার্কিন কর্মকর্তাদের ও Anthropic-এর মধ্যে বিরোধ frontier AI নীতিতে একটি মৌলিক টানাপড়েনকে সামনে আনছে: ব্যাপকভাবে প্রকাশের আগে সরকার অত্যন্ত সক্ষম সিস্টেমকে কার্যত unhackable দেখতে চাইতে পারে, কিন্তু প্রযুক্তি সেই মানদণ্ডকে সমর্থন করছে বলে মনে হয় না।

সূত্র অনুযায়ী, প্রশাসনিক কর্মকর্তারা Anthropic-এর বিরুদ্ধে সাম্প্রতিক Trump cyber executive order উপেক্ষা করার অভিযোগ তুলছেন, কারণ কোম্পানি সরকার-নির্ধারিত clearinghouse-এর পর্যালোচনার অপেক্ষা না করেই Fable 5 প্রকাশ করেছে। প্রতিবেদনে বলা হয়েছে, মডেলটি প্রকাশের সময় oversight framework এখনও পুরোপুরি গঠিত হয়নি।

সমালোচনাটি প্রক্রিয়াগত সীমায় থেমে নেই। সূত্রে উদ্ধৃত এক কর্মকর্তা বলেছেন, Anthropic জানত একটি jailbreak ঘটতে পারে, তবু এগিয়ে গেছে। সংশ্লিষ্ট নির্দিষ্ট jailbreak-এর অস্তিত্ব ও তীব্রতা সূত্রপাঠে নিশ্চিত করা হয়নি, তবে অভিযোগটি policy expectations এবং large language model আচরণের বাস্তবতার মধ্যে ক্রমবর্ধমান সংঘাতকে নির্দেশ করে।

মূল প্রযুক্তিগত সমস্যা

সূত্রটি বলছে, এই বিরোধ Anthropic-এর সিদ্ধান্তের পাশাপাশি সরকারের AI-সম্পর্কিত বোঝাপড়া সম্পর্কেও অনেক কিছু বলে। কারণটি সহজ: advanced language models-এর সঙ্গে ঘনিষ্ঠভাবে কাজ করা মানুষ সাধারণত prompt injection এবং jailbreaks-কে সম্পূর্ণ সমাধান হওয়া সমস্যা নয়, বরং স্থায়ী ঝুঁকি হিসেবে দেখেন।

প্রবন্ধে বলা হয়েছে, OpenAI সতর্ক করেছে যে prompt injection সম্ভবত কখনও পুরোপুরি সমাধান নাও হতে পারে। এটি গুরুত্বপূর্ণ, কারণ “unhackable” frontier models-এর দাবি এমন এক মানদণ্ড স্থাপন করে যা বাস্তবে, অন্তত বর্তমান architectures এবং deployment methods-এ, অর্জন করা সম্ভব নাও হতে পারে। তাই বাস্তব প্রশ্নটি এই নয় যে একটি শক্তিশালী মডেল কখনও সম্পূর্ণভাবে secure হতে পারে কি না, বরং ব্যর্থতাগুলি কতটা গুরুতর, countermeasures কত দ্রুত প্রয়োগ করা হয়, এবং কোন use cases-এ আরও শক্তিশালী containment দরকার।

Frontier models-এর জন্য ঝুঁকি কেন বেশি

মডেলগুলো science, technology, বা biology-সংক্রান্ত কাজে সহায়তা করতে সক্ষম হলে policy tension আরও তীব্র হয়। সূত্রটি স্মরণ করিয়ে দেয় যে Anthropic CEO Dario Amodei 2023 সালে বলেছিলেন, ওইসব ক্ষেত্রের safety protocols বাইপাস হলে jailbreak জীবন-মৃত্যুর প্রশ্ন হয়ে উঠতে পারে।

এটি ব্যাখ্যা করে কেন কর্মকর্তারা oversight ও release discipline নিয়ে এত চাপ দিচ্ছেন। পাশাপাশি এটি দেখায় যে industry jailbreak উদ্বেগকে সাধারণ ইন্টারনেটের দুষ্টুমি বলে উড়িয়ে দিতে পারে না। frontier পর্যায়ে ব্যর্থতার dual-use knowledge, misuse, বা স্বেচ্ছাসেবী governance frameworks-এর ওপর আস্থার ক্ষয়ের মতো প্রভাব থাকতে পারে।

এটি security test-এর মতোই governance test

প্রতিবেদন অনুযায়ী Commerce Department কর্মকর্তারা ও Anthropic কর্মীরা আলোচনায় রয়েছেন, এবং CIA ও science adviser Michael Kratsios-এর অংশগ্রহণে আরও বৈঠকের পরিকল্পনা আছে। এতে আরও বলা হয়েছে, 100-এর বেশি security expert ও tech executive Fable 5-এর ওপর export controls চেয়ে একটি open letter-এ স্বাক্ষর করেছেন।

সব মিলিয়ে, এই বিতর্ক শুধু একটি মডেল প্রকাশ নিয়ে নয়। acceptable risk কে সংজ্ঞায়িত করবে, formal institutions গঠনের আগে voluntary oversight কীভাবে কাজ করবে, এবং AI কোম্পানিগুলো কি সরকারের চেয়ে দ্রুত এগোতে গিয়ে আস্থার ক্ষতি না করেই তা করতে পারবে—এ নিয়েও এটি প্রশ্ন তোলে।

  • US officials বলছেন, পরিকল্পিত review mechanism-এর জন্য অপেক্ষা না করেই Anthropic Fable 5 প্রকাশ করেছে।
  • বিরোধের কেন্দ্রবিন্দু jailbreak risk এবং government oversight।
  • সূত্রের মতে সত্যিকারের unhackable LLMs-এর দাবি প্রযুক্তিগতভাবে অবাস্তব হতে পারে।

বড় শিক্ষা অস্বস্তিকর, কিন্তু উপকারী। Frontier AI security সম্ভবত safe-or-unsafe ধরনের দ্বিমুখী সীমায় গিয়ে থামবে না। বরং এটি layered mitigation, সীমিত deployment choices, monitoring, এবং release-পরবর্তী response-এর বিষয় হয়ে থাকবে। এটি ব্যাখ্যা করা কঠিন governance model, কিন্তু সূত্রে বর্ণিত প্রযুক্তির সঙ্গে সেটাই বেশি মানানসই।

নীতিনির্ধারকেরা যদি এমন সিস্টেমের কাছ থেকে absolute security চাইতেই থাকেন যা প্রকৃতিগতভাবে absolute security-কে প্রতিরোধ করে, তাহলে এ ধরনের সংঘাত আরও বাড়বে। AI governance-র পরবর্তী ধাপ নির্ভর করতে পারে এই প্রশ্নের ওপর যে, উভয় পক্ষ কি অসম্ভব মানদণ্ডকে বাস্তবায়নযোগ্য, প্রযুক্তিগতভাবে ভিত্তিসম্পন্ন মানদণ্ড দিয়ে প্রতিস্থাপন করতে পারে কি না।

এই নিবন্ধটি The Decoder-এর প্রতিবেদনের ওপর ভিত্তি করে। মূল নিবন্ধটি পড়ুন.

Originally published on the-decoder.com