Anthropic-এর সাইবারসিকিউরিটি গল্প এখন replication চাপে

Anthropic Claude Mythos-কে একটি কঠোরভাবে নিয়ন্ত্রিত cybersecurity model হিসেবে উপস্থাপন করেছে, যার ক্ষমতা restricted access-কে ন্যায্যতা দেওয়ার মতো যথেষ্ট শক্তিশালী বলে দাবি করা হয়েছে। সরবরাহকৃত উৎসপাঠ্য অনুযায়ী, কোম্পানি Project Glasswing-এর মাধ্যমে Mythos Preview-কে এগারোটি সংস্থার একটি consortium-এর কাছে সীমাবদ্ধ রেখেছিল, কারণ হিসেবে offensive potential উল্লেখ করা হয়। অভ্যন্তরীণ পরীক্ষা এবং UK’s AI Security Institute-এর একটি audit অনুযায়ী, model সফটওয়্যার bug খুঁজে পেতে, নিজে working exploit তৈরি করতে এবং simulation-এ পুরো corporate network compromise করতে পারত, তবে সেগুলোকে ছোট, দুর্বলভাবে সুরক্ষিত এবং vulnerable হতে হত।

এগুলো গুরুতর দাবি, আর নতুন বিকাশটি এই নয় যে দাবিগুলো মিথ্যা প্রমাণিত হয়েছে। বরং exclusivity narrative-এর কিছু অংশ এখন চ্যালেঞ্জের মুখে পড়ছে। উৎসে বর্ণিত দুটি স্বাধীন replication প্রচেষ্টা ইঙ্গিত দিচ্ছে, ছোট এবং আরও open models Anthropic যে vulnerability analysis প্রকাশ্যে দেখিয়েছিল তার বড় অংশই পুনরুত্পাদন করতে পারে।

এই পার্থক্যটি গুরুত্বপূর্ণ। বিতর্ক এখন Mythos সক্ষম কি না, সেটা নিয়ে নয়; বরং প্রদর্শিত ক্ষমতাগুলো সত্যিই অনন্য কি না, তা নিয়ে।

Replication প্রচেষ্টাগুলো কী পেল

প্রথম replication প্রচেষ্টা এসেছিল AISLE থেকে, একটি কোম্পানি যা mid-2025 থেকে open source software-এ AI-assisted bug hunting চালাচ্ছে। উৎস বলছে, AISLE OpenSSL-এ 15টি vulnerability এবং curl-এ পাঁচটি vulnerability রিপোর্ট করেছে। প্রতিষ্ঠাতা Stanislav Fort Anthropic-এর public samples থেকে code snippet ব্যবহার করে পরীক্ষা করেছিলেন, বিভিন্ন ছোট এবং আংশিকভাবে open models নিজেরাই কতদূর যেতে পারে।

দ্বিতীয় প্রচেষ্টা এসেছিল Vidoc Security থেকে, যারা GPT-5.4 এবং Claude Opus 4.6-কে open coding agent OpenCode-এর সঙ্গে জুড়েছে। একসঙ্গে, এই গবেষণাগুলো একটি ব্যবহারিক প্রশ্নের উত্তর খোঁজে: Anthropic যখন চমকপ্রদ bug-finding বা exploit reasoning দেখায়, তখন তার কতটা Mythos-এর একচেটিয়া ক্ষমতা, আর কতটা model landscape জুড়ে ছড়িয়ে পড়া capability frontier-এর প্রতিফলন?

উৎসপাঠ্য থেকে প্রাথমিক উত্তরটি ইঙ্গিত দেয় যে frontier, Anthropic-এর access control যা বোঝায় তার চেয়ে বিস্তৃত হতে পারে।

FreeBSD উদাহরণটি মূল পরীক্ষা

প্রদত্ত উপকরণের সবচেয়ে নির্দিষ্ট উদাহরণটি একটি FreeBSD NFS bug, যা CVE-2026-4747 হিসেবে চিহ্নিত। Anthropic এই ঘটনাটিকে Mythos-এর autonomous discovery এবং exploitation-এর প্রদর্শন হিসেবে তুলে ধরেছিল। এরপর AISLE সংশ্লিষ্ট function-এর বিরুদ্ধে আটটি model পরীক্ষা করে এবং, নিবন্ধ অনুযায়ী, প্রতিটিই ওই memory bug শনাক্ত করে।

এটি প্রতিবেদনের সবচেয়ে শক্তিশালী চ্যালেঞ্জ। আটটি model কেবল flaw-টিকে critical বলেই চিহ্নিত করেনি, তারা exploitation কীভাবে ঘটতে পারে এবং standard operating-system protections কেন প্রযোজ্য হবে না, সে সম্পর্কেও যুক্তিসঙ্গত reasoning তৈরি করেছে। GPT-OSS-120b নামের একটি model এমন একটি gadget sequence তৈরি করেছে, যা AISLE প্রকৃত exploit-এর খুব কাছাকাছি বলে মনে করেছে। Kimi K2, নিবন্ধের ভাষ্য অনুযায়ী, এই আক্রমণ একটি infected machine থেকে অন্য machine-এ স্বয়ংক্রিয়ভাবে ছড়িয়ে পড়তে পারে বলেও অনুমান করেছে, যা Anthropic নিজে উল্লেখ করেনি।

যদি এই ফলাফলগুলো সঠিক হয়, তবে এই ধরনের vulnerability শনাক্ত ও বিশ্লেষণ করা একটি কঠোরভাবে নিয়ন্ত্রিত model-এর একচেটিয়া বিষয়—এই ধারণাকে তা দুর্বল করে।

ফাঁকটা এখনও কোথায় দেখা যাচ্ছে

একই সঙ্গে, উৎসপাঠ্য Mythos এবং ছোট open models-এর মধ্যে সব পার্থক্য মুছে দেয় না। এটি exploit chain-এর আরও কঠিন একটি creative step-এর দিকে ইঙ্গিত করে: 1,000 bytes-এর বেশি payload-কে প্রায় 304 bytes উপলভ্য জায়গায় ফিট করানো। নিবন্ধ অনুযায়ী, Mythos এটি 15টি আলাদা network request-এ payload ভাগ করে অর্জন করেছে। বর্ণিত replication প্রচেষ্টার কোনোটিই visible text-এ সেই স্তরের exploit construction-এর সমতুল্য হয়নি।

এই সূক্ষ্মতাটি গুরুত্বপূর্ণ। এর মানে, gap আর প্রথম পর্যায়ের vulnerability recognition বা উচ্চস্তরের exploit reasoning-এ নয়, বরং সীমিত শর্তে একটি vulnerability-কে পুরোপুরি কার্যকর attack-এ রূপান্তর করার আরও কঠিন engineering-এ থাকতে পারে।

অন্য কথায়, replication studies Mythos সাধারণ বলে প্রমাণ করে না। তবে এগুলো ইঙ্গিত দেয় যে তার অনন্যতা দেখাতে ব্যবহৃত কিছু headline example প্রথম দেখায় যতটা একক মনে হয়েছিল, ততটা নয়।

AI নিরাপত্তা নীতির জন্য কেন এটি গুরুত্বপূর্ণ

এর প্রভাব model vendor-দের এক বিতর্কের অনেক বাইরে যায়। access restrictions, safety policies এবং national security debates increasingly এই দাবির ওপর নির্ভর করছে যে কোন system-গুলো সত্যিই capability threshold অতিক্রম করেছে। যদি ছোট বা আংশিকভাবে open models প্রদর্শিত কাজের বড় অংশ পুনরুত্পাদন করতে পারে, তবে policymakers এবং labs-কে আরও স্পষ্টভাবে সংজ্ঞায়িত করতে হবে material novelty বা বিশেষভাবে বিপজ্জনক কী।

এটি frontier AI governance-এর কেন্দ্রীয় টানাপোড়েনগুলোর একটি। একটি কোম্পানি শক্তিশালী model-এ access সীমাবদ্ধ করতে সৎ হতে পারে, কিন্তু সেই সীমাবদ্ধতা ন্যায্য করতে ব্যবহৃত public example দ্রুত উন্নত open ecosystem-এর বিরুদ্ধে পরীক্ষা করা যেতে পারে। একবার তা হলে প্রশ্ন আর শুধু flagship model শক্তিশালী কি না, সেটি থাকে না; বরং restricted capability ইতিমধ্যেই ছড়িয়ে পড়ছে কি না, সেটি হয়ে যায়।

নিবন্ধের উপস্থাপনায় ইঙ্গিত রয়েছে যে AI-assisted cyber research-এ এটাই ঘটছে। খুব সম্প্রতি যে ক্ষমতাগুলো ব্যতিক্রমী মনে হচ্ছিল, সেগুলো এখন কিছু vendor যে রকম ইঙ্গিত দিয়েছিল তার চেয়ে কম খরচে এবং আরও openভাবে পুনরুত্পাদনযোগ্য হয়ে উঠতে পারে।

Model market-এর জন্য প্রতিযোগিতামূলক অর্থ

এখানে একটি বাণিজ্যিক দিকও আছে। Mythos ঘিরে Anthropic-এর positioning আংশিকভাবে এই বিশ্বাসের ওপর নির্ভর করে যে এটি offensive cyber capability-এর বিরল স্তরে অবস্থান করে। যদি প্রকাশ্যে বা semi-open models একই কাজের অনেকটাই অনুকরণ করতে পারে, তাহলে value proposition বদলে যায়।

এতে reliability, depth বা end-to-end automation-এর সুবিধা মুছে যায় না। কিন্তু এটি সেই narrative দুর্বল করে যে কেবল এক বা দুইটি protected system-ই meaningful autonomous vulnerability analysis করতে পারে। ক্রেতা, মূল্যায়নকারী এবং security researcher-দের জন্য এটি আরও বিস্তৃত model-এর মধ্যে benchmarking pressure বাড়াতে পারে।

এটি model weight-এর চেয়ে agent এবং toolchain-এর ভূমিকাকেও শক্তিশালী করতে পারে। উৎসে বর্ণিত replication প্রচেষ্টাগুলোর একটি frontier model-গুলিকে open coding agent-এর সঙ্গে জোড়ে, যা মনে করিয়ে দেয় compound system-গুলো একক model-এর raw capability-এর মতোই, কখনও কখনও তার চেয়েও বেশি, গুরুত্বপূর্ণ হয়ে উঠছে।

মিথটা ছোট হচ্ছে, কিন্তু সক্ষমতা ভাঙছে না

উৎস নিবন্ধের শিরোনাম ইচ্ছাকৃতভাবে তীক্ষ্ণ, কিন্তু বর্ণিত প্রমাণ আরও নির্ভুল একটি সিদ্ধান্তকে সমর্থন করে। Mythos-এর গল্প model-এর ক্ষমতা না থাকার কারণে ভাঙছে না। এটি ছোট হচ্ছে, কারণ তার অনন্যতা দেখাতে ব্যবহৃত example-গুলো এখন অন্তত আংশিকভাবে ছোট এবং আরও open বিকল্পের সঙ্গে মিলে যাচ্ছে।

এটি এখনও একটি বড় ঘটনা। AI-তে status অনেকাংশে absolute performance-এর চেয়ে comparative perception-এর ওপর নির্ভর করে। exclusivity-র আবহ দুর্বল হলে strategic conversation বদলে যায়।

Developments Today-এর পাঠকদের জন্য মূল takeaway হলো: AI cyber capability-এর frontier institutional narrative যে গতিতে নিয়ন্ত্রণ করতে পারে, তার চেয়েও দ্রুত ছড়িয়ে পড়তে পারে। Anthropic-এর হাতে এখনো শক্তিশালী system থাকতে পারে। কিন্তু যদি স্বাধীন গোষ্ঠী সস্তা এবং আরও open models দিয়ে তার public showcase work-এর বড় অংশ পুনরুত্পাদন করতে পারে, তবে আসল গল্প আর কেবল একটি lab-এর extraordinary tool নিয়ে নয়। এটি এমন একটি capability class নিয়ে, যেটিকে monopolize করা ক্রমশ কঠিন হয়ে উঠছে।

এই নিবন্ধটি The Decoder-এর প্রতিবেদনভিত্তিক। মূল নিবন্ধটি পড়ুন.

Originally published on the-decoder.com