Claude Mythos নাকি ঐতিহাসিক Erdős সমস্যা সমাধান করেছে

আরও একটি AI গণিত অগ্রগতির দাবি দ্রুত সামনে এল

ফ্রন্টিয়ার AI গণিতের প্রতিযোগিতামূলক চক্র দ্রুততর হচ্ছে। OpenAI নাকি Erdős unit-distance conjecture খণ্ডন করার পরই এখন Anthropic কর্মীরা বলছেন Claude Mythos-ও একই সমস্যার সমাধান করতে পারে, The Decoder অনুযায়ী।

এটি আপাতত কেবল সেই দাবিই: Anthropic কর্মীদের বর্ণিত এবং X-এ প্রকাশ্যে আলোচিত একটি reported result। এটি গুরুত্বপূর্ণ, কারণ এটি গল্পটিকে উন্নত AI গবেষণায় ক্রমশ সাধারণ হয়ে ওঠা এক শ্রেণিতে স্থাপন করে: গুরুত্বপূর্ণ প্রযুক্তিগত অগ্রগতি প্রথমে ল্যাব, ইঞ্জিনিয়ার এবং কাজ করা গণিতবিদদের মধ্যে ছড়িয়ে পড়ে, তার আগে একটি পূর্ণাঙ্গ প্রাতিষ্ঠানিক পত্র বা বিস্তৃত স্বাধীন যাচাইকরণ প্রশ্নটির নিষ্পত্তি করে।

এই সতর্কতা সত্ত্বেও, প্রতিবেদন করা উন্নয়নটি তাৎপর্যপূর্ণ। Erdős unit-distance conjecture 1946 সাল থেকে খোলা রয়েছে। যদি একাধিক frontier system এখন দীর্ঘদিনের combinatorial-geometry সমস্যার জন্য কার্যকর সমাধানের পথ খুঁজে পায়, তবে প্রাসঙ্গিক গল্প আর কেবল একটি শিরোনাম-আকর্ষণকারী প্রমাণ নয়। বরং সম্ভাবনাটি হলো, উন্নত মডেলগুলি কঠিন গবেষণা সমস্যায় পুনরাবৃত্তভাবে মূল্য দেখাতে শুরু করেছে।

Anthropic নাকি কী করেছে

মূল লেখার মতে, AI আরেকটি Erdős সমস্যা সমাধান করার পর Anthropic একটি test setup তৈরি করে। এই সিস্টেমে Mythos access-সহ বিচ্ছিন্ন Claude Code instances ছিল, যাদের কাছে সমস্যা পাঠানো হয়, তারা সমাধানের পথ অন্বেষণ করে, এবং পরে সংক্ষিপ্ত ফলাফল অন্যান্য স্বাধীনভাবে কাজ করা instances-এ পাঠায়। এই বিবরণটি গুরুত্বপূর্ণ, কারণ এটি আলোচনাকে একটি একক prompt থেকে agentic workflow-এর দিকে সরিয়ে দেয়।

অন্যভাবে বললে, এই reported achievement-কে pure one-shot language-model উত্তর হিসেবে উপস্থাপন করা হচ্ছে না। এটি বরং একটি সমন্বিত গবেষণা harness-এর মতো: একাধিক model instance, problem decomposition, summarization, এবং পদ্ধতিগুলোর পুনরাবৃত্ত তুলনা। এতে ফলাফলটি আর কেবল একটি পরিষ্কার demo থাকে না, বরং AI-সহায়িত গণিতের কাজ বাস্তবে কীভাবে এগোতে পারে তার একটি পূর্বাভাস হয়ে ওঠে।

সূত্রটি আরও বলছে, Mythos প্রায়ই OpenAI-এর model-এর চেয়ে ভিন্ন পথ নিয়েছিল। যদি তা সঠিক হয়, তবে এটি কেবল পুনরাবৃত্তির চেয়েও বেশি আকর্ষণীয় কিছু নির্দেশ করে। স্বাধীন সমাধান কৌশল, কেবল পরিচিত reasoning line পুনরুত্পাদন করার চেয়ে, প্রকৃত গবেষণা মূল্যের কাছাকাছি।

front and side images of a researcher equipped with AI training devices, part of the XRZero-G0 system.

XRZero-G0 2,000 ঘণ্টার রোবোটিক্স ডেটাসেট ওপেন-সোর্স করল

X Square Robot XRZero-G0 এবং 2,000 ঘণ্টার একটি মাল্টিমোডাল ডেটাসেট প্রকাশ করেছে, যার লক্ষ্য embodied AI সিস্টেমের জন্য বাস্তব-রোবট প্রশিক্ষণ ডেটার প্রয়োজনীয়তা কমানো।

Read article

এই তুলনা কেন গুরুত্বপূর্ণ

প্রবন্ধে বলা হয়েছে, গণিতবিদ Daniel Litt নাকি Anthropic-এর ফলাফলকে OpenAI-এর তুলনায় “একটু খারাপ” বলেছেন, তবে একই সঙ্গে বলেছেন Mythos OpenAI-এর সমাধানও খুঁজে পেয়েছে। এটি মনে করিয়ে দেয়, সব প্রমাণ সমান নয়। গণিতে correctness-এর সঙ্গে elegance, সংক্ষেপণ, এবং ধারণাগত নতুনত্বও গুরুত্বপূর্ণ।

তবে কৌশলগত takeaway হলো না যে এক ল্যাবের প্রমাণ অন্যটির চেয়ে বেশি সুন্দর ছিল। বরং এটি যে একাধিক ল্যাব এখন মনে করছে তাদের সিস্টেম আগের প্রজন্মের তুলনায় অনেক উচ্চ স্তরে open mathematical problem-এর সঙ্গে কাজ করতে পারে। একবার সেটি পুনরাবৃত্তিযোগ্য হলে, সীমান্তটি “AI কি এটা করতে পারে?” থেকে সরে “কত ঘনঘন, কতটা স্বাধীনভাবে, এবং কত মানব তত্ত্বাবধানে?”-এ এসে দাঁড়ায়।

The Decoder আরও উল্লেখ করেছে যে Google DeepMind সম্প্রতি ঘোষণা করেছে, একটি AI-সহায়িত সিস্টেম Lean, একটি formal proof language, ব্যবহার করে নয়টি Erdős সমস্যা সমাধান করেছে। এই তুলনাটি বর্তমান AI গণিত কাজের একটি গুরুত্বপূর্ণ পার্থক্যকে স্পষ্ট করে। কিছু সিস্টেম formal-verification environment-এর ওপর ব্যাপকভাবে নির্ভর করে; অন্যগুলোকে natural-language reasoning এবং agentic exploration-এর ভিত্তিতে বেশি বিচার করা হচ্ছে। কোন ধরনটি কাঁচা সক্ষমতা সম্পর্কে বেশি প্রকাশ করে, তা নিয়ে ক্ষেত্রটি এখনও স্থির হয়নি।

বড় পরিবর্তন

এই গল্পটিকে টেকসই করে তোলে শুধু নির্দিষ্ট conjecture নয়। বরং পরবর্তী দাবিগুলোর গতি। গণিতে open problem একসময় মানব ও যন্ত্রের reasoning-এর সীমানার পরিষ্কার চিহ্ন হিসেবে কাজ করত। এখন সেই সীমানা বেশি porous মনে হচ্ছে, বিশেষ করে যখন ল্যাবগুলো frontier model-কে orchestration tool-এর সঙ্গে জুড়ে দেয়, যাতে তারা শাখা তৈরি করতে, তুলনা করতে, সারসংক্ষেপ করতে এবং আবার চেষ্টা করতে পারে।

একটি reported lab success এবং একটি স্থিতিশীল, ব্যাপকভাবে বিশ্বাসযোগ্য research system-এর মধ্যে এখনও বড় পার্থক্য রয়েছে। যাচাইকরণ, peer review, এবং reproducibility অপরিহার্য। তবে patternটি উপেক্ষা করা কঠিন: AI ল্যাবগুলো আর শুধু benchmark gains বা polished consumer assistant দেখাচ্ছে না। তারা increasingly তাদের system-কে advanced knowledge work-এর contributor হিসেবে উপস্থাপন করছে।

এই দাবিগুলো যদি টিকে যায়, তবে AI গণিতের headlines আর বিরল ব্যতিক্রম থাকবে না, বরং একটি উদীয়মান research category হিসেবে দেখা যাবে।

Anthropic কর্মীরা বলছেন Claude Mythos Erdős unit-distance conjecture সমাধান করেছে।
reported setup-এ একটি সরল one-shot prompt-এর বদলে একাধিক coordinated Claude Code instances ব্যবহার করা হয়েছিল।
বড় পরিবর্তন হলো, বিচ্ছিন্ন benchmark জয় থেকে research-style math exploration-এ AI system ব্যবহার করা।

এই নিবন্ধটি The Decoder-এর প্রতিবেদনের ভিত্তিতে লেখা। মূল নিবন্ধ পড়ুন.

Anthropic বাধ্যতামূলক অডিটের দাবি জানাচ্ছে, AI-কে কৌশলগত অবকাঠামো হিসেবে পুনর্গঠন করছে

Anthropic CEO Dario Amodei বলেছেন, শুধু স্বচ্ছতা-সংক্রান্ত নিয়ম এখন আর যথেষ্ট নয় এবং তিনি frontier AI সিস্টেমগুলোর জন্য বাধ্যতামূলক তৃতীয়-পক্ষ অডিটের আহ্বান জানাচ্ছেন।

Read article

Originally published on the-decoder.com

Anthropic-এর Claude Mythos নাকি একটি ঐতিহাসিক Erdős সমস্যা সমাধান করেছে এমন সর্বশেষ AI