আরও একটি AI গণিত অগ্রগতির দাবি দ্রুত সামনে এল

ফ্রন্টিয়ার AI গণিতের প্রতিযোগিতামূলক চক্র দ্রুততর হচ্ছে। OpenAI নাকি Erdős unit-distance conjecture খণ্ডন করার পরই এখন Anthropic কর্মীরা বলছেন Claude Mythos-ও একই সমস্যার সমাধান করতে পারে, The Decoder অনুযায়ী।

এটি আপাতত কেবল সেই দাবিই: Anthropic কর্মীদের বর্ণিত এবং X-এ প্রকাশ্যে আলোচিত একটি reported result। এটি গুরুত্বপূর্ণ, কারণ এটি গল্পটিকে উন্নত AI গবেষণায় ক্রমশ সাধারণ হয়ে ওঠা এক শ্রেণিতে স্থাপন করে: গুরুত্বপূর্ণ প্রযুক্তিগত অগ্রগতি প্রথমে ল্যাব, ইঞ্জিনিয়ার এবং কাজ করা গণিতবিদদের মধ্যে ছড়িয়ে পড়ে, তার আগে একটি পূর্ণাঙ্গ প্রাতিষ্ঠানিক পত্র বা বিস্তৃত স্বাধীন যাচাইকরণ প্রশ্নটির নিষ্পত্তি করে।

এই সতর্কতা সত্ত্বেও, প্রতিবেদন করা উন্নয়নটি তাৎপর্যপূর্ণ। Erdős unit-distance conjecture 1946 সাল থেকে খোলা রয়েছে। যদি একাধিক frontier system এখন দীর্ঘদিনের combinatorial-geometry সমস্যার জন্য কার্যকর সমাধানের পথ খুঁজে পায়, তবে প্রাসঙ্গিক গল্প আর কেবল একটি শিরোনাম-আকর্ষণকারী প্রমাণ নয়। বরং সম্ভাবনাটি হলো, উন্নত মডেলগুলি কঠিন গবেষণা সমস্যায় পুনরাবৃত্তভাবে মূল্য দেখাতে শুরু করেছে।

Anthropic নাকি কী করেছে

মূল লেখার মতে, AI আরেকটি Erdős সমস্যা সমাধান করার পর Anthropic একটি test setup তৈরি করে। এই সিস্টেমে Mythos access-সহ বিচ্ছিন্ন Claude Code instances ছিল, যাদের কাছে সমস্যা পাঠানো হয়, তারা সমাধানের পথ অন্বেষণ করে, এবং পরে সংক্ষিপ্ত ফলাফল অন্যান্য স্বাধীনভাবে কাজ করা instances-এ পাঠায়। এই বিবরণটি গুরুত্বপূর্ণ, কারণ এটি আলোচনাকে একটি একক prompt থেকে agentic workflow-এর দিকে সরিয়ে দেয়।

অন্যভাবে বললে, এই reported achievement-কে pure one-shot language-model উত্তর হিসেবে উপস্থাপন করা হচ্ছে না। এটি বরং একটি সমন্বিত গবেষণা harness-এর মতো: একাধিক model instance, problem decomposition, summarization, এবং পদ্ধতিগুলোর পুনরাবৃত্ত তুলনা। এতে ফলাফলটি আর কেবল একটি পরিষ্কার demo থাকে না, বরং AI-সহায়িত গণিতের কাজ বাস্তবে কীভাবে এগোতে পারে তার একটি পূর্বাভাস হয়ে ওঠে।

সূত্রটি আরও বলছে, Mythos প্রায়ই OpenAI-এর model-এর চেয়ে ভিন্ন পথ নিয়েছিল। যদি তা সঠিক হয়, তবে এটি কেবল পুনরাবৃত্তির চেয়েও বেশি আকর্ষণীয় কিছু নির্দেশ করে। স্বাধীন সমাধান কৌশল, কেবল পরিচিত reasoning line পুনরুত্পাদন করার চেয়ে, প্রকৃত গবেষণা মূল্যের কাছাকাছি।

এই তুলনা কেন গুরুত্বপূর্ণ

প্রবন্ধে বলা হয়েছে, গণিতবিদ Daniel Litt নাকি Anthropic-এর ফলাফলকে OpenAI-এর তুলনায় “একটু খারাপ” বলেছেন, তবে একই সঙ্গে বলেছেন Mythos OpenAI-এর সমাধানও খুঁজে পেয়েছে। এটি মনে করিয়ে দেয়, সব প্রমাণ সমান নয়। গণিতে correctness-এর সঙ্গে elegance, সংক্ষেপণ, এবং ধারণাগত নতুনত্বও গুরুত্বপূর্ণ।

তবে কৌশলগত takeaway হলো না যে এক ল্যাবের প্রমাণ অন্যটির চেয়ে বেশি সুন্দর ছিল। বরং এটি যে একাধিক ল্যাব এখন মনে করছে তাদের সিস্টেম আগের প্রজন্মের তুলনায় অনেক উচ্চ স্তরে open mathematical problem-এর সঙ্গে কাজ করতে পারে। একবার সেটি পুনরাবৃত্তিযোগ্য হলে, সীমান্তটি “AI কি এটা করতে পারে?” থেকে সরে “কত ঘনঘন, কতটা স্বাধীনভাবে, এবং কত মানব তত্ত্বাবধানে?”-এ এসে দাঁড়ায়।

The Decoder আরও উল্লেখ করেছে যে Google DeepMind সম্প্রতি ঘোষণা করেছে, একটি AI-সহায়িত সিস্টেম Lean, একটি formal proof language, ব্যবহার করে নয়টি Erdős সমস্যা সমাধান করেছে। এই তুলনাটি বর্তমান AI গণিত কাজের একটি গুরুত্বপূর্ণ পার্থক্যকে স্পষ্ট করে। কিছু সিস্টেম formal-verification environment-এর ওপর ব্যাপকভাবে নির্ভর করে; অন্যগুলোকে natural-language reasoning এবং agentic exploration-এর ভিত্তিতে বেশি বিচার করা হচ্ছে। কোন ধরনটি কাঁচা সক্ষমতা সম্পর্কে বেশি প্রকাশ করে, তা নিয়ে ক্ষেত্রটি এখনও স্থির হয়নি।

বড় পরিবর্তন

এই গল্পটিকে টেকসই করে তোলে শুধু নির্দিষ্ট conjecture নয়। বরং পরবর্তী দাবিগুলোর গতি। গণিতে open problem একসময় মানব ও যন্ত্রের reasoning-এর সীমানার পরিষ্কার চিহ্ন হিসেবে কাজ করত। এখন সেই সীমানা বেশি porous মনে হচ্ছে, বিশেষ করে যখন ল্যাবগুলো frontier model-কে orchestration tool-এর সঙ্গে জুড়ে দেয়, যাতে তারা শাখা তৈরি করতে, তুলনা করতে, সারসংক্ষেপ করতে এবং আবার চেষ্টা করতে পারে।

একটি reported lab success এবং একটি স্থিতিশীল, ব্যাপকভাবে বিশ্বাসযোগ্য research system-এর মধ্যে এখনও বড় পার্থক্য রয়েছে। যাচাইকরণ, peer review, এবং reproducibility অপরিহার্য। তবে patternটি উপেক্ষা করা কঠিন: AI ল্যাবগুলো আর শুধু benchmark gains বা polished consumer assistant দেখাচ্ছে না। তারা increasingly তাদের system-কে advanced knowledge work-এর contributor হিসেবে উপস্থাপন করছে।

এই দাবিগুলো যদি টিকে যায়, তবে AI গণিতের headlines আর বিরল ব্যতিক্রম থাকবে না, বরং একটি উদীয়মান research category হিসেবে দেখা যাবে।

  • Anthropic কর্মীরা বলছেন Claude Mythos Erdős unit-distance conjecture সমাধান করেছে।
  • reported setup-এ একটি সরল one-shot prompt-এর বদলে একাধিক coordinated Claude Code instances ব্যবহার করা হয়েছিল।
  • বড় পরিবর্তন হলো, বিচ্ছিন্ন benchmark জয় থেকে research-style math exploration-এ AI system ব্যবহার করা।

এই নিবন্ধটি The Decoder-এর প্রতিবেদনের ভিত্তিতে লেখা। মূল নিবন্ধ পড়ুন.

Originally published on the-decoder.com