आणखी एक कथित AI गणितातील यश वेगाने समोर आले

फ्रंटियर AI गणितातील स्पर्धात्मक चक्र वेगाने पुढे जात आहे. OpenAI ने Erdős unit-distance conjecture खोडून काढल्याचा दावा झाल्यानंतर लगेचच, Anthropic मधील कर्मचारी आता म्हणत आहेत की Claude Mythos देखील तीच समस्या सोडवू शकते, The Decoder नुसार.

हा दावा सध्या नेमका तेवढाच आहे: Anthropic कर्मचाऱ्यांनी वर्णन केलेला आणि X वर सार्वजनिकपणे चर्चिला गेलेला एक reported result. हे महत्त्वाचे आहे, कारण यामुळे ही कथा प्रगत AI संशोधनात अधिकाधिक सामान्य होत चाललेल्या वर्गात बसते: अर्थपूर्ण तांत्रिक प्रगती प्रथम प्रयोगशाळा, अभियंते, आणि काम करणारे गणितज्ञ यांच्यात फिरते, त्यानंतरच औपचारिक संस्थात्मक पेपर किंवा व्यापक स्वतंत्र पडताळणी प्रश्न निकाली काढते.

त्या सावधगिरीनंतरही, अहवालित घडामोड महत्त्वाची आहे. Erdős unit-distance conjecture 1946 पासून उघडी आहे. जर अनेक frontier systems आता दीर्घकाळ चालत आलेल्या combinatorial-geometry समस्येसाठी व्यवहार्य समाधान मार्ग शोधू शकत असतील, तर संबंधित कथा फक्त एक लक्षवेधी पुरावा इतकी मर्यादित राहत नाही. ती ही शक्यता दर्शवते की प्रगत मॉडेल्स कठीण संशोधन समस्यांवर पुनरावृत्तीने उपयुक्त मूल्य दाखवू लागली आहेत.

Anthropic ने कथितपणे काय केले

मूळ मजकुरानुसार, AI ने आणखी एक Erdős समस्या सोडवल्यानंतर Anthropic ने एक test setup तयार केला. या प्रणालीत Mythos access असलेली isolated Claude Code instances होती, ज्यांना समस्या देण्यात आली, त्यांनी solution paths शोधले, आणि नंतर संक्षिप्त निष्कर्ष इतर स्वतंत्रपणे काम करणाऱ्या instances कडे पाठवले. हा तपशील महत्त्वाचा आहे, कारण तो चर्चेला एका एकमेव prompt पासून agentic workflow कडे वळवतो.

दुसऱ्या शब्दांत सांगायचे तर, हा कथित यश pure one-shot language-model उत्तर म्हणून मांडलेला नाही. तो अधिक coordinated research harness सारखा आहे: अनेक model instances, समस्या विभागणी, summarization, आणि दृष्टिकोनांची पुनरावृत्तीने तुलना. त्यामुळे हा निकाल नीटस demo पेक्षा प्रत्यक्षात AI-सहाय्यित गणितीय काम कसे पुढे जाऊ शकते याचा एक पूर्वावलोकन ठरतो.

स्रोत असेही सांगतो की Mythos ने अनेकदा OpenAI च्या model पेक्षा वेगळा मार्ग घेतला. हे खरे असल्यास, ते फक्त पुनरावृत्तीपेक्षा अधिक रंजक काहीतरी सूचित करते. स्वतंत्र समाधान रणनीती, केवळ आधीपासून ज्ञात reasoning line ची नक्कल करण्यापेक्षा, खऱ्या संशोधन मूल्यास अधिक जवळ असतात.

ही तुलना का महत्त्वाची आहे

लेखात म्हटले आहे की गणितज्ञ Daniel Litt यांनी Anthropic चा निकाल OpenAI च्या तुलनेत “थोडासा वाईट” असल्याचे कथितपणे म्हटले, पण त्याचबरोबर Mythos ने OpenAI चे समाधानही शोधले असेही सांगितले. हे लक्षात आणून देते की सर्व पुरावे सारखे नसतात. गणितात correctness बरोबरच elegance, संक्षिप्तता, आणि वैचारिक नव्यता यांनाही महत्त्व असते.

तरीसुद्धा, धोरणात्मक निष्कर्ष असा नाही की एका लॅबचा पुरावा दुसऱ्यापेक्षा अधिक सुंदर होता. मुद्दा हा आहे की आता अनेक लॅब्सना वाटते की त्यांची प्रणाली पूर्वीच्या पिढ्यांपेक्षा खूप उच्च पातळीवर open mathematical problems सोबत काम करू शकते. एकदा ते पुनरावृत्तीने शक्य झाले की, सीमारेषा “AI हे करू शकते का?” यापासून “किती वेळा, किती स्वतंत्रपणे, आणि किती मानवी देखरेखीखाली?” याकडे सरकते.

The Decoder असेही नमूद करते की Google DeepMind ने अलीकडेच एक AI-सहाय्यित प्रणाली Lean, एक formal proof language, वापरून नऊ Erdős समस्या सोडवल्याची घोषणा केली. ही तुलना सध्याच्या AI गणित कार्यातील एक महत्त्वाचा फरक स्पष्ट करते. काही प्रणाली formal-verification environments वर मोठ्या प्रमाणावर अवलंबून असतात; इतरांना natural-language reasoning आणि agentic exploration च्या आधारे अधिक तपासले जात आहे. कच्च्या क्षमतेबद्दल कोणती शैली अधिक बोलकी आहे, याबाबत क्षेत्राने अद्याप ठाम निर्णय घेतलेला नाही.

मोठा बदल

ही कथा टिकून राहते ती फक्त विशिष्ट conjecture मुळे नाही. ती पुढील दाव्यांच्या वेगामुळे आहे. गणितातील open problems एकेकाळी मानवी आणि यांत्रिक reasoning यांच्यातील सीमारेषेचे स्पष्ट चिन्ह मानले जात. आता ती सीमारेषा अधिक भेद्य वाटते, विशेषतः जेव्हा लॅब्स frontier models ना orchestration tools सोबत जोडतात, ज्यामुळे त्यांना शाखा काढणे, तुलना करणे, सारांश देणे, आणि पुन्हा प्रयत्न करणे शक्य होते.

कथित lab success आणि स्थिर, व्यापकपणे विश्वासार्ह research system यांच्यात अजूनही मोठा फरक आहे. पडताळणी, peer review, आणि reproducibility अत्यावश्यक आहेत. पण नमुना दुर्लक्ष करणे कठीण आहे: AI लॅब्स आता फक्त benchmark gains किंवा polished consumer assistants सादर करत नाहीत. त्या increasingly त्यांच्या systems ना advanced knowledge work मध्ये योगदान देणारे म्हणून मांडत आहेत.

जर हे दावे पुढेही टिकले, तर AI गणिताच्या बातम्या दुर्मीळ अपवाद राहणार नाहीत आणि त्या स्वतःच एक उदयोन्मुख research category म्हणून दिसू लागतील.

  • Anthropic कर्मचारी सांगतात की Claude Mythos ने Erdős unit-distance conjecture सोडवली.
  • अहवालित setup मध्ये साध्या one-shot prompt ऐवजी अनेक coordinated Claude Code instances वापरल्या गेल्या.
  • मुख्य बदल म्हणजे isolated benchmark विजयांपासून research-style math exploration मध्ये AI systems वापरण्याकडे होणारी वाटचाल.

हा लेख The Decoder च्या वार्तांकनावर आधारित आहे. मूळ लेख वाचा.

Originally published on the-decoder.com