Claude Mythos ने कथितपणे महत्त्वाची Erdős समस्या सोडवली

आणखी एक कथित AI गणितातील यश वेगाने समोर आले

फ्रंटियर AI गणितातील स्पर्धात्मक चक्र वेगाने पुढे जात आहे. OpenAI ने Erdős unit-distance conjecture खोडून काढल्याचा दावा झाल्यानंतर लगेचच, Anthropic मधील कर्मचारी आता म्हणत आहेत की Claude Mythos देखील तीच समस्या सोडवू शकते, The Decoder नुसार.

हा दावा सध्या नेमका तेवढाच आहे: Anthropic कर्मचाऱ्यांनी वर्णन केलेला आणि X वर सार्वजनिकपणे चर्चिला गेलेला एक reported result. हे महत्त्वाचे आहे, कारण यामुळे ही कथा प्रगत AI संशोधनात अधिकाधिक सामान्य होत चाललेल्या वर्गात बसते: अर्थपूर्ण तांत्रिक प्रगती प्रथम प्रयोगशाळा, अभियंते, आणि काम करणारे गणितज्ञ यांच्यात फिरते, त्यानंतरच औपचारिक संस्थात्मक पेपर किंवा व्यापक स्वतंत्र पडताळणी प्रश्न निकाली काढते.

त्या सावधगिरीनंतरही, अहवालित घडामोड महत्त्वाची आहे. Erdős unit-distance conjecture 1946 पासून उघडी आहे. जर अनेक frontier systems आता दीर्घकाळ चालत आलेल्या combinatorial-geometry समस्येसाठी व्यवहार्य समाधान मार्ग शोधू शकत असतील, तर संबंधित कथा फक्त एक लक्षवेधी पुरावा इतकी मर्यादित राहत नाही. ती ही शक्यता दर्शवते की प्रगत मॉडेल्स कठीण संशोधन समस्यांवर पुनरावृत्तीने उपयुक्त मूल्य दाखवू लागली आहेत.

Anthropic ने कथितपणे काय केले

मूळ मजकुरानुसार, AI ने आणखी एक Erdős समस्या सोडवल्यानंतर Anthropic ने एक test setup तयार केला. या प्रणालीत Mythos access असलेली isolated Claude Code instances होती, ज्यांना समस्या देण्यात आली, त्यांनी solution paths शोधले, आणि नंतर संक्षिप्त निष्कर्ष इतर स्वतंत्रपणे काम करणाऱ्या instances कडे पाठवले. हा तपशील महत्त्वाचा आहे, कारण तो चर्चेला एका एकमेव prompt पासून agentic workflow कडे वळवतो.

दुसऱ्या शब्दांत सांगायचे तर, हा कथित यश pure one-shot language-model उत्तर म्हणून मांडलेला नाही. तो अधिक coordinated research harness सारखा आहे: अनेक model instances, समस्या विभागणी, summarization, आणि दृष्टिकोनांची पुनरावृत्तीने तुलना. त्यामुळे हा निकाल नीटस demo पेक्षा प्रत्यक्षात AI-सहाय्यित गणितीय काम कसे पुढे जाऊ शकते याचा एक पूर्वावलोकन ठरतो.

स्रोत असेही सांगतो की Mythos ने अनेकदा OpenAI च्या model पेक्षा वेगळा मार्ग घेतला. हे खरे असल्यास, ते फक्त पुनरावृत्तीपेक्षा अधिक रंजक काहीतरी सूचित करते. स्वतंत्र समाधान रणनीती, केवळ आधीपासून ज्ञात reasoning line ची नक्कल करण्यापेक्षा, खऱ्या संशोधन मूल्यास अधिक जवळ असतात.

A Gatik autonomous truck at a PepsiCo distribution center.

Gatik ने PepsiCo नेटवर्कमध्ये autonomous freight ची भूमिका वाढवली

PepsiCo ने Gatik सोबतचे काम multi-year deal ने विस्तारले आहे, ज्यामुळे North American food and beverage logistics मध्ये autonomous middle-mile freight अधिक खोलवर पोहोचत आहे.

Read article

ही तुलना का महत्त्वाची आहे

लेखात म्हटले आहे की गणितज्ञ Daniel Litt यांनी Anthropic चा निकाल OpenAI च्या तुलनेत “थोडासा वाईट” असल्याचे कथितपणे म्हटले, पण त्याचबरोबर Mythos ने OpenAI चे समाधानही शोधले असेही सांगितले. हे लक्षात आणून देते की सर्व पुरावे सारखे नसतात. गणितात correctness बरोबरच elegance, संक्षिप्तता, आणि वैचारिक नव्यता यांनाही महत्त्व असते.

तरीसुद्धा, धोरणात्मक निष्कर्ष असा नाही की एका लॅबचा पुरावा दुसऱ्यापेक्षा अधिक सुंदर होता. मुद्दा हा आहे की आता अनेक लॅब्सना वाटते की त्यांची प्रणाली पूर्वीच्या पिढ्यांपेक्षा खूप उच्च पातळीवर open mathematical problems सोबत काम करू शकते. एकदा ते पुनरावृत्तीने शक्य झाले की, सीमारेषा “AI हे करू शकते का?” यापासून “किती वेळा, किती स्वतंत्रपणे, आणि किती मानवी देखरेखीखाली?” याकडे सरकते.

The Decoder असेही नमूद करते की Google DeepMind ने अलीकडेच एक AI-सहाय्यित प्रणाली Lean, एक formal proof language, वापरून नऊ Erdős समस्या सोडवल्याची घोषणा केली. ही तुलना सध्याच्या AI गणित कार्यातील एक महत्त्वाचा फरक स्पष्ट करते. काही प्रणाली formal-verification environments वर मोठ्या प्रमाणावर अवलंबून असतात; इतरांना natural-language reasoning आणि agentic exploration च्या आधारे अधिक तपासले जात आहे. कच्च्या क्षमतेबद्दल कोणती शैली अधिक बोलकी आहे, याबाबत क्षेत्राने अद्याप ठाम निर्णय घेतलेला नाही.

मोठा बदल

ही कथा टिकून राहते ती फक्त विशिष्ट conjecture मुळे नाही. ती पुढील दाव्यांच्या वेगामुळे आहे. गणितातील open problems एकेकाळी मानवी आणि यांत्रिक reasoning यांच्यातील सीमारेषेचे स्पष्ट चिन्ह मानले जात. आता ती सीमारेषा अधिक भेद्य वाटते, विशेषतः जेव्हा लॅब्स frontier models ना orchestration tools सोबत जोडतात, ज्यामुळे त्यांना शाखा काढणे, तुलना करणे, सारांश देणे, आणि पुन्हा प्रयत्न करणे शक्य होते.

कथित lab success आणि स्थिर, व्यापकपणे विश्वासार्ह research system यांच्यात अजूनही मोठा फरक आहे. पडताळणी, peer review, आणि reproducibility अत्यावश्यक आहेत. पण नमुना दुर्लक्ष करणे कठीण आहे: AI लॅब्स आता फक्त benchmark gains किंवा polished consumer assistants सादर करत नाहीत. त्या increasingly त्यांच्या systems ना advanced knowledge work मध्ये योगदान देणारे म्हणून मांडत आहेत.

जर हे दावे पुढेही टिकले, तर AI गणिताच्या बातम्या दुर्मीळ अपवाद राहणार नाहीत आणि त्या स्वतःच एक उदयोन्मुख research category म्हणून दिसू लागतील.

Anthropic कर्मचारी सांगतात की Claude Mythos ने Erdős unit-distance conjecture सोडवली.
अहवालित setup मध्ये साध्या one-shot prompt ऐवजी अनेक coordinated Claude Code instances वापरल्या गेल्या.
मुख्य बदल म्हणजे isolated benchmark विजयांपासून research-style math exploration मध्ये AI systems वापरण्याकडे होणारी वाटचाल.

हा लेख The Decoder च्या वार्तांकनावर आधारित आहे. मूळ लेख वाचा.

Google आणि OpenAI यांनी चीनशी संबंधित वेगवेगळ्या AI गैरवापर मोहिमा उघड केल्या

Google ने कथित AI-सक्षम फसवणूक नेटवर्कवर खटला दाखल केला, तर OpenAI ने सांगितले की त्यांनी US चर्चांवर आणि पायाभूत सुविधांच्या कथनांवर लक्ष ठेवणारे चीनशी संबंधित दोन प्रभाव क्लस्टर्स खंडित केले.

Read article

Originally published on the-decoder.com

Anthropic चे Claude Mythos हे एका महत्त्वाच्या Erdős समस्येला भिडणारे नवे AI असल्याचे सांगितले जात आहे