एक और कथित AI गणितीय सफलता तेज़ी से सामने आती है
फ्रंटियर AI गणित में प्रतिस्पर्धात्मक चक्र तेज़ हो रहा है। ठीक OpenAI द्वारा कथित तौर पर Erdős unit-distance conjecture को खारिज करने के बाद, The Decoder के अनुसार, Anthropic के कर्मचारी अब कह रहे हैं कि Claude Mythos भी उसी समस्या को हल कर सकता है।
यह दावा अभी भी केवल वही है: Anthropic कर्मियों द्वारा वर्णित और X पर सार्वजनिक रूप से चर्चा किया गया एक रिपोर्टेड परिणाम। यह महत्वपूर्ण है, क्योंकि यह कहानी को उन्नत AI शोध में तेजी से सामान्य हो रही एक श्रेणी में रखता है: सार्थक तकनीकी प्रगति पहले लैबों, इंजीनियरों और काम करने वाले गणितज्ञों के बीच प्रसारित होती है, और बाद में कोई औपचारिक संस्थागत पत्र या व्यापक स्वतंत्र सत्यापन प्रश्न को निर्णायक रूप से सुलझाता है।
इस सावधानी के बावजूद, रिपोर्ट की गई प्रगति महत्वपूर्ण है। Erdős unit-distance conjecture 1946 से खुली हुई है। यदि कई फ्रंटियर सिस्टम अब किसी लंबे समय से लंबित संयोजनात्मक-जीमिति समस्या के लिए व्यवहार्य समाधान-पथ खोज सकते हैं, तो संबंधित कहानी अब केवल एक सुर्खी बटोरने वाला प्रमाण नहीं रह जाती। यह इस संभावना की ओर इशारा करती है कि उन्नत मॉडल कठिन शोध समस्याओं पर दोहराने योग्य मूल्य दिखाना शुरू कर रहे हैं।
Anthropic ने कथित तौर पर क्या किया
स्रोत-पाठ के अनुसार, Anthropic ने एक ऐसा परीक्षण सेटअप इस्तेमाल किया जो AI द्वारा एक और Erdős समस्या हल करने के बाद बनाया गया था। इस प्रणाली में पृथक Claude Code इंस्टेंस शामिल थे, जिनके पास Mythos की पहुँच थी; उन्हें समस्या दी गई, समाधान-पथों का अन्वेषण कराया गया, और फिर सारांशित निष्कर्ष अन्य स्वतंत्र रूप से काम कर रहे इंस्टेंसों को दिए गए। यह विवरण महत्वपूर्ण है क्योंकि यह चर्चा को एकल प्रॉम्प्ट से हटाकर एक एजेंटिक वर्कफ़्लो की ओर ले जाता है।
दूसरे शब्दों में, रिपोर्ट की गई उपलब्धि को शुद्ध एक-शॉट भाषा-मॉडल उत्तर के रूप में नहीं प्रस्तुत किया जा रहा है। यह अधिक एक समन्वित शोध-ढाँचे जैसा है: मॉडल के कई इंस्टेंस, समस्या-विभाजन, सारांशण, और दृष्टिकोणों की पुनरावृत्त तुलना। इससे परिणाम कम एक साफ-सुथरा डेमो और अधिक एक पूर्वावलोकन बन जाता है कि AI-सहायता प्राप्त गणितीय कार्य वास्तव में कैसे आगे बढ़ सकता है।
स्रोत यह भी कहता है कि Mythos अक्सर OpenAI के मॉडल से अलग रास्ता अपनाता था। यदि यह सही है, तो यह केवल दोहराव से अधिक रोचक बात का संकेत है। स्वतंत्र समाधान-रणनीतियाँ किसी ज्ञात तर्क-शृंखला को बस दोहराने की तुलना में वास्तविक शोध-मूल्य के अधिक करीब होती हैं।
तुलना क्यों मायने रखती है
लेख में कहा गया है कि गणितज्ञ Daniel Litt ने कथित तौर पर Anthropic के परिणाम को OpenAI के परिणाम से “थोड़ा खराब” कहा, जबकि यह भी कहा कि Mythos ने OpenAI का समाधान भी खोज लिया। यह याद दिलाने वाला उपयोगी बिंदु है कि सभी प्रमाण समान नहीं होते। गणित में शुद्धता के साथ-साथ सुंदरता, संक्षिप्तता और वैचारिक नवीनता भी मायने रखती है।
फिर भी, रणनीतिक निष्कर्ष यह नहीं है कि एक लैब का प्रमाण दूसरे से अधिक सुंदर था। मुद्दा यह है कि अब कई लैबों को लग रहा है कि उनके सिस्टम पिछली पीढ़ियों की तुलना में कहीं उच्च स्तर पर खुली गणितीय समस्याओं से निपट सकते हैं। एक बार यह दोहराने योग्य हो जाए, तो सीमा “क्या AI यह कर सकता है?” से हटकर “कितनी बार, कितनी स्वतंत्रता से, और किस स्तर की मानव निगरानी के साथ?” हो जाती है।
The Decoder यह भी बताता है कि Google DeepMind ने हाल ही में घोषणा की कि एक AI-सहायता प्राप्त प्रणाली ने Lean, एक औपचारिक प्रमाण-भाषा, का उपयोग करके नौ Erdős समस्याएँ हल कीं। यह तुलना वर्तमान AI गणित कार्य में एक महत्वपूर्ण अंतर को और स्पष्ट करती है। कुछ प्रणालियाँ औपचारिक-सत्यापन वातावरणों पर भारी निर्भर करती हैं; अन्य को अधिकतर प्राकृतिक-भाषा तर्क और एजेंटिक अन्वेषण के आधार पर आंका जा रहा है। क्षेत्र ने अभी तक यह तय नहीं किया है कि कौन-सी शैली कच्ची क्षमता को अधिक स्पष्ट रूप से दर्शाती है।
बड़ा परिवर्तन
इस कहानी को टिकाऊ बनाने वाली बात केवल विशेष अनुमान नहीं है। यह उसके बाद आने वाले दावों की गति है। गणित में खुले प्रश्न कभी मानव और मशीन तर्क के बीच की सीमा को चिह्नित करने वाले साफ संकेतक हुआ करते थे। अब वह सीमा अधिक पारगम्य दिखती है, खासकर तब जब लैबें फ्रंटियर मॉडलों को ऐसे ऑर्केस्ट्रेशन टूल्स के साथ जोड़ती हैं जो उन्हें शाखित होने, तुलना करने, सारांशित करने और फिर से प्रयास करने देते हैं।
एक रिपोर्टेड लैब सफलता और एक स्थिर, व्यापक रूप से विश्वसनीय शोध प्रणाली के बीच अभी भी बड़ा अंतर है। सत्यापन, सहकर्मी-समीक्षा, और पुनरुत्पादकता आवश्यक बने रहते हैं। लेकिन पैटर्न को नज़रअंदाज़ करना कठिन है: AI लैब अब केवल बेंचमार्क लाभ या परिष्कृत उपभोक्ता सहायक ही नहीं दिखा रही हैं। वे increasingly उन्नत ज्ञान-कार्य में योगदान देने वाली प्रणालियों के रूप में प्रस्तुत की जा रही हैं।
यदि ये दावे टिके रहते हैं, तो AI गणित सुर्खियाँ दुर्लभ अपवाद नहीं रहेंगी और एक उभरती हुई शोध-श्रेणी की तरह दिखने लगेंगी।
- Anthropic के कर्मचारियों का कहना है कि Claude Mythos Erdős unit-distance conjecture हल कर सकता है।
- रिपोर्ट किया गया सेटअप एक साधारण एक-शॉट प्रॉम्प्ट के बजाय कई Claude Code इंस्टेंसों का उपयोग करता था।
- बड़ा बदलाव लंबे समय से खुले गणितीय प्रश्नों पर AI-सहायता प्राप्त शोध कार्य की तेज़ गति है।
यह लेख The Decoder की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.
Originally published on the-decoder.com


