Claude Mythos ने कथित तौर पर एक महत्वपूर्ण Erdős समस्या हल की

एक और कथित AI गणितीय सफलता तेज़ी से सामने आती है

फ्रंटियर AI गणित में प्रतिस्पर्धात्मक चक्र तेज़ हो रहा है। ठीक OpenAI द्वारा कथित तौर पर Erdős unit-distance conjecture को खारिज करने के बाद, The Decoder के अनुसार, Anthropic के कर्मचारी अब कह रहे हैं कि Claude Mythos भी उसी समस्या को हल कर सकता है।

यह दावा अभी भी केवल वही है: Anthropic कर्मियों द्वारा वर्णित और X पर सार्वजनिक रूप से चर्चा किया गया एक रिपोर्टेड परिणाम। यह महत्वपूर्ण है, क्योंकि यह कहानी को उन्नत AI शोध में तेजी से सामान्य हो रही एक श्रेणी में रखता है: सार्थक तकनीकी प्रगति पहले लैबों, इंजीनियरों और काम करने वाले गणितज्ञों के बीच प्रसारित होती है, और बाद में कोई औपचारिक संस्थागत पत्र या व्यापक स्वतंत्र सत्यापन प्रश्न को निर्णायक रूप से सुलझाता है।

इस सावधानी के बावजूद, रिपोर्ट की गई प्रगति महत्वपूर्ण है। Erdős unit-distance conjecture 1946 से खुली हुई है। यदि कई फ्रंटियर सिस्टम अब किसी लंबे समय से लंबित संयोजनात्मक-जीमिति समस्या के लिए व्यवहार्य समाधान-पथ खोज सकते हैं, तो संबंधित कहानी अब केवल एक सुर्खी बटोरने वाला प्रमाण नहीं रह जाती। यह इस संभावना की ओर इशारा करती है कि उन्नत मॉडल कठिन शोध समस्याओं पर दोहराने योग्य मूल्य दिखाना शुरू कर रहे हैं।

Anthropic ने कथित तौर पर क्या किया

स्रोत-पाठ के अनुसार, Anthropic ने एक ऐसा परीक्षण सेटअप इस्तेमाल किया जो AI द्वारा एक और Erdős समस्या हल करने के बाद बनाया गया था। इस प्रणाली में पृथक Claude Code इंस्टेंस शामिल थे, जिनके पास Mythos की पहुँच थी; उन्हें समस्या दी गई, समाधान-पथों का अन्वेषण कराया गया, और फिर सारांशित निष्कर्ष अन्य स्वतंत्र रूप से काम कर रहे इंस्टेंसों को दिए गए। यह विवरण महत्वपूर्ण है क्योंकि यह चर्चा को एकल प्रॉम्प्ट से हटाकर एक एजेंटिक वर्कफ़्लो की ओर ले जाता है।

दूसरे शब्दों में, रिपोर्ट की गई उपलब्धि को शुद्ध एक-शॉट भाषा-मॉडल उत्तर के रूप में नहीं प्रस्तुत किया जा रहा है। यह अधिक एक समन्वित शोध-ढाँचे जैसा है: मॉडल के कई इंस्टेंस, समस्या-विभाजन, सारांशण, और दृष्टिकोणों की पुनरावृत्त तुलना। इससे परिणाम कम एक साफ-सुथरा डेमो और अधिक एक पूर्वावलोकन बन जाता है कि AI-सहायता प्राप्त गणितीय कार्य वास्तव में कैसे आगे बढ़ सकता है।

स्रोत यह भी कहता है कि Mythos अक्सर OpenAI के मॉडल से अलग रास्ता अपनाता था। यदि यह सही है, तो यह केवल दोहराव से अधिक रोचक बात का संकेत है। स्वतंत्र समाधान-रणनीतियाँ किसी ज्ञात तर्क-शृंखला को बस दोहराने की तुलना में वास्तविक शोध-मूल्य के अधिक करीब होती हैं।

A Gatik autonomous truck at a PepsiCo distribution center.

Gatik ने PepsiCo नेटवर्क में autonomous freight की भूमिका बढ़ाई

PepsiCo ने Gatik के साथ अपने काम को एक multi-year deal में विस्तारित किया है, जिससे North American food and beverage logistics में autonomous middle-mile freight और गहराई से जुड़ गया है।

Read article

तुलना क्यों मायने रखती है

लेख में कहा गया है कि गणितज्ञ Daniel Litt ने कथित तौर पर Anthropic के परिणाम को OpenAI के परिणाम से “थोड़ा खराब” कहा, जबकि यह भी कहा कि Mythos ने OpenAI का समाधान भी खोज लिया। यह याद दिलाने वाला उपयोगी बिंदु है कि सभी प्रमाण समान नहीं होते। गणित में शुद्धता के साथ-साथ सुंदरता, संक्षिप्तता और वैचारिक नवीनता भी मायने रखती है।

फिर भी, रणनीतिक निष्कर्ष यह नहीं है कि एक लैब का प्रमाण दूसरे से अधिक सुंदर था। मुद्दा यह है कि अब कई लैबों को लग रहा है कि उनके सिस्टम पिछली पीढ़ियों की तुलना में कहीं उच्च स्तर पर खुली गणितीय समस्याओं से निपट सकते हैं। एक बार यह दोहराने योग्य हो जाए, तो सीमा “क्या AI यह कर सकता है?” से हटकर “कितनी बार, कितनी स्वतंत्रता से, और किस स्तर की मानव निगरानी के साथ?” हो जाती है।

The Decoder यह भी बताता है कि Google DeepMind ने हाल ही में घोषणा की कि एक AI-सहायता प्राप्त प्रणाली ने Lean, एक औपचारिक प्रमाण-भाषा, का उपयोग करके नौ Erdős समस्याएँ हल कीं। यह तुलना वर्तमान AI गणित कार्य में एक महत्वपूर्ण अंतर को और स्पष्ट करती है। कुछ प्रणालियाँ औपचारिक-सत्यापन वातावरणों पर भारी निर्भर करती हैं; अन्य को अधिकतर प्राकृतिक-भाषा तर्क और एजेंटिक अन्वेषण के आधार पर आंका जा रहा है। क्षेत्र ने अभी तक यह तय नहीं किया है कि कौन-सी शैली कच्ची क्षमता को अधिक स्पष्ट रूप से दर्शाती है।

बड़ा परिवर्तन

इस कहानी को टिकाऊ बनाने वाली बात केवल विशेष अनुमान नहीं है। यह उसके बाद आने वाले दावों की गति है। गणित में खुले प्रश्न कभी मानव और मशीन तर्क के बीच की सीमा को चिह्नित करने वाले साफ संकेतक हुआ करते थे। अब वह सीमा अधिक पारगम्य दिखती है, खासकर तब जब लैबें फ्रंटियर मॉडलों को ऐसे ऑर्केस्ट्रेशन टूल्स के साथ जोड़ती हैं जो उन्हें शाखित होने, तुलना करने, सारांशित करने और फिर से प्रयास करने देते हैं।

एक रिपोर्टेड लैब सफलता और एक स्थिर, व्यापक रूप से विश्वसनीय शोध प्रणाली के बीच अभी भी बड़ा अंतर है। सत्यापन, सहकर्मी-समीक्षा, और पुनरुत्पादकता आवश्यक बने रहते हैं। लेकिन पैटर्न को नज़रअंदाज़ करना कठिन है: AI लैब अब केवल बेंचमार्क लाभ या परिष्कृत उपभोक्ता सहायक ही नहीं दिखा रही हैं। वे increasingly उन्नत ज्ञान-कार्य में योगदान देने वाली प्रणालियों के रूप में प्रस्तुत की जा रही हैं।

यदि ये दावे टिके रहते हैं, तो AI गणित सुर्खियाँ दुर्लभ अपवाद नहीं रहेंगी और एक उभरती हुई शोध-श्रेणी की तरह दिखने लगेंगी।

Anthropic के कर्मचारियों का कहना है कि Claude Mythos Erdős unit-distance conjecture हल कर सकता है।
रिपोर्ट किया गया सेटअप एक साधारण एक-शॉट प्रॉम्प्ट के बजाय कई Claude Code इंस्टेंसों का उपयोग करता था।
बड़ा बदलाव लंबे समय से खुले गणितीय प्रश्नों पर AI-सहायता प्राप्त शोध कार्य की तेज़ गति है।

यह लेख The Decoder की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Anthropic ने बाध्यकारी ऑडिट की मांग की, क्योंकि वह AI को रणनीतिक अवसंरचना के रूप में फिर से परिभाषित कर रही है

Anthropic के CEO Dario Amodei का कहना है कि पारदर्शिता के नियम अब पर्याप्त नहीं हैं और वह अग्रणी AI प्रणालियों के लिए अनिवार्य तृतीय-पक्ष ऑडिट की मांग कर रहे हैं।

Read article

Originally published on the-decoder.com

Anthropic का Claude Mythos कथित तौर पर एक महत्वपूर्ण Erdős समस्या हल करने वाला नवीनतम AI है