गणित उन्नत AI की परीक्षा-भूमि बनता जा रहा है
OpenAI के शोधकर्ता Sebastian Bubeck और Ernest Ryu यह स्पष्ट तर्क दे रहे हैं कि कृत्रिम सामान्य बुद्धिमत्ता की बहस के केंद्र में अब गणित क्यों है। हाल ही में OpenAI Podcast की एक चर्चा, जिसे The Decoder ने रिपोर्ट किया, में दोनों शोधकर्ताओं ने गणित को केवल भाषा मॉडलों के लिए एक कठिन क्षेत्र नहीं माना। उन्होंने इसे उन व्यापक क्षमताओं के लिए एक संक्षिप्त तनाव-परीक्षण के रूप में प्रस्तुत किया, जिनकी किसी सामान्य रूप से बुद्धिमान प्रणाली को आवश्यकता होगी।
यह तर्क स्वयं गणितीय कार्य की प्रकृति पर आधारित है। प्रमाणों के लिए लंबे, आंतरिक रूप से सुसंगत तर्क की आवश्यकता होती है, जो अक्सर लंबे समय तक बनाए रखना पड़ता है। एक भी गलती पूरे विचार-क्रम को अमान्य कर सकती है। उस अर्थ में, गणित केवल एक और बेंचमार्क नहीं है। यह एक ऐसा क्षेत्र है जहाँ सफलता fluency से नहीं, बल्कि विश्वसनीयता, आत्म-सुधार और दृढ़ता से तय होती है।
मॉडल क्षमता में तेज़ बदलाव
Bubeck ने कहा कि बदलाव की गति चौंकाने वाली रही है। उन्होंने याद किया कि सिर्फ चार साल पहले उन्हें Google के Minerva मॉडल द्वारा coordinate system में points के माध्यम से एक रेखा खींचना प्रभावशाली लगा था। दो साल पहले, reasoning-focused मॉडल आज जिस रूप में क्षेत्र को आगे बढ़ा रहे हैं, उस रूप में मौजूद नहीं थे। आज, उन्होंने कहा, ये प्रणालियाँ शीर्ष स्तर के गणितज्ञों, यहाँ तक कि Fields Medal विजेताओं, की दैनिक कामकाजी ज़िंदगी में मदद कर रही हैं।
यह प्रगति इसलिए मायने रखती है क्योंकि गणित को लंबे समय से AI के लिए सबसे कठिन क्षेत्रों में से एक माना गया है। Bubeck के अनुसार, 18 महीने पहले एक सम्मेलन में अधिकांश गणितज्ञ अब भी मानते थे कि बड़े पैमाने पर बढ़ाए गए large language models खुले शोध प्रश्नों में मदद नहीं कर पाएँगे। इसलिए संदेह से व्यावहारिक उपयोग तक का सफर बहुत संकुचित समयावधि में हुआ है।
सहायक से शोध साझेदार तक
Ryu ने इस बदलाव का एक ठोस उदाहरण दिया। UCLA के पूर्व गणित प्रोफेसर ने कहा कि उन्होंने optimization theory में Nesterov’s method से जुड़े 42 साल पुराने एक खुले प्रश्न को ChatGPT की मदद से तीन शामों में, कुल लगभग 12 घंटे में, हल किया। मॉडल का उपयोग करने से पहले वे 40 घंटे से अधिक समय तक प्रयास कर चुके थे, लेकिन समाधान नहीं मिला था।
उनकी कहानी इस बात के लिए उल्लेखनीय है कि वह काम की भूमिका-विभाजन के बारे में क्या बताती है। Ryu ने मॉडल को सर्वज्ञ oracles की तरह नहीं बताया। वे एक verifier की तरह काम कर रहे थे, गलतियाँ पकड़ रहे थे और संवाद को अधिक संभावनाशील दिशाओं में मोड़ रहे थे। यह framing महत्वपूर्ण है। इस कहानी में सिस्टम का मूल्य अन्वेषण को तेज़ करने और उपयोगी दिशा सुझाने में है, जबकि सत्यापन की ज़िम्मेदारी मनुष्य पर बनी रहती है।
गणित AGI बहस में क्यों फिट बैठता है
Bubeck का व्यापक दावा है कि गणित AGI के लिए एक अच्छा मानदंड है क्योंकि यह वही तत्व माँगता है, जो अन्य कठिन वैज्ञानिक और तकनीकी क्षेत्रों में भी चाहिए। जो प्रणाली लंबा प्रमाण संभाल सकती है, उसे ध्यान बनाए रखना, आंतरिक सुसंगतता रखना, त्रुटियों का पता लगाना और अपनी reasoning को सुधारना आना चाहिए। ये स्थानांतरणीय क्षमताएँ हैं, केवल गणित-विशिष्ट trick नहीं।
उन्होंने गणितीय प्रशिक्षण की तुलना मानवीय शिक्षा से भी की। छात्रों को गणित केवल इसलिए नहीं पढ़ाया जाता कि वे सभी professional mathematician बनेंगे, बल्कि इसलिए कि यह अनुशासित सोच का एक रूप विकसित करता है। उसी तरह, मॉडलों को गणित पर प्रशिक्षित करना ऐसी reasoning habits पैदा कर सकता है, जो biology और materials science जैसे क्षेत्रों में भी काम आएँ।
गणित का एक और लाभ यह है कि मूल्यांकन असाधारण रूप से स्पष्ट है। समस्याएँ आम तौर पर अच्छी तरह परिभाषित होती हैं, और उत्तर जाँचे जा सकते हैं। ऐसे क्षेत्र में, जहाँ fuzzy benchmarks और विवादित दावों की भरमार है, यह प्रगति मापने के लिए अपेक्षाकृत साफ़ वातावरण देता है।
“AGI time” का विचार
Bubeck ने जिन अधिक दिलचस्प विचारों में से एक पेश किया, उसे उन्होंने “AGI time” कहा। इस शब्द का उपयोग उन्होंने यह बताने के लिए किया कि कोई मॉडल समेकित सोच की समकक्ष धारा को कितनी देर तक प्रभावी ढंग से बनाए रख सकता है। दो साल पहले, उन्होंने कहा, प्रणालियाँ इस तरह की सोच को मिनटों तक simulate कर सकती थीं। अब वे इसे दिनों या एक हफ्ते तक कर सकती हैं। अगला लक्ष्य इस सीमा को हफ्तों और महीनों तक बढ़ाना है।
यह एक उपयोगी framing है, क्योंकि यह बहस को एक बार के benchmark scores से हटाकर endurance की ओर ले जाती है। यदि भविष्य की प्रणालियों से automated researchers की तरह काम करने की उम्मीद है, तो उन्हें केवल अलग-अलग कार्य हल करने के बजाय लंबे समय तक उत्पादक रहना होगा। इसलिए “AGI time” बढ़ाना केवल एक slogan नहीं है। यह एक ठोस विकास लक्ष्य की ओर इशारा करता है।
स्वचालित शोधकर्ता की महत्वाकांक्षा
शोधकर्ताओं ने कहा कि OpenAI एक “automated researcher” बना रहा है, जो लंबे समय तक कुछ स्वतंत्रता के साथ समस्याओं पर काम कर सके। उन्होंने यह भी कहा कि आधारभूत प्रशिक्षण विधियाँ केवल गणित तक सीमित नहीं, बल्कि सामान्य हैं। यदि यह सही है, तो गणित में पहले दिखने वाली उपलब्धियाँ अंततः अन्य वैज्ञानिक क्षेत्रों में भी फैल सकती हैं।
इसका मतलब यह नहीं कि रास्ता तय हो चुका है। यह बहस जारी रहेगी कि गणितीय प्रगति वास्तव में क्या सिद्ध करती है, खासकर प्रसिद्ध खुले प्रश्नों और इस बात पर कि वर्तमान प्रणालियों को अभी भी कितना मानवीय scaffolding चाहिए। लेकिन चर्चा अब स्पष्ट रूप से केवल अंकगणित या प्रतियोगिता-शैली की नवीनता से आगे बढ़ चुकी है। उभरता हुआ प्रश्न यह है कि क्या AI उस तरह के विस्तारित reasoning work में भरोसेमंद बन सकता है, जिसकी गंभीर शोध को आवश्यकता होती है।
यदि गणित उस संक्रमण की परीक्षा-भूमि है, तो Bubeck और Ryu का तर्क सीधा है: व्यापक मशीन बुद्धिमत्ता तक पहुँचने का रास्ता मानवों द्वारा विकसित अनुशासित सोच के सबसे कठिन रूप से होकर गुजर सकता है।
यह लेख The Decoder की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.
Originally published on the-decoder.com


