गणित प्रगत AI साठीचा कसोटी-मैदान बनत आहे

ओपनएआय संशोधक Sebastian Bubeck आणि Ernest Ryu कृत्रिम सामान्य बुद्धिमत्तेच्या चर्चेच्या मध्यभागी आता गणित का आले आहे, यासाठी स्पष्ट भूमिका मांडत आहेत. The Decoder ने नोंदवलेल्या अलीकडील OpenAI Podcast चर्चेत, दोन्ही संशोधकांनी गणिताकडे भाषा मॉडेलसाठी फक्त अवघड क्षेत्र म्हणून पाहिले नाही. त्यांनी ते सामान्यतः बुद्धिमान प्रणालीला आवश्यक असलेल्या व्यापक क्षमतांसाठी एक संक्षिप्त stress test म्हणून मांडले.

हा युक्तिवाद गणितीय कामाच्या स्वरूपावर आधारलेला आहे. पुराव्यांसाठी दीर्घ, अंतर्गतदृष्ट्या सुसंगत तर्क आवश्यक असतो, जो अनेकदा दीर्घकाळ टिकवावा लागतो. एकच चूक संपूर्ण विचारसाखळी अमान्य करू शकते. त्या अर्थाने, गणित हा केवळ आणखी एक benchmark नाही. तो असा क्षेत्र आहे जिथे यश fluency पेक्षा विश्वासार्हता, स्वयं-दुरुस्ती आणि चिकाटीवर अवलंबून असते.

मॉडेल क्षमतेत झपाट्याने बदल

Bubeck म्हणाले की बदलाचा वेग आश्चर्यकारक होता. त्यांनी आठवले की फक्त चार वर्षांपूर्वी Google च्या Minerva model ला coordinate system मध्ये points मधून रेषा काढताना पाहून त्यांना आश्चर्य वाटले होते. दोन वर्षांपूर्वी, reasoning-focused models आज ज्या स्वरूपात क्षेत्र पुढे नेत आहेत, त्या स्वरूपात नव्हते. आज, ते Fields Medal विजेत्यांसह उच्चस्तरीय गणितज्ञांच्या दैनंदिन कामात मदत करत आहेत, असे त्यांनी सांगितले.

ही प्रगती महत्त्वाची आहे, कारण गणित दीर्घकाळ AI साठी सर्वात कठीण क्षेत्रांपैकी एक मानले गेले आहे. Bubeck यांच्या मते, 18 महिन्यांपूर्वी एका परिषदेत बहुतेक गणितज्ञांचा विश्वास होता की मोठ्या प्रमाणावर वाढवलेले large language models खुले संशोधन प्रश्न उघडण्यात मदत करू शकणार नाहीत. त्यामुळे संशयापासून व्यावहारिक वापरापर्यंतचा प्रवास अतिशय संकुचित काळात झाला आहे.

सहाय्यकापासून संशोधन भागीदारापर्यंत

Ryu यांनी या बदलाचे एक ठोस उदाहरण दिले. UCLA चे माजी गणित प्राध्यापक म्हणून त्यांनी सांगितले की optimization theory मधील Nesterov’s method संबंधी 42 वर्षे जुने खुले समस्या ChatGPT च्या मदतीने सलग तीन संध्याकाळांत, एकूण सुमारे 12 तासांत सोडवली. मॉडेल वापरण्यापूर्वी त्यांनी 40 तासांहून अधिक वेळ घालवला होता, पण उत्तर मिळाले नव्हते.

त्यांच्या कथनातून कामाच्या विभागणीबद्दल काय समजते, हे लक्षवेधी आहे. Ryu यांनी मॉडेलला त्रुटीमुक्त oracle म्हणून वर्णन केले नाही. त्यांनी verifier ची भूमिका बजावली, चुका पकडल्या आणि संवाद अधिक आशादायक दिशांकडे वळवला. हे framing महत्त्वाचे आहे. या मांडणीत प्रणालीचे मूल्य शोध जलद करणे आणि उपयुक्त दिशा सुचवणे यात आहे, तर पडताळणीची जबाबदारी मानवाकडेच राहते.

AGI च्या चर्चेत गणित का बसते

Bubeck यांचा व्यापक दावा असा आहे की गणित AGI benchmark म्हणून उपयुक्त ठरते, कारण ते इतर कठीण वैज्ञानिक आणि तांत्रिक क्षेत्रांसाठी लागणारेच घटक मागते. दीर्घ पुरावा सांभाळू शकणाऱ्या प्रणालीला लक्ष टिकवता आले पाहिजे, अंतर्गत सुसंगती राखता आली पाहिजे, चुका ओळखता आल्या पाहिजेत, आणि स्वतःचे तर्क सुधारता आले पाहिजेत. या transferable capabilities आहेत, केवळ गणित-विशिष्ट युक्त्या नाहीत.

त्यांनी गणित प्रशिक्षणाची तुलना मानवी शिक्षणाशीही केली. विद्यार्थ्यांना गणित शिकवले जाते ते फक्त ते सर्व professional mathematician बनणार म्हणून नाही, तर शिस्तबद्ध विचारांचा एक प्रकार विकसित करण्यासाठी. त्याचप्रमाणे, मॉडेल्सना गणितावर प्रशिक्षण दिल्यास biology आणि materials science सारख्या क्षेत्रांमध्येही उपयोगी ठरणाऱ्या reasoning habits निर्माण होऊ शकतात.

गणिताचा आणखी एक फायदा म्हणजे मूल्यांकन अपवादात्मकपणे स्पष्ट असते. समस्या सामान्यतः नीट परिभाषित असतात, आणि उत्तरे पडताळता येतात. अस्पष्ट benchmarks आणि वादग्रस्त दाव्यांनी भरलेल्या क्षेत्रात, हे प्रगती मोजण्यासाठी तुलनेने स्वच्छ वातावरण देते.

“AGI time” ही संकल्पना

Bubeck यांनी मांडलेल्या अधिक रंजक संकल्पनांपैकी एक म्हणजे “AGI time”. एखादा model सुसंगत विचारप्रवाह किती वेळ प्रभावीपणे टिकवू शकतो, हे सांगण्यासाठी त्यांनी हा शब्द वापरला. दोन वर्षांपूर्वी, प्रणाली अशा प्रकारचे विचार काही मिनिटेच simulate करू शकत होत्या, असे त्यांनी सांगितले. आता त्या ते दिवस किंवा अगदी आठवडाभर करू शकतात. पुढचे लक्ष्य ही मर्यादा weeks आणि months पर्यंत वाढवणे आहे.

हे उपयुक्त framing आहे, कारण ते चर्चेला एकाच वेळच्या benchmark गुणांपासून endurance कडे वळवते. भविष्यातील प्रणाली automated researchers सारख्या काम करणार असतील, तर त्यांना केवळ वेगवेगळी कामे सोडवून चालणार नाही; त्यांना दीर्घकाळ उत्पादक राहावे लागेल. त्यामुळे “AGI time” वाढवणे हे केवळ slogan नाही. ते एक ठोस विकास लक्ष्य सूचित करते.

स्वयंचलित संशोधकाचे ध्येय

संशोधकांनी सांगितले की OpenAI एक “automated researcher” तयार करत आहे, जो दीर्घ काळ काही प्रमाणात स्वायत्ततेसह समस्यांवर काम करू शकेल. त्यांनी असेही सांगितले की मूलभूत training methods गणितापुरत्या मर्यादित नाहीत; त्या सर्वसाधारण आहेत. ते खरे असल्यास, गणितात प्रथम दिसणारी प्रगती नंतर इतर वैज्ञानिक क्षेत्रांमध्ये पसरू शकते.

याचा अर्थ मार्ग निश्चित झाला आहे असे नाही. प्रसिद्ध open problems आणि सध्याच्या प्रणालींना अजून किती human scaffolding आवश्यक आहे, याबद्दल गणितीय प्रगती नेमके काय सिद्ध करते, यावर चर्चा सुरूच राहील. पण चर्चा आता arithmetic किंवा contest-style noveltyच्या पलीकडे गेली आहे. AI त्या प्रकारच्या विस्तारित reasoning workमध्ये विश्वासार्ह होऊ शकते का, जे गंभीर संशोधनासाठी आवश्यक आहे, हा आता मुख्य प्रश्न आहे.

जर गणित हे त्या संक्रमणाचे test bed असेल, तर Bubeck आणि Ryu यांचा मुद्दा साधा आहे: व्यापक machine intelligence कडे जाणारा मार्ग मानवांनी विकसित केलेल्या शिस्तबद्ध विचारांच्या सर्वात कठीण रूपातून जाऊ शकतो.

हा लेख The Decoder च्या वार्तांकनावर आधारित आहे. मूळ लेख वाचा.

Originally published on the-decoder.com