అధునాతన AI కోసం గణితం ఒక పరీక్షా భూమిగా మారుతోంది
ఓపెన్ఏఐ పరిశోధకులు సెబాస్టియన్ బ్యూబెక్ మరియు ఎర్నెస్ట్ ర్యూ, కృత్రిమ సాధారణ మేధస్సు చర్చలో గణితం కేంద్రంలోకి ఎందుకు వచ్చిందో స్పష్టంగా వివరించారు. The Decoder పేర్కొన్న తాజా ఓపెన్ఏఐ పాడ్కాస్ట్ చర్చలో, ఈ ఇద్దరు పరిశోధకులు గణితాన్ని భాషా మోడళ్లకు కఠినమైన రంగంగా మాత్రమే చూడలేదు. సాధారణ మేధస్సు గల ఒక వ్యవస్థకు అవసరమైన విస్తృత సామర్థ్యాలకు ఇది ఒక సంక్షిప్త ఒత్తిడి పరీక్ష అని వారు పేర్కొన్నారు.
ఈ వాదన గణిత పని స్వభావంపైనే ఆధారపడింది. నిరూపణలకు దీర్ఘమైన, అంతర్గతంగా సुसంగతమైన తార్కిక శ్రేణులు అవసరం, అవి తరచుగా పొడవైన కాలం కొనసాగాలి. ఒకే ఒక పొరపాటు మొత్తం ఆలోచనా శ్రేణినే అమాన్యం చేయగలదు. ఆ అర్థంలో, గణితం కేవలం మరో benchmark కాదు. అది fluency కంటే విశ్వసనీయత, స్వీయ సవరణ, మరియు పట్టుదలపై విజయం ఆధారపడే రంగం.
మోడల్ సామర్థ్యంలో వేగవంతమైన మార్పు
మార్పు వేగం ఆశ్చర్యకరంగా ఉందని బ్యూబెక్ చెప్పారు. నాలుగు సంవత్సరాల క్రితం Google యొక్క Minerva మోడల్ coordinate systemలో points గుండా ఒక గీత గీయగలగడం తనకు ఆకట్టుకున్న విషయమని ఆయన గుర్తు చేసుకున్నారు. రెండు సంవత్సరాల క్రితం, reasoning-focused మోడళ్లు ఇప్పటిలా రంగాన్ని ముందుకు నడిపే రూపంలో లేవు. ఇప్పుడు, ఈ వ్యవస్థలు Fields Medal విజేతలు సహా అత్యున్నత స్థాయి గణిత శాస్త్రవేత్తల రోజువారీ పనిలో సహాయపడుతున్నాయని ఆయన చెప్పారు.
ఈ పురోగతి ప్రాముఖ్యమైంది, ఎందుకంటే గణితం AIకి కఠినమైన రంగాల్లో ఒకటిగా చాలా కాలంగా పరిగణించబడుతోంది. బ్యూబెక్ ప్రకారం, 18 నెలల క్రితం ఒక కాన్ఫరెన్స్లో ఎక్కువమంది గణిత శాస్త్రవేత్తలు పెద్ద large language models ప్రామాణిక పరిశోధనా సమస్యలను తెరచడంలో సహాయపడలేవని భావించారు. కాబట్టి అనుమానం నుంచి ప్రాయోగిక వినియోగానికి మార్పు సంకుచిత కాలవ్యవధిలోనే జరిగింది.
సహాయకుడి నుంచి పరిశోధనా భాగస్వామిగా
ర్యూ ఈ మార్పుకు ఒక స్పష్టమైన ఉదాహరణ ఇచ్చారు. UCLAలో మాజీ గణిత ప్రొఫెసర్ అయిన ఆయన, optimization theoryలో Nesterov’s methodకు సంబంధించిన 42 ఏళ్ల పాత ఓపెన్ సమస్యను ChatGPT సహాయంతో మూడు సాయంత్రాల్లో, మొత్తం సుమారు 12 గంటల్లో పరిష్కరించినట్లు చెప్పారు. మోడల్ను ఉపయోగించే ముందు ఆయన ఇప్పటికే 40 గంటలకుపైగా సమయం వెచ్చించినా, పరిష్కారం రాలేదు.
పని విభజన గురించి ఆయన చెప్పింది ముఖ్యమైనది. ర్యూ మోడల్ను తప్పులేని oracleలా వివరించలేదు. ఆయన verifierలా పని చేశారు, పొరపాట్లు గుర్తించి, సంభాషణను మరింత ఆశాజనకమైన దిశలవైపు మళ్లించారు. ఈ framing ముఖ్యమైనది. ఈ వివరణలో వ్యవస్థ విలువ అన్వేషణను వేగవంతం చేయడం, ఉపయోగకరమైన మార్గాలను సూచించడం; ధృవీకరణ బాధ్యత మాత్రం మానవుడిపైనే ఉంటుంది.
AGI చర్చలో గణితం ఎందుకు సరిపోతుంది
బ్యూబెక్ చెప్పిన విస్తృతమైన వాదన ఏమిటంటే, గణితం AGI benchmarkగా పనిచేస్తుంది, ఎందుకంటే అది ఇతర కఠిన శాస్త్రీయ, సాంకేతిక రంగాలకు అవసరమైన అదే అంశాలను కోరుతుంది. దీర్ఘ నిరూపణను నిలుపుకోగల వ్యవస్థ దృష్టిని కొనసాగించగలగాలి, అంతర్గత సुसంగతతను కాపాడగలగాలి, పొరపాట్లను గుర్తించగలగాలి, మరియు తన తర్కాన్ని సవరించగలగాలి. ఇవి గణితానికే ప్రత్యేకమైన tricks కాదు; ఇతర రంగాలకు మార్పిడి చేయగల సామర్థ్యాలు.
గణిత శిక్షణను ఆయన మానవ విద్యతో కూడా పోల్చారు. విద్యార్థులకు గణితం చదివించడం వాళ్లు అందరూ professional mathematicians అవ్వాలని కాదు, క్రమబద్ధమైన ఆలోచనను నేర్పడానికి. అదే విధంగా, మోడళ్లను గణితంపై శిక్షణ ఇవ్వడం biology మరియు materials science వంటి రంగాలకు ఉపయోగపడే reasoning habitsను పెంచవచ్చు.
గణితానికి మరో ప్రయోజనం ఉంది: మూల్యాంకనం అసాధారణంగా స్పష్టంగా ఉంటుంది. సమస్యలు సాధారణంగా బాగా నిర్దిష్టంగా ఉంటాయి, సమాధానాలు తనిఖీ చేయవచ్చు. అస్పష్టమైన benchmarks, వివాదాస్పద వాదనలు నిండిన రంగంలో, ఇది పురోగతిని కొలవడానికి తేటతెల్లమైన వాతావరణాన్ని అందిస్తుంది.
“AGI time” అనే ఆలోచన
బ్యూబెక్ పరిచయం చేసిన ఆసక్తికరమైన భావనలలో ఒకటి “AGI time”. ఒక మోడల్ అనుసంధానమైన ఆలోచనా శ్రేణిని ఎంతసేపు సమర్థవంతంగా కొనసాగించగలదో వివరించడానికి ఆయన ఈ పదాన్ని ఉపయోగించారు. రెండు సంవత్సరాల క్రితం, వ్యవస్థలు ఆ రకమైన ఆలోచనను నిమిషాలపాటు simulate చేయగలిగేవని చెప్పారు. ఇప్పుడు అవి దాన్ని రోజులు లేదా ఒక వారం వరకూ చేయగలవు. తదుపరి లక్ష్యం ఆ పరిధిని వారాలు, నెలల వరకు పెంచడం.
ఇది ఉపయోగకరమైన framing, ఎందుకంటే ఇది చర్చను ఒకసారి వచ్చే benchmark స్కోర్ల నుండి endurance వైపుకు మళ్లిస్తుంది. భవిష్యత్ వ్యవస్థలు automated researchersలా పనిచేయాలంటే, అవి విడి పనులను మాత్రమే పరిష్కరించడం కాకుండా దీర్ఘకాలం ఉత్పాదకంగా ఉండాలి. అందువల్ల “AGI time”ను పెంచడం కేవలం slogan కాదు. అది ఒక స్పష్టమైన అభివృద్ధి లక్ష్యాన్ని సూచిస్తుంది.
ఆటోమేటెడ్ పరిశోధకుడి లక్ష్యం
ఓపెన్ఏఐ దీర్ఘకాలం కొంత స్వతంత్రతతో సమస్యలపై పని చేయగల “automated researcher”ని నిర్మిస్తున్నట్లు పరిశోధకులు చెప్పారు. ప్రాథమిక శిక్షణ పద్ధతులు గణితానికే ప్రత్యేకమైనవి కాక, సాధారణమైనవని కూడా వారు అన్నారు. అది నిజమైతే, గణితంలో మొదట కనిపించే పురోగతులు చివరికి ఇతర శాస్త్రీయ రంగాలకు వ్యాప్తి చెందవచ్చు.
అదంతా మార్గం స్థిరపడిపోయిందని అర్థం కాదు. ప్రసిద్ధ ఓపెన్ సమస్యలు, ప్రస్తుతం ఉన్న వ్యవస్థలకు ఇంకా ఎంత మానవ scaffolding అవసరమో అనే విషయాల చుట్టూ, గణిత పురోగతి నిజంగా ఏమి నిరూపిస్తుందన్న చర్చ కొనసాగుతుంది. కానీ చర్చ ఇప్పుడు అంకగణితం లేదా పోటీ-శైలి కొత్తదనాన్ని మించి వెళ్లింది. AI తీవ్ర పరిశోధనకు అవసరమైన విస్తృత reasoning workలో నమ్మదగినదిగా మారగలదా అన్నదే ప్రధాన ప్రశ్నగా మారుతోంది.
గణితం ఆ మార్పుకు పరీక్షా భూమి అయితే, బ్యూబెక్ మరియు ర్యూ వాదన సూటిగా ఉంటుంది: విస్తృత యంత్ర మేధస్సుకు మార్గం మనుషులు రూపొందించిన అత్యంత కఠినమైన నియంత్రిత ఆలోచన రూపం గుండా వెళ్లవచ్చు.
ఈ వ్యాసం The Decoder నివేదికపై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.
Originally published on the-decoder.com


