ఓపెన్‌ఏఐ పరిశోధకుల ప్రకారం గణితమే AGIకి దారి

అధునాతన AI కోసం గణితం ఒక పరీక్షా భూమిగా మారుతోంది

ఓపెన్‌ఏఐ పరిశోధకులు సెబాస్టియన్ బ్యూబెక్ మరియు ఎర్నెస్ట్ ర్యూ, కృత్రిమ సాధారణ మేధస్సు చర్చలో గణితం కేంద్రంలోకి ఎందుకు వచ్చిందో స్పష్టంగా వివరించారు. The Decoder పేర్కొన్న తాజా ఓపెన్‌ఏఐ పాడ్‌కాస్ట్ చర్చలో, ఈ ఇద్దరు పరిశోధకులు గణితాన్ని భాషా మోడళ్లకు కఠినమైన రంగంగా మాత్రమే చూడలేదు. సాధారణ మేధస్సు గల ఒక వ్యవస్థకు అవసరమైన విస్తృత సామర్థ్యాలకు ఇది ఒక సంక్షిప్త ఒత్తిడి పరీక్ష అని వారు పేర్కొన్నారు.

ఈ వాదన గణిత పని స్వభావంపైనే ఆధారపడింది. నిరూపణలకు దీర్ఘమైన, అంతర్గతంగా సुसంగతమైన తార్కిక శ్రేణులు అవసరం, అవి తరచుగా పొడవైన కాలం కొనసాగాలి. ఒకే ఒక పొరపాటు మొత్తం ఆలోచనా శ్రేణినే అమాన్యం చేయగలదు. ఆ అర్థంలో, గణితం కేవలం మరో benchmark కాదు. అది fluency కంటే విశ్వసనీయత, స్వీయ సవరణ, మరియు పట్టుదలపై విజయం ఆధారపడే రంగం.

మోడల్ సామర్థ్యంలో వేగవంతమైన మార్పు

మార్పు వేగం ఆశ్చర్యకరంగా ఉందని బ్యూబెక్ చెప్పారు. నాలుగు సంవత్సరాల క్రితం Google యొక్క Minerva మోడల్ coordinate systemలో points గుండా ఒక గీత గీయగలగడం తనకు ఆకట్టుకున్న విషయమని ఆయన గుర్తు చేసుకున్నారు. రెండు సంవత్సరాల క్రితం, reasoning-focused మోడళ్లు ఇప్పటిలా రంగాన్ని ముందుకు నడిపే రూపంలో లేవు. ఇప్పుడు, ఈ వ్యవస్థలు Fields Medal విజేతలు సహా అత్యున్నత స్థాయి గణిత శాస్త్రవేత్తల రోజువారీ పనిలో సహాయపడుతున్నాయని ఆయన చెప్పారు.

ఈ పురోగతి ప్రాముఖ్యమైంది, ఎందుకంటే గణితం AIకి కఠినమైన రంగాల్లో ఒకటిగా చాలా కాలంగా పరిగణించబడుతోంది. బ్యూబెక్ ప్రకారం, 18 నెలల క్రితం ఒక కాన్ఫరెన్స్‌లో ఎక్కువమంది గణిత శాస్త్రవేత్తలు పెద్ద large language models ప్రామాణిక పరిశోధనా సమస్యలను తెరచడంలో సహాయపడలేవని భావించారు. కాబట్టి అనుమానం నుంచి ప్రాయోగిక వినియోగానికి మార్పు సంకుచిత కాలవ్యవధిలోనే జరిగింది.

A Gatik autonomous truck at a PepsiCo distribution center.

Gatik PepsiCo నెట్‌వర్క్‌లో autonomous freight పాత్రను లోతుగా పెంచుతోంది

PepsiCo, Gatikతో తన పనిని multi-year deal ద్వారా విస్తరించింది; ఇది North American food and beverage logisticsలో autonomous middle-mile freightను మరింత లోతుగా తీసుకెళ్తోంది.

Read article

సహాయకుడి నుంచి పరిశోధనా భాగస్వామిగా

ర్యూ ఈ మార్పుకు ఒక స్పష్టమైన ఉదాహరణ ఇచ్చారు. UCLAలో మాజీ గణిత ప్రొఫెసర్ అయిన ఆయన, optimization theoryలో Nesterov’s method‌కు సంబంధించిన 42 ఏళ్ల పాత ఓపెన్ సమస్యను ChatGPT సహాయంతో మూడు సాయంత్రాల్లో, మొత్తం సుమారు 12 గంటల్లో పరిష్కరించినట్లు చెప్పారు. మోడల్‌ను ఉపయోగించే ముందు ఆయన ఇప్పటికే 40 గంటలకుపైగా సమయం వెచ్చించినా, పరిష్కారం రాలేదు.

పని విభజన గురించి ఆయన చెప్పింది ముఖ్యమైనది. ర్యూ మోడల్‌ను తప్పులేని oracleలా వివరించలేదు. ఆయన verifierలా పని చేశారు, పొరపాట్లు గుర్తించి, సంభాషణను మరింత ఆశాజనకమైన దిశలవైపు మళ్లించారు. ఈ framing ముఖ్యమైనది. ఈ వివరణలో వ్యవస్థ విలువ అన్వేషణను వేగవంతం చేయడం, ఉపయోగకరమైన మార్గాలను సూచించడం; ధృవీకరణ బాధ్యత మాత్రం మానవుడిపైనే ఉంటుంది.

AGI చర్చలో గణితం ఎందుకు సరిపోతుంది

బ్యూబెక్ చెప్పిన విస్తృతమైన వాదన ఏమిటంటే, గణితం AGI benchmark‌గా పనిచేస్తుంది, ఎందుకంటే అది ఇతర కఠిన శాస్త్రీయ, సాంకేతిక రంగాలకు అవసరమైన అదే అంశాలను కోరుతుంది. దీర్ఘ నిరూపణను నిలుపుకోగల వ్యవస్థ దృష్టిని కొనసాగించగలగాలి, అంతర్గత సुसంగతతను కాపాడగలగాలి, పొరపాట్లను గుర్తించగలగాలి, మరియు తన తర్కాన్ని సవరించగలగాలి. ఇవి గణితానికే ప్రత్యేకమైన tricks కాదు; ఇతర రంగాలకు మార్పిడి చేయగల సామర్థ్యాలు.

గణిత శిక్షణను ఆయన మానవ విద్యతో కూడా పోల్చారు. విద్యార్థులకు గణితం చదివించడం వాళ్లు అందరూ professional mathematicians అవ్వాలని కాదు, క్రమబద్ధమైన ఆలోచనను నేర్పడానికి. అదే విధంగా, మోడళ్లను గణితంపై శిక్షణ ఇవ్వడం biology మరియు materials science వంటి రంగాలకు ఉపయోగపడే reasoning habits‌ను పెంచవచ్చు.

గణితానికి మరో ప్రయోజనం ఉంది: మూల్యాంకనం అసాధారణంగా స్పష్టంగా ఉంటుంది. సమస్యలు సాధారణంగా బాగా నిర్దిష్టంగా ఉంటాయి, సమాధానాలు తనిఖీ చేయవచ్చు. అస్పష్టమైన benchmarks, వివాదాస్పద వాదనలు నిండిన రంగంలో, ఇది పురోగతిని కొలవడానికి తేటతెల్లమైన వాతావరణాన్ని అందిస్తుంది.

Google మరియు OpenAI చైనాతో సంబంధం ఉన్న వేర్వేరు AI దుర్వినియోగ కార్యకలాపాలను బయటపెట్టాయి

Google ఒక AI-సক্ষম మోసపు నెట్‌వర్క్‌పై దావా వేసింది, అదే సమయంలో US చర్చలు మరియు మౌలిక సదుపాయాల కథనాలను లక్ష్యంగా చేసుకున్న చైనాతో సంబంధం ఉన్న రెండు ప్రభావ క్లస్టర్లను అడ్డుకున్నామని OpenAI తెలిపింది.

Read article

“AGI time” అనే ఆలోచన

బ్యూబెక్ పరిచయం చేసిన ఆసక్తికరమైన భావనలలో ఒకటి “AGI time”. ఒక మోడల్ అనుసంధానమైన ఆలోచనా శ్రేణిని ఎంతసేపు సమర్థవంతంగా కొనసాగించగలదో వివరించడానికి ఆయన ఈ పదాన్ని ఉపయోగించారు. రెండు సంవత్సరాల క్రితం, వ్యవస్థలు ఆ రకమైన ఆలోచనను నిమిషాలపాటు simulate చేయగలిగేవని చెప్పారు. ఇప్పుడు అవి దాన్ని రోజులు లేదా ఒక వారం వరకూ చేయగలవు. తదుపరి లక్ష్యం ఆ పరిధిని వారాలు, నెలల వరకు పెంచడం.

ఇది ఉపయోగకరమైన framing, ఎందుకంటే ఇది చర్చను ఒకసారి వచ్చే benchmark స్కోర్ల నుండి endurance వైపుకు మళ్లిస్తుంది. భవిష్యత్ వ్యవస్థలు automated researchers‌లా పనిచేయాలంటే, అవి విడి పనులను మాత్రమే పరిష్కరించడం కాకుండా దీర్ఘకాలం ఉత్పాదకంగా ఉండాలి. అందువల్ల “AGI time”ను పెంచడం కేవలం slogan కాదు. అది ఒక స్పష్టమైన అభివృద్ధి లక్ష్యాన్ని సూచిస్తుంది.

ఆటోమేటెడ్ పరిశోధకుడి లక్ష్యం

ఓపెన్‌ఏఐ దీర్ఘకాలం కొంత స్వతంత్రతతో సమస్యలపై పని చేయగల “automated researcher”ని నిర్మిస్తున్నట్లు పరిశోధకులు చెప్పారు. ప్రాథమిక శిక్షణ పద్ధతులు గణితానికే ప్రత్యేకమైనవి కాక, సాధారణమైనవని కూడా వారు అన్నారు. అది నిజమైతే, గణితంలో మొదట కనిపించే పురోగతులు చివరికి ఇతర శాస్త్రీయ రంగాలకు వ్యాప్తి చెందవచ్చు.

అదంతా మార్గం స్థిరపడిపోయిందని అర్థం కాదు. ప్రసిద్ధ ఓపెన్ సమస్యలు, ప్రస్తుతం ఉన్న వ్యవస్థలకు ఇంకా ఎంత మానవ scaffolding అవసరమో అనే విషయాల చుట్టూ, గణిత పురోగతి నిజంగా ఏమి నిరూపిస్తుందన్న చర్చ కొనసాగుతుంది. కానీ చర్చ ఇప్పుడు అంకగణితం లేదా పోటీ-శైలి కొత్తదనాన్ని మించి వెళ్లింది. AI తీవ్ర పరిశోధనకు అవసరమైన విస్తృత reasoning work‌లో నమ్మదగినదిగా మారగలదా అన్నదే ప్రధాన ప్రశ్నగా మారుతోంది.

గణితం ఆ మార్పుకు పరీక్షా భూమి అయితే, బ్యూబెక్ మరియు ర్యూ వాదన సూటిగా ఉంటుంది: విస్తృత యంత్ర మేధస్సుకు మార్గం మనుషులు రూపొందించిన అత్యంత కఠినమైన నియంత్రిత ఆలోచన రూపం గుండా వెళ్లవచ్చు.

ఈ వ్యాసం The Decoder నివేదికపై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.

Originally published on the-decoder.com

ఓపెన్‌ఏఐ పరిశోధకుల దృష్టిలో గణితం సాధారణ మేధస్సుకు ఒక ముఖ్యమైన పరీక్ష ఎందుకు