மேம்பட்ட AI-க்கான சோதனை நிலமாக கணிதம் மாறிக்கொண்டிருக்கிறது
OpenAI ஆராய்ச்சியாளர்கள் Sebastian Bubeck மற்றும் Ernest Ryu, செயற்கை பொது நுண்ணறிவு விவாதத்தின் மையத்துக்கு கணிதம் ஏன் வந்துள்ளது என்பதை தெளிவாக முன்வைக்கின்றனர். The Decoder செய்ததாகக் குறிப்பிட்ட சமீபத்திய OpenAI Podcast உரையாடலில், இருவரும் கணிதத்தை மொழி மாதிரிகளுக்கான கடினமான துறை என மட்டும் பார்க்கவில்லை. பொதுவாக அறிவுள்ள ஒரு அமைப்புக்கு தேவைப்படும் திறன்களைச் சோதிக்கும் சுருக்கமான அழுத்தப் பரிசோதனையாக அதைக் குறித்தனர்.
இந்த வாதம் கணிதப் பணியின் தன்மையில்தான் அடங்கியுள்ளது. சான்றுகளுக்கு நீண்ட, உள் ஒற்றுமையுடைய தர்க்கம் தேவைப்படுகிறது; அது பெரும்பாலும் நீண்ட காலம் நீடிக்க வேண்டும். ஒரு சிறிய தவறே முழு சிந்தனைத் தொடரையும் செல்லாததாக மாற்றிவிடும். அந்த அர்த்தத்தில், கணிதம் வெறும் இன்னொரு benchmark அல்ல. அது வெற்றியை fluency மட்டும் அல்ல, நம்பகத்தன்மை, தன்னிச்சைத் திருத்தம், மற்றும் தொடர்ந்து முயலும் மனப்பாங்கு தீர்மானிக்கும் ஒரு துறை.
மாதிரி திறனில் வேகமான மாற்றம்
Bubeck கூறுவதாவது, மாற்றத்தின் வேகம் அதிர்ச்சி அளிப்பதாக இருந்தது. நான்கு ஆண்டுகளுக்கு முன்பு Google-ன் Minerva மாதிரி coordinate system-இல் points வழியாக ஒரு கோடு இழுப்பதைப் பார்த்தது தன்னுக்கு குறிப்பிடத்தக்கதாக இருந்ததை அவர் நினைவுகூர்ந்தார். இரண்டு ஆண்டுகளுக்கு முன்பு, reasoning-focused மாதிரிகள் இன்று துறையின் முன்னேற்றத்தை இட்டுச் செல்லும் வடிவில் இல்லையே இருந்தன. இன்று, இவை Fields Medal வெற்றியாளர்கள் உட்பட உயர்நிலை கணிதவியலாளர்களின் தினசரி பணிகளில் உதவுகின்றன என்று அவர் சொன்னார்.
கணிதம் நீண்ட காலமாக AI உடைக்க மிகவும் கடினமான துறைகளில் ஒன்றாகக் கருதப்பட்டிருப்பதால் இந்த முன்னேற்றம் முக்கியமானது. Bubeck-ன் கூற்றுப்படி, 18 மாதங்களுக்கு முன் ஒரு மாநாட்டில் பெரும்பாலான கணிதவியலாளர்கள், பெரிய அளவில் விரிவாக்கப்பட்ட large language models திறந்த ஆராய்ச்சி சிக்கல்களில் உதவ முடியாது என்றே நம்பினர். ஆகவே சந்தேகத்திலிருந்து நடைமுறை பயன்பாட்டுக்கான மாற்றம் மிகச் சுருக்கமான காலக்கட்டத்தில் நிகழ்ந்துள்ளது.
உதவியாளரிலிருந்து ஆராய்ச்சி கூட்டாளியாக
இந்த மாற்றத்திற்கு Ryu ஒரு நேரடி உதாரணம் அளித்தார். UCLA-வில் முன்னாள் கணிதப் பேராசிரியராக இருந்த அவர், optimization theory-யில் Nesterov’s method தொடர்பான 42 ஆண்டு பழைய ஒரு திறந்த பிரச்சினையை ChatGPT-யின் உதவியுடன் மூன்று மாலை நேரங்களில், மொத்தம் சுமார் 12 மணி நேரத்தில் தீர்த்ததாக கூறினார். மாதிரியைப் பயன்படுத்துவதற்கு முன் அவர் ஏற்கனவே 40 மணி நேரத்திற்கும் மேலாக முயன்றிருந்தும் தீர்வு கிடைக்கவில்லை.
அவரின் விளக்கம் பணிப் பகிர்வு குறித்து என்ன சொல்கிறது என்பதால் குறிப்பிடத்தக்கது. Ryu மாதிரியை பிழையில்லாத oracle போல விவரிக்கவில்லை. அவர் ஒரு verifier போல செயல்பட்டு, தவறுகளைப் பிடித்து, உரையாடலைச் சாத்தியமுள்ள திசைகளுக்கு வழிநடத்தினார். இந்த framing முக்கியமானது. இந்த விளக்கத்தில் அமைப்பின் மதிப்பு, ஆராய்ச்சியை வேகப்படுத்துவதிலும் பயனுள்ள பாதைகளை முன்மொழிவதிலும் உள்ளது; ஆனால் சரிபார்ப்புக்கு மனிதன் பொறுப்பாக இருக்கிறான்.
AGI விவாதத்தில் கணிதம் ஏன் பொருந்துகிறது
Bubeck-ன் பரந்த கூற்று, கணிதம் AGI benchmark ஆகச் செயல்படுகிறது என்பதே; ஏனெனில் அது பிற கடின அறிவியல் மற்றும் தொழில்நுட்ப துறைகளுக்குத் தேவைப்படும் அதே கூறுகளை வேண்டுகிறது. நீண்ட சான்றைத் தக்கவைக்கக் கூடிய ஒரு அமைப்பு, கவனத்தை நிலைநிறுத்தவும், உள் ஒற்றுமையைப் பேணவும், பிழைகளை கண்டறியவும், தன் தர்க்கத்தைத் திருத்தவும் வேண்டும். இவை கணிதத்துக்கே உரித்தான tricks அல்ல; பிற துறைகளுக்கும் மாற்றப்படக்கூடிய திறன்கள்.
அவர் கணிதப் பயிற்சியை மனிதக் கல்வியுடன் ஒப்பிட்டும் பேசினார். மாணவர்கள் அனைவரும் தொழில்முறை கணிதவியலாளர்களாக மாறப் போவதில்லை என்பதற்காக மட்டுமல்ல, ஒழுங்கான சிந்தனையை வளர்க்கும் ஒரு முறையாகவும் கணிதம் கற்பிக்கப்படுகிறது. அதேபோல், மாதிரிகளை கணிதத்தில் பயிற்றுவிப்பது, biology மற்றும் materials science போன்ற துறைகளிலும் பயன்படும் reasoning habits-ஐ உருவாக்கலாம்.
கணிதத்துக்கு இன்னொரு நன்மை உள்ளது: மதிப்பீடு மிகத் தெளிவானது. பிரச்சினைகள் பொதுவாக நன்றாக வரையறுக்கப்பட்டவை, மற்றும் விடைகள் சரிபார்க்கக்கூடியவை. குழப்பமான benchmarks மற்றும் சர்ச்சைக்குரிய கூற்றுகள் நிறைந்த ஒரு துறையில், இது முன்னேற்றத்தை அளவிட ஒப்பிடுகையில் தூய்மையான சூழலை வழங்குகிறது.
“AGI time” என்ற கருத்து
Bubeck அறிமுகப்படுத்திய சுவாரசியமான கருத்துகளில் ஒன்று “AGI time” ஆகும். ஒரு மாதிரி இணைந்த சிந்தனையின் சமமான தொடரை எவ்வளவு நேரம் பயனுள்ளதாகத் தக்கவைக்க முடியும் என்பதை விளக்க இந்த சொல்லைப் பயன்படுத்தினார். இரண்டு ஆண்டுகளுக்கு முன், மாதிரிகள் அந்த வகை சிந்தனையை சில நிமிடங்களுக்கு மட்டும் simulate செய்ய முடிந்தது என்றார். இப்போது அவை அதை நாட்கள் அல்லது ஒரு வாரம் வரை செய்ய முடிகிறது. அடுத்த இலக்கு அந்த எல்லையை வாரங்களுக்கும் மாதங்களுக்கும் உயர்த்துவதே.
இது பயனுள்ள framing, ஏனெனில் இது விவாதத்தை ஒரு முறைப் பரிசோதனை மதிப்பெண்களிலிருந்து endurance நோக்கி மாற்றுகிறது. எதிர்கால அமைப்புகள் தானியங்கி ஆராய்ச்சியாளர்களாக செயல்பட வேண்டுமெனில், அவை தனித்தனி பணிகளை மட்டும் தீர்ப்பதை விட நீண்ட காலம் பயனுள்ளதாக இருக்க வேண்டும். அதனால் “AGI time”-ஐ நீட்டிப்பது வெறும் slogan அல்ல. அது ஒரு தெளிவான வளர்ச்சி இலக்கைக் குறிக்கிறது.
தானியங்கி ஆராய்ச்சியாளர் நோக்கம்
OpenAI ஒரு “automated researcher” உருவாக்கி வருகிறது, அது நீண்ட காலத்துக்கு ஒரு அளவு சுயாதீனத்துடன் பிரச்சினைகளில் வேலை செய்ய முடியும் என்று ஆராய்ச்சியாளர்கள் கூறினர். அடிப்படை பயிற்சி முறைகள் கணிதத்துக்கே மட்டும் சிறப்பானவை அல்ல, பொதுவானவை என்றும் அவர்கள் சொன்னார்கள். அது உண்மை என்றால், கணிதத்தில் முதலில் காட்டப்படும் முன்னேற்றங்கள் பிற அறிவியல் துறைகளுக்கும் பரவக்கூடும்.
அதனால் பாதை முடிவடைந்துவிட்டது என்று அர்த்தமில்லை. புகழ்பெற்ற திறந்த பிரச்சினைகள் மற்றும் தற்போதைய அமைப்புகளுக்கு இன்னும் எவ்வளவு மனித scaffolding தேவை என்பதைக் குறித்து, கணித முன்னேற்றம் உண்மையில் என்ன நிரூபிக்கிறது என்ற விவாதம் தொடரும். ஆனால் விவாதம் இப்போது கணக்குப்பாடம் அல்லது போட்டி-பாணி புதுமையைத் தாண்டி சென்றுவிட்டது என்பது தெளிவாகிறது. தீவிரமான ஆராய்ச்சிக்குத் தேவையான நீண்ட reasoning work-இல் AI நம்பகமானதாக மாற முடியுமா என்பதே எழும் முக்கியமான கேள்வி.
கணிதம் அந்த மாற்றத்துக்கான சோதனை நிலமாக இருந்தால், Bubeck மற்றும் Ryu-வின் வாதம் எளிது: பரந்த இயந்திர நுண்ணறிவுக்கான பாதை, மனிதர்கள் உருவாக்கிய ஒழுங்கான சிந்தனையின் மிகக் கடினமான வடிவம் வழியே செல்லக்கூடும்.
இந்தக் கட்டுரை The Decoder-இன் செய்திப்பதிவை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.
Originally published on the-decoder.com


