மெட்டா மற்றும் கல்வி கூட்டாளிகள் தன்னைத்தானே மேம்படுத்தும் ஏஐயை இன்னொரு படி முன்னேற்றுகின்றனர்

மெட்டா, பிரிட்டிஷ் கொலம்பியா பல்கலைக்கழகம் மற்றும் பிற நிறுவனங்களின் ஆராய்ச்சியாளர்கள், “ஹைப்பர் ஏஜென்ட்கள்” எனப்படும் புதிய வகை அமைப்புகளை உருவாக்கியுள்ளதாகக் கூறுகிறார்கள்; இவை பணிகளைத் தீர்ப்பதில் மட்டுமல்லாமல், தங்களை மேம்படுத்த பயன்படுத்தும் செயல்முறையையும் செம்மைப்படுத்துவதிலும் மேம்பட முடியும். இந்த அணுகுமுறை நிலைத்தன்மையுடன் செயல்பட்டால், தன்னைத்தானே மேம்படுத்தும் ஏஐயின் ஒரு முக்கிய விரிவாக்கமாக இது அமையும், குறிப்பாக முந்தைய முறைகள் நன்றாக செயல்பட்ட துறைகளைத் தாண்டி, குறிப்பாக நிரலாக்கத்தில்.

The Decoder வெளியிட்ட செய்தியின்படி, இந்த வேலை Darwin Gödel Machine அல்லது DGM என்ற அமைப்பை அடிப்படையாகக் கொண்டது. இதில் ஒரு முகவர் தனது சொந்த குறியீட்டின் மாறுபாடுகளை உருவாக்கி, அவற்றைச் சோதித்து, வெற்றி பெற்ற பதிப்புகளை ஒரு காப்பகத்தில் சேமிக்கிறது; அது அடுத்தடுத்த செம்மைப்படுத்தல் சுற்றுகளுக்கு ஆதரவாக இருக்கும். அந்த முன் அமைப்பின் முக்கிய வரம்பு, மூல உரையின் படி, மேம்பாட்டை இயக்கும் முறையையே மனிதர்கள் நிலைத்ததாக வைத்திருந்தது என்பதாகும். முகவர் அந்த கட்டமைப்பிற்குள் உகப்பாக்க முடிந்தது, ஆனால் அந்த கட்டமைப்பையே மாற்ற முடியவில்லை.

ஹைப்பர் ஏஜென்ட் எதில் வேறுபடுகிறது

பரிந்துரைக்கப்படும் தீர்வு, இரண்டு செயல்பாடுகளையும் ஒரே திருத்தக்கூடிய நிரலில் இணைப்பதாகும். ஒரு கூறு தற்போதைய பணியை கையாள்கிறது; உதாரணமாக, ஒரு அறிவியல் கட்டுரையை மதிப்பிடுவது அல்லது ஒரு ரோபோட்டுக்கான வெகுமதி செயல்பாட்டை வடிவமைப்பது. மற்றொரு கூறு முகவரை மாற்றி புதிய மாறுபாடுகளை உருவாக்குகிறது. இந்த இரண்டு கூறுகளும் ஒரே codebase-இல் இருப்பதால், கோட்பாட்டில் அமைப்பு தன் பணி-தீர்க்கும் நடத்தை மட்டுமல்லாமல், மேம்பாட்டு தர்க்கத்தையும் மீளெழுத முடியும்.

இதுவே ஹைப்பர் ஏஜென்ட் என்ற கருத்தின் மையக் கோரிக்கை. நிலையான, மனிதர்களால் எழுதப்பட்ட ஓருருவில் மட்டும் மேம்படுவதற்குப் பதிலாக, முகவர் அந்த ஓருருவையும் உகப்பாக்க முடியும். மூல அறிக்கையின் மொழியில், அது பணிகளிலும், மேலும் “முதலில் எப்படி மேம்படுவது என்பதை கண்டறிவதிலும்” சிறப்பாகிறது.

தன்னைத்தானே மேம்படுத்தும் முயற்சி நீண்ட காலமாக ஒரு உச்சவரம்பை எதிர்கொண்டு வந்ததால் இது முக்கியம். ஒரு அமைப்பு ஒரு துறையில் மிகுந்த திறமையுடன் இருக்கலாம்; அதே நேரத்தில், தானாகவே வளராத கைமுறையாக உருவாக்கப்பட்ட செயல்முறைகளையே அது சார்ந்திருக்கலாம். அந்தத் தடையை அகற்ற, meta-level-ஐயும் திருத்தக்கூடியதாக மாற்றும் முயற்சியே ஹைப்பர் ஏஜென்ட்கள்.

முந்தைய தன்னைத்தானே மேம்படுத்தும் அணுகுமுறை ஏன் நன்றாகப் பொதுமைப்படவில்லை

வழங்கப்பட்ட மூல உரையின் படி, ஆரம்ப Darwin Gödel Machine நிரலாக்க பணிகளில் நம்பிக்கை அளித்தது; ஏனெனில் சிறந்த நிரலாக்குநராக இருப்பதற்கும் சிறந்த தன்னிலை மாற்றங்களை எழுதுவதற்கும் இயல்பான தொடர்பு உள்ளது. நிரலாக்கத்தில், முகவரின் பணித் திறனும் தன் செயலாக்கத்தை மாற்றும் திறனும் நெருக்கமாக இணைந்துள்ளன.

நிரலாக்கத்திற்கு வெளியே அந்த இணைப்பு பலவீனமாகிறது. அறிவியல் கட்டுரைகளை மதிப்பிடுவதில் சிறப்பாகும் முகவர், தானாகவே தன் குறியீட்டை மீளெழுதுவதில் சிறப்பாக மாறிவிடாது. இதுவே, கைமுறையான சரிசெய்தல் இல்லாமல், மூல DGM நிரலாக்கத்தைத் தாண்டி மோசமாக செயல்பட்டதற்குக் காரணம் என ஆராய்ச்சியாளர்கள் வாதிடுகின்றனர். அறிக்கையின் படி, மனிதர்கள் தலையிடாமல் இருந்தால், அந்த அமைப்பு நிரலாக்கமற்ற பணிகளில் கிட்டத்தட்ட பூஜ்ய செயல்திறனை எட்டியது.

ஹைப்பர் ஏஜென்ட்கள் அந்த தோல்வி நிலையை சமாளிக்க உருவாக்கப்பட்டவை. மேம்பாட்டு முறையையே உகப்பாக்க அனுமதிப்பதன் மூலம், ஆராய்ச்சியாளர்கள் DGM-இன் காப்பக-அடிப்படையிலான பரிணாம கட்டமைப்பைப் பாதுகாக்க விரும்புகிறார்கள்; அதே நேரத்தில், meta-agent நிரந்தரமாக நிலைத்ததாக இருக்க வேண்டிய அவசியத்திலிருந்து விடுவிக்கப்படுகிறது.

புதிய அமைப்பு: DGM-H

இந்த புதிய அணுகுமுறையை அந்தக் குழு DGM-Hyperagents அல்லது DGM-H என அழைக்கிறது. இந்த முறையின் முக்கியமான பகுதியாக காப்பகம் தொடர்கிறது. அமைப்பு மாறுபாடுகளை உருவாக்குகிறது, அவற்றை மதிப்பீடு செய்கிறது, மற்றும் வெற்றி பெற்ற பதிப்புகளை எதிர்கால மாற்றங்களுக்கான படிக்கட்டுகளாகப் பயன்படுத்துகிறது. மாறுவது என்னவென்றால், “meta” கூறு இனி பூட்டப்பட்டிருக்காது. முகவரின் சிறந்த பதிப்புகளை உருவாக்கும் செயல்முறை அதே சுழற்சியின் ஒரு பகுதியாக மாற்றப்படக்கூடிய வகையில் கட்டமைப்பு வடிவமைக்கப்பட்டுள்ளது.

இது ஒரு பெரிய கருத்தியல் மாற்றம். பல ஏஐ அமைப்புகளில், தன்னைத்தானே மேம்படுத்துதல் என்பது object-level task solver மற்றும் meta-level controller அல்லது training logic ஆகியவற்றுக்கிடையிலான கடுமையான பிரிவால் கட்டுப்படுத்தப்படுகிறது. DGM-H அந்தப் பிரிவை குறைத்து, இரண்டையும் திருத்தக்கூடிய code-இல் வைத்து விடுகிறது. குறைந்தது கோட்பாட்டில், இதன் விளைவு, பணித் திறனுடன் முன்னமே இணைந்திருக்காத அறியாத துறைகளுக்கு ஏற்றுப்போகும் சிறந்த வாய்ப்பு கொண்ட ஒரு அமைப்பு.

நான்கு பணிப் பகுதிகளில் தெரிவிக்கப்பட்ட முடிவுகள்

candidate text-ன் படி, ஆராய்ச்சியாளர்கள் DGM-H-ஐ நான்கு பணிப் பகுதிகளில் சோதித்து, பெரிய முன்னேற்றங்களை அறிவித்துள்ளனர். இந்த excerpt முழு எண்மதிப் பெறுபேறுகளை வழங்கவில்லை, எனவே அவற்றை மிகைப்படுத்தக் கூடாது. சொல்லக்கூடியது என்னவென்றால், பரந்த பயன்பாடு என்ற விஷயத்தில் அந்த அமைப்பு மூல அமைப்பை விட மிக வலுவானதாக ஆராய்ச்சி குழு முன்வைக்கிறது.

அந்தக் கோரிக்கை முக்கியம்; ஏனெனில் பொதுமை என்பது தன்னைத்தானே மேம்படுத்தும் ஏஐயில் மிகக் கடினமான இலக்குகளில் ஒன்றாகும். பல அமைப்புகள் குறுகிய சூழ்நிலைகளில் நன்றாக செயல்பட்டாலும், சூழல் மாறும் போது உடைந்து போகும் கைமுறை முன்கணிப்புகளையே சார்ந்திருக்கும். ஹைப்பர் ஏஜென்ட்கள் வெவ்வேறு பணிவகைகளில் அர்த்தமுள்ள முறையில் மேம்பட முடிந்தால், அவை அதிக நெகிழ்வான தன்னாட்சி அமைப்புகளுக்கான முன்னேற்றமாக அமையும்.

அதே நேரத்தில், வழங்கப்பட்ட பொருள் இதை உற்பத்தி-தயார் திறனாக அல்ல, ஆராய்ச்சியாகவே விவரிக்கிறது. எனவே இதை பரிசோதனைத் துருவமாகவே புரிந்துகொள்ள வேண்டும்; பரவலாக தன்னைத்தானே வேகப்படுத்தும் ஏஐ ஏற்கனவே பெரிய அளவில் இயங்குகிறது என்பதற்கான ஆதாரமாக அல்ல.

இந்த ஆராய்ச்சி ஏன் முக்கியம்

ஹைப்பர் ஏஜென்ட்களின் பரந்த முக்கியத்துவம், அவர்கள் எல்லையை எங்கே நகர்த்துகிறார்கள் என்பதில் உள்ளது. ஏஐ ஆராய்ச்சியாளர்கள் செயல்திறனை மேம்படுத்த தேடல் செய்ய, உகப்பாக்க, அல்லது குறியீடு எழுதக்கூடிய அமைப்புகளை நீண்ட காலமாக ஆராய்ந்து வருகின்றனர். மாற்றத்தின் தர்க்கத்தையே மீளாய்வு செய்யும் திறன் கொண்ட, அதுவும் பயனற்ற மாற்றங்களில் சிதையாமல் இருக்கும் அமைப்புகளை உருவாக்குவதுதான் கடினமான பிரச்சினை. DGM-H, இந்த மீளுரு சுழற்சியை மேலும் திறமையானதாகவும், மேலும் பரவலாகப் பயனுள்ளதாகவும் மாற்றும் முயற்சியாக முன்வைக்கப்படுகிறது.

இந்த அணுகுமுறை வலுவாக நிரூபிக்கப்பட்டால், பணித் திறனும் தன்னிலை மாற்றத் திறனும் இயல்பாக ஒன்றோடு ஒன்று பொருந்தாத துறைகளில் இது முக்கியத்துவம் பெறலாம். அறிவியல் பகுப்பாய்வு, ரோபோட்டிக்ஸ், மற்றும் பிற சிக்கலான பகுதிகள் மூல உரையில் குறிப்பிடப்பட்ட உதாரணங்கள். அத்தகைய சூழல்களில், ஒரு அமைப்பின் மதிப்பு அது செயல்படுவது மட்டுமல்ல, அது எவ்வாறு கற்றுக்கொள்கிறது, எவ்வாறு தழுவிக்கொள்கிறது என்பதை மீண்டும் வடிவமைக்கும் திறனிலும் அதிகரிக்கலாம்.

அந்த வாய்ப்பே, இந்த வேலை தொழில்நுட்ப விவரங்களைத் தாண்டியும் ஏன் கவனம் பெறுகிறது என்பதை விளக்குகிறது. தன் சொந்த optimizer-ஐ உகப்பாக்கக்கூடிய ஒரு அமைப்பு, ஏஐ திறன் வளர்ச்சி, பாதுகாப்பு, மதிப்பீடு, மற்றும் கட்டுப்பாடு ஆகியவற்றின் அடிப்படை கேள்விகளைத் தொட்டுவிடுகிறது. வழங்கப்பட்ட அறிக்கை செயல்திறன் அதிகரிப்பு சாத்தியத்தை வலியுறுத்துகிறது; ஆனால் அதே கட்டமைப்பு கருத்து மேற்பார்வை மற்றும் alignment குறித்து கவலைப்படும் ஆராய்ச்சியாளர்களின் பரிசோதனையையும் ஈர்க்கும்.

ஒரு கட்டமைக்கப்பட்ட ஆனால் குறிப்பிடத்தக்க படி

கிடைக்கப்பெறும் பொருளின் அடிப்படையில், மிகப் பாதுகாப்பான முடிவு என்னவென்றால், மெட்டாவும் அதன் கூட்டாளிகளும் தன்னைத்தானே மேம்படுத்தும் ஒரு மேலும் நெகிழ்வான மாதிரியை முன்னேற்றுகின்றனர்; கட்டுக்கடங்காத recursive intelligence-க்கான தீர்க்கப்பட்ட வழியை அவர்கள் காட்டவில்லை. இந்த ஆய்வு முந்தைய self-modification அணுகுமுறைகளில் இருந்த ஒரு குறிப்பிட்ட பலவீனத்தைத் தீர்க்கிறது, மேலும் பல பணிப் பகுதிகளில் முன்னேற்றம் இருப்பதாகக் கூறுகிறது.

அதுவே இதை குறிப்பிடத்தக்கதாக மாற்றுகிறது. தன்னைத்தானே மேம்படுத்தும் ஏஐ பற்றி பெரும்பாலும் கோட்பாட்டான அல்லது ஊகபூர்வமான முறையில் பேசப்படுகிறது. ஹைப்பர் ஏஜென்ட்கள் அந்த விவாதத்திற்கு ஒரு தெளிவான தொழில்நுட்ப வடிவத்தை அளிக்கின்றனர்: திருத்தக்கூடிய meta-mechanisms, archive-based iteration, மற்றும் software engineering-ஐத் தாண்டி பொதுமைப்படுத்துவதற்கான வெளிப்படையான முயற்சி. இந்த முறை அடிப்படையானதாக மாறுமா அல்லது ஒரு பயனுள்ள பரிசோதனையாகவே இருக்குமா என்பது இங்கே கொடுக்கப்பட்ட சுருக்கத்தைத் தாண்டிய முடிவுகளைப் பொறுத்தது. ஆனால் ஒரு ஆராய்ச்சி திசையாக, அது ஏஐயின் மிகக் குறிப்பிடத்தக்க கேள்விகளில் ஒன்றை நோக்கி தெளிவாகச் செல்கிறது: அமைப்புகள் மேம்பட முடியுமா என்பதே அல்ல, அவை மேம்பாட்டு செயல்முறையையே மேம்படுத்த முடியுமா என்பதாகும்.

இந்தக் கட்டுரை The Decoder-இன் செய்தியினை அடிப்படையாகக் கொண்டது. அசல் கட்டுரையைப் படிக்கவும்.