வீடியோ உருவாக்கத்திலிருந்து பகிர்ந்த simulation-க்கு
AI ஆய்வகமான Odyssey Agora-1-ஐ அறிமுகப்படுத்தியுள்ளது. இது ஒரே நேரத்தில் நான்கு வீரர்கள் வரை ஒரே AI-உருவாக்கப்பட்ட சூழலில் இருக்கச் செய்யக்கூடிய world model ஆகும். நிறுவனம் இந்த அமைப்பை Nintendo 64 கிளாசிக் GoldenEye மூலம் காட்டியது; விளையாட்டை live multi-player simulation-ஆக மாற்றி, பகிரப்பட்ட அடிப்படை state-இலிருந்து real time-இல் உருவாகும் தனித்தனியான viewpoint-களை ஒவ்வொரு வீரரும் பார்க்க முடிந்தது.
இந்த வெளியீடு குறிப்பிடத்தக்கது, ஏனெனில் பெரும்பாலான public world-model demonstrations ஒரே active user-ஐ மையமாகக் கொண்டிருந்தன. Agora-1 அதற்கு மாறாக கடினமான பிரச்சினையை நோக்குகிறது: பலரும் ஒரே generated world-இல் ஒரே நேரத்தில் செயல்படும்போது, பல perspective-களை ஒழுங்காக வைத்திருப்பது.
Agora-1 எப்படி அமைக்கப்பட்டுள்ளது
source text-ன் படி, Odyssey இந்த system-ஐ இரண்டு models-ஆக பிரித்துள்ளது. ஒன்று common game state-ஐ தொடர்ந்து simulate செய்கிறது; original game-இன் internal state-இலிருந்து, வீரர்கள் நகரும் மற்றும் செயற்படும் போது உலகம் எப்படி மாறுகிறது என்பதை கற்றுக்கொள்கிறது. மற்றொன்று, diffusion-based model, அந்த shared state-இலிருந்து ஒவ்வொரு வீரருக்கும் தனித்த visual perspective-ஐ render செய்கிறது.
இந்த பிரிப்பு design-ன் மையம். பாரம்பரிய video generators நிலையான clips அல்லது reactive visuals-ஐ உருவாக்குகின்றன; ஆனால் explicit, persistent simulation-ஐ வைத்திருக்காது. Agora-1 learned game engine போல நடக்கிறது. simulation layer உலகில் என்ன நடக்கிறது என்பதைக் கண்காணிக்கிறது; rendering layer அந்த உலகை வேறு camera positions-இல் visuals-ஆக மாற்றுகிறது.
state வெளிப்படையாக நிர்வகிக்கப்படுவதால், mechanics-ஐ காக்கும் விதத்தில் புதிய levels-ஐயும் system உருவாக்க முடியும் என்று Odyssey கூறுகிறது. அதாவது, நிறுவனம் recorded gameplay-ஐ வெறுமனே மறுபடியும் அலங்கரிப்பதல்ல; விளையாட்டின் அடிப்படை விதிகளில் சிலவற்றையாவது பிடிக்கும் model ஒன்றை உருவாக்குகிறது.
பல-agent consistency ஏன் கடினம்
source text கூறுவது போல, Multiverse அல்லது Solaris போன்ற முந்தைய multi-agent அணுகுமுறைகள், குறிப்பாக வீரர்கள் ஒருவரை ஒருவர் பார்வைக்கு வெளியே இழந்தபோது, சிக்கல்களை சந்தித்தன. பகிரப்பட்ட உலகில் consistency failures விரைவாக தெளிவாகிவிடும். ஒரு வீரர் கதவைத் திறக்க, சுட, அல்லது அறை முழுவதும் நகர்ந்தால், மற்ற வீரர்கள் தங்கள் பார்வை கோணத்தில் இருந்து பொருந்தக்கூடிய விளைவுகளை அனுபவிக்க வேண்டும். system drift ஆனால், மாயை உடைந்து விடுகிறது.
Agora-1 இந்தப் பிரச்சினைக்கு ஒரு பதிலாக முன்வைக்கப்படுகிறது. game state-ஐ explicit மற்றும் shared-ஆக வைத்துக்கொண்டு, Odyssey வேறு renderings அனைத்தும் ஒரே உலகின் synchronized views ஆக இருக்க வேண்டும், loosely correlated hallucinations ஆக அல்ல, என்பதை உறுதிசெய்ய முயல்கிறது. இதன் பொருள், “என்ன நடந்தது” மற்றும் “ஒவ்வொரு பங்கேற்பாளரும் என்ன பார்க்கிறார்” என்பவற்றை பிரித்துக் காட்டுகிறது; game engines பல தசாப்தங்களாக state replication மற்றும் client rendering மூலம் கையாளும் distinction அதுவே.
புதுமை hard-coded simulation மற்றும் rendering pipelines-க்கு பதிலாக learned models-ஐ பயன்படுத்துவதில்தான்.
வெறும் game demo-வை விட அதிகம்
GoldenEye சூழல் Agora-1-க்கு உடனே அடையாளம் காணக்கூடிய showcase-ஐ தருகிறது; ஆனால் Odyssey இந்த தொழில்நுட்பத்தை இதைவிட விரிவாக முன்வைக்கிறது. நிறுவனம் Starchild-1 என்ற தொடர்புடைய system-ஐ அறிமுகப்படுத்தியுள்ளது. இது interactive audio-video world model என்று விவரிக்கப்பட்டுள்ளது; synchronized visuals மற்றும் sound-ஐ உருவாக்கி, தொடர்ச்சியான text input-க்கு பதிலளிக்கிறது. Agora-1-க்கு மாறாக, Starchild-1 ஒரே பயனாளருக்கு கவனம் செலுத்துகிறது, ஆனால் speech மற்றும் ambient audio-ஐ சேர்க்கிறது. source text-ன் படி, இதற்கு இன்னும் public demo இல்லை; sample videos மற்றும் technical paper மட்டும் உள்ளன.
இந்த இரண்டு அறிவிப்புகளும் சேர்ந்து, Odyssey passive generation-ஐத் தாண்டி interactive environments-ஐ நோக்கி நகர்கிறது என்பதை காட்டுகின்றன. அந்த திசை முக்கியமானது, ஏனெனில் world models-ன் மிக மதிப்புள்ள பயன்பாடுகள் சில cinema-style content-இல் இருக்காது. அவை agents, robots அல்லது humans செயல்பட, விளைவுகளைப் பார்க்க, ஒருங்கிணைக்க வேண்டிய simulated environments-இல் இருக்கும்.
AI training மற்றும் robotics-ல் சாத்தியமான பயன்பாடுகள்
Odyssey எதிர்கால பயன்பாடுகளாக AI agent training மற்றும் collaborative robotics-ஐ வெளிப்படையாகக் காட்டுகிறது. தர்க்கம் எளிது. ஒரு system பல actors-உடன் ஒரு persistent shared environment-ஐ simulate செய்ய முடிந்தால், அது coordination, planning மற்றும் embodied decision-making-க்கு sandbox ஆக மாறலாம்.
robotics-ல் multi-agent consistency என்பது வெறும் அழகியல் அம்சம் அல்ல. ஒன்றாக வேலை செய்யும் robots-க்கு space, objects மற்றும் ஒருவரின் மற்றொருவரின் actions பற்றிய பொருந்தக்கூடிய beliefs தேவை. மாறும் viewpoints-ன் கீழ் அந்த உறவுகளைத் தக்கவைக்கும் learned world model, synthetic training-க்கு மட்டுமன்றி deployment-க்கு முன் policies-ஐ சோதிக்கவும் பயனுள்ளதாக இருக்கும்.
பல actor-கள் ஒரே environment-ஐ பகிர்ந்து கொள்ளும் collaboration, competition அல்லது communication-ஐ கற்றுக்கொள்ளும் AI agents-க்கும் இதே பொருந்தும். single-user sandboxes பயனுள்ளதாக இருந்தாலும், பல உண்மை பணிகளில் ஒரே சூழலைப் பகிரும் பல actors இருப்பார்கள். Agora-1 அந்த நிலையை நேரடியாக model செய்யும் ஆரம்ப முயற்சி.
போட்டிப் பரப்பில் இது எங்கே நிற்கிறது
source text Agora-1-ஐ OpenAI-ன் Sora மற்றும் Google-ன் Veo 3 போன்ற video generators-உடன் ஒப்பிடுகிறது; அவை persistent simulations-க்கு பதிலாக clips உருவாக்குகின்றன. இது broader world-model space-இல் Google-ன் Genie 3-ஐயும் ஒரு நன்கு அறியப்பட்ட போட்டியாளராக குறிப்பிடுகிறது. இந்த ஒப்பீடு பயனுள்ளதாக இருக்கிறது, ஏனெனில் product category-யை தெளிவாகக் காட்டுகிறது. Agora-1 முக்கியமாக அழகான video பற்றியது அல்ல. இது ஒரு shared latent world-இல் தொடர்ச்சியான interaction பற்றியது.
இது கடினமான பிரச்சினை, மேலும் இதற்கான மதிப்பீட்டு அளவுகோல்கள் வேறுபட்டவை. frame quality முக்கியம், ஆனால் consistency, responsiveness மற்றும் காலப்போக்கில் world rules-ன் நிலைத்தன்மை கூட அவ்வளவு முக்கியம்.
ஆரம்பமானாலும் முக்கியமான ஒரு படி
Agora-1 இன்னும் ஒரு demo system தான், மேலும் source material production readiness-ஐக் கோரவில்லை. ஆனாலும், இது generative AI-யில் ஒரு முக்கிய மாற்றத்தை சுட்டிக்காட்டுகிறது. துறை இப்போது தனித்த media outputs உருவாக்குவதிலிருந்து, ஒரே நேரத்தில் பல பங்கேற்பாளர்கள் வாழவும் செயல்படவும் கூடிய environments-ஐ simulate செய்வதற்குத் திசை மாறுகிறது.
இந்த மாற்றம் நீடித்தால், அதன் முக்கியத்துவம் nostalgia அடிப்படையிலான game recreations-ஐத் தாண்டி செல்லும். shared world models agents training, interfaces prototyping மற்றும் interactive media-வின் புதிய வடிவங்களை ஆராய்வதற்கான infrastructure ஆக மாறலாம். Odyssey-யின் GoldenEye experiment ஒரு குறுகிய showcase தான், ஆனால் அது ஒரு பரந்த தொழில்நுட்ப மாற்றத்தைப் பிடிக்கிறது: AI systems இப்போது scenes மட்டும் அல்ல, continuity, rules மற்றும் ஒன்றுக்கு மேற்பட்ட point of view கொண்ட worlds-ஐயும் model செய்யத் தொடங்கியுள்ளன.
இந்தக் கட்டுரை The Decoder செய்தியறிக்கையை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.
Originally published on the-decoder.com




