వీడియో generation నుండి shared simulation కు
AI lab Odyssey Agora-1 ను పరిచయం చేసింది. ఇది ఒకేసారి నలుగురు players వరకు ఒకే AI-generated environment లో ఉంచగల world model. కంపెనీ ఈ సిస్టమ్ను Nintendo 64 classic GoldenEye తో చూపించింది, game ను live multi-player simulation గా మార్చి, shared underlying state నుండి real time లో రూపొందే వేర్వేరు viewpoints ను ప్రతి participant చూడగలిగేలా చేసింది.
ఈ విడుదల ప్రత్యేకమైనది, ఎందుకంటే ఎక్కువ public world-model demonstrations single active user పై కేంద్రీకృతమై ఉన్నాయి. Agora-1 అయితే కఠినమైన సమస్యను లక్ష్యంగా పెట్టుకుంది: అనేక మంది ఒకే generated world లో ఒకేసారి చర్యలు తీసుకుంటున్నప్పుడు multiple perspectives ను coherent గా ఉంచడం.
Agora-1 ఎలా నిర్మించబడింది
source text ప్రకారం, Odyssey ఈ system ను రెండు models గా విభజించింది. ఒకటి common game state ను నిరంతరం simulate చేస్తుంది, original game internal state నుండి learning ద్వారా players కదిలినప్పుడు, చర్యలు తీసుకున్నప్పుడు ప్రపంచం ఎలా మారుతుందో నేర్చుకుంటుంది. మరోటి, diffusion-based model, ఆ shared state నుండి ప్రతి player కోసం ప్రత్యేక visual perspective ను render చేస్తుంది.
ఈ విభజన design యొక్క కేంద్రం. traditional video generators స్థిర clips లేదా reactive visuals ను తయారు చేస్తాయి కానీ explicit, persistent simulation ను కొనసాగించవు. Agora-1 learned game engine లా ప్రవర్తిస్తుంది. simulation layer ప్రపంచంలో ఏమి జరుగుతుందో ట్రాక్ చేస్తుంది; rendering layer ఆ ప్రపంచాన్ని వేర్వేరు camera positions నుండి visuals గా మారుస్తుంది.
state ను స్పష్టంగా నిర్వహించడంవల్ల, Odyssey mechanics ను కాపాడుతూ కొత్త levels ను కూడా generate చేయగలమని చెబుతోంది. అంటే కంపెనీ recorded gameplay ను కేవలం re-style చేయడం కాదు; play యొక్క underlying rules లో కనీసం కొంత భాగాన్ని పట్టుకునే model ను నిర్మిస్తోంది.
multi-agent consistency ఎందుకు కష్టం
source text ప్రకారం, Multiverse లేదా Solaris వంటి ముందస్తు multi-agent approaches, players ఒకరినొకరు sight నుండి కోల్పోయినప్పుడు ప్రత్యేకంగా ఇబ్బంది పడ్డాయి. shared world లో consistency failures వెంటనే స్పష్టమవుతాయి. ఒక player తలుపు తెరిస్తే, కాల్చితే లేదా గదిలో కదిలితే, ఇతర players తమ viewpoint నుండి సరిపోలే పరిణామాలను అనుభవించాలి. system drift అయితే, illusion చెదిరిపోతుంది.
Agora-1 ఆ సమస్యకు ఒక సమాధానంగా చెప్పబడుతోంది. game state ను explicit మరియు shared గా ఉంచి, Odyssey వేర్వేరు renderings అన్నీ ఒకే world యొక్క synchronized views గా ఉండేలా చేయాలని లక్ష్యంగా పెట్టుకుంది, loosely correlated hallucinations గా కాకుండా. వాస్తవంలో, “ఏమి జరిగింది” మరియు “ప్రతి participant ఏమి చూస్తున్నాడు” అనే తేడాను వేరు చేస్తోంది; game engines దశాబ్దాలుగా state replication మరియు client rendering ద్వారా అదే తేడాను నిర్వహిస్తున్నాయి.
ఇందులో కొత్తదనం hard-coded simulation మరియు rendering pipelines స్థానంలో learned models ను తీసుకురావడమే.
కేవలం game demo మాత్రమే కాదు
GoldenEye setting Agora-1 కు తక్షణ గుర్తింపు కలిగించే showcase ను ఇస్తుంది, కానీ Odyssey ఈ technology ని విస్తృతంగా చూపిస్తోంది. కంపెనీ Starchild-1 అనే సంబంధిత system ను పరిచయం చేసింది, దీనిని interactive audio-video world model గా పేర్కొన్నారు, ఇది synchronized visuals మరియు sound ను రూపొందిస్తూ ongoing text input కు ప్రతిస్పందిస్తుంది. Agora-1 కు భిన్నంగా, Starchild-1 single user పై దృష్టి పెడుతుంది కానీ speech మరియు ambient audio ను జోడిస్తుంది. source text ప్రకారం, ఇప్పటికీ public demo లేదు; sample videos మరియు technical paper మాత్రమే ఉన్నాయి.
ఈ రెండు ప్రకటనలు కలిసి Odyssey passive generation దాటి interactive environments వైపు కదులుతోందని చూపిస్తున్నాయి. ఈ దిశ ముఖ్యమైనది, ఎందుకంటే world models కు అత్యంత విలువైన వినియోగాలు కొన్ని cinema-style content లో ఉండకపోవచ్చు. అవి agents, robots లేదా humans చర్యలు తీసుకోవాలి, పరిణామాలు గమనించాలి, సమన్వయం చేయాలి అనే simulated environments లో ఉండవచ్చు.
AI training మరియు robotics లో సాధ్యమైన వినియోగాలు
Odyssey భవిష్యత్ వినియోగాలుగా AI agent training మరియు collaborative robotics ను స్పష్టంగా సూచిస్తోంది. లాజిక్ సులభం. ఒక system అనేక actors తో persistent shared environment ను simulate చేయగలిగితే, అది coordination, planning మరియు embodied decision-making కు sandbox గా మారుతుంది.
robotics లో multi-agent consistency అలంకార లక్షణం కాదు. కలిసి పనిచేసే robots కు space, objects మరియు ఒకరికొకరు actions గురించి సరిపోయే beliefs కావాలి. మారుతున్న viewpoints మధ్య ఆ సంబంధాలను కొనసాగించగల learned world model synthetic training కి మాత్రమే కాకుండా deployment ముందు policies పరీక్షించడానికి కూడా ఉపయోగపడుతుంది.
కలసి పనిచేయడం, పోటీ పడడం లేదా సంభాషించడం నేర్చుకుంటున్న AI agents కు కూడా ఇదే వర్తిస్తుంది. single-user sandboxes ఉపయోగకరంగా ఉన్నా, చాలా నిజమైన పనుల్లో అనేక actors ఒకే environment ను పంచుకుంటారు. Agora-1 ఆ పరిస్థితిని నేరుగా model చేయడానికి చేసిన తొలిప్రయత్నం.
పోటీ దృశ్యంలో ఇది ఎక్కడ ఉంది
source text Agora-1 ను OpenAI యొక్క Sora మరియు Google యొక్క Veo 3 వంటి video generators తో పోలుస్తుంది, ఇవి persistent simulations కు బదులుగా clips ను తయారు చేస్తాయి. broader world-model space లో Google యొక్క Genie 3 ను మరింత తెలిసిన competitor గా కూడా ఇది పేర్కొంటుంది. ఈ పోలిక ఉపయోగకరమైనది, ఎందుకంటే product category ను స్పష్టంగా చేస్తుంది. Agora-1 ప్రధానంగా అందమైన video గురించి కాదు. ఇది shared latent world లో నిరంతర interaction గురించి.
ఇది కఠినమైన సమస్య, మరియు దాని evaluation criteria వేరుగా ఉంటాయి. frame quality ముఖ్యమే, కానీ consistency, responsiveness మరియు సమయంతో పాటు world rules స్థిరత్వం కూడా అంతే ముఖ్యము.
ప్రారంభమైనా అర్థవంతమైన అడుగు
Agora-1 ఇప్పటికీ demo system మాత్రమే, మరియు source material production readiness అని చెప్పలేదు. అయినప్పటికీ, ఇది generative AI లో ఒక ముఖ్యమైన మార్పును సూచిస్తోంది. ఈ రంగం ఇప్పుడు isolated media outputs సృష్టించడం నుంచి, ఒకేసారి అనేక participants నివసించి చర్యలు తీసుకోగల environments ను simulate చేయడంకు మారుతోంది.
ఈ మార్పు నిలిచితే, దాని ప్రాముఖ్యత nostalgia ఆధారిత game recreations ను మించి ఉంటుంది. shared world models agents training, interfaces prototyping మరియు interactive media యొక్క కొత్త రూపాలను అన్వేషించడానికి infrastructure గా మారవచ్చు. Odyssey యొక్క GoldenEye experiment ఒక చిన్న showcase మాత్రమే, కానీ ఇది ఒక విస్తృత సాంకేతిక మార్పును పట్టిస్తోంది: AI systems ఇప్పుడు scenes మాత్రమే కాకుండా, continuity, rules మరియు ఒకటి కంటే ఎక్కువ point of view కలిగిన worlds ను model చేయడం ప్రారంభించాయి.
ఈ వ్యాసం The Decoder రిపోర్టింగ్పై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.
Originally published on the-decoder.com


