من توليد الفيديو إلى المحاكاة المشتركة
قدّم مختبر الذكاء الاصطناعي Odyssey نظام Agora-1، وهو نموذج عالم قادر على وضع ما يصل إلى أربعة لاعبين داخل البيئة نفسها المولدة بالذكاء الاصطناعي في الوقت نفسه. واستعرضت الشركة النظام باستخدام اللعبة الكلاسيكية على Nintendo 64 GoldenEye، محولةً اللعبة إلى محاكاة مباشرة متعددة اللاعبين يرى فيها كل مشارك منظوراً مختلفاً يُنشأ في الوقت الحقيقي من حالة أساسية مشتركة.
يكتسب هذا الإطلاق أهمية لأن معظم العروض العامة لنماذج العالم ركزت حتى الآن على مستخدم نشط واحد. أما Agora-1 فيستهدف مشكلة أصعب: الحفاظ على اتساق وجهات النظر المتعددة بينما يتصرف عدة أشخاص في الوقت نفسه داخل العالم المُولَّد نفسه.
كيف تم بناء Agora-1
وفقاً للنص المصدر، تقسم Odyssey النظام إلى نموذجين. أحدهما يحاكي باستمرار حالة اللعبة المشتركة، متعلماً من الحالة الداخلية للعبة الأصلية كيف يتغير العالم عندما يتحرك اللاعبون ويتصرفون. ثم يقوم نموذج ثانٍ قائم على الانتشار برسم منظور بصري فردي لكل لاعب من تلك الحالة المشتركة.
هذا الفصل هو جوهر التصميم. مولدات الفيديو التقليدية تنتج مقاطع ثابتة أو صوراً تفاعلية من دون الحفاظ على محاكاة صريحة ومستمرة. يتصرف Agora-1 أقرب إلى محرك لعبة متعلم. طبقة المحاكاة تتابع ما يحدث في العالم، بينما تحوّل طبقة العرض ذلك العالم إلى صور من مواقع كاميرا مختلفة.
وبما أن الحالة تُدار بصورة صريحة، تقول Odyssey إن النظام يمكنه أيضاً إنشاء مستويات جديدة مع الحفاظ على آليات اللعبة الأصلية. ويشير ذلك إلى أن الشركة لا تعيد فقط تزيين لقطات لعب مسجلة، بل تبني نموذجاً يلتقط على الأقل بعض القواعد الأساسية للعب.
لماذا يصعب الحفاظ على الاتساق بين عدة وكلاء
يقول النص المصدر إن الأساليب متعددة الوكلاء السابقة مثل Multiverse أو Solaris واجهت صعوبات خصوصاً عندما فقد اللاعبون القدرة على رؤية بعضهم بعضاً. في عالم مشترك، تصبح أخطاء الاتساق واضحة بسرعة. إذا فتح لاعب باباً أو أطلق طلقة أو تحرك عبر غرفة، يجب أن يتمكن اللاعبون الآخرون من اختبار نتائج متوافقة من مواقعهم الخاصة. وإذا انحرف النظام، تنهار الوهم.
يُطرح Agora-1 باعتباره جواباً لهذه المشكلة. ومن خلال إبقاء حالة اللعبة صريحة ومشتركة، تهدف Odyssey إلى ضمان أن تظل عمليات العرض المختلفة مناظر متزامنة للعالم نفسه، لا مجرد هلوسات مترابطة بشكل فضفاض. وبالمعنى العملي، تفصل الشركة بين «ما حدث» و«ما يراه كل مشارك»، وهو التمييز نفسه الذي تعاملت معه محركات الألعاب لعقود عبر تكرار الحالة وعرضها على جهة العميل.
الجدة هنا تكمن في استبدال خطوط أنابيب المحاكاة والعرض المبرمجة مسبقاً بنماذج متعلمة.
أكثر من مجرد عرض لعبة
يمنح إعداد GoldenEye نظام Agora-1 عرضاً فورياً معروفاً، لكن Odyssey تقدم التقنية ضمن إطار أوسع. فقد طرحت الشركة نظاماً ذا صلة يسمى Starchild-1، وُصف بأنه نموذج عالم سمعي بصري تفاعلي يولد صوراً وصوتاً متزامنين أثناء الاستجابة لإدخال نصي مستمر. وعلى خلاف Agora-1، يركز Starchild-1 على مستخدم واحد، لكنه يضيف الكلام والصوت المحيطي. ويذكر النص المصدر أنه لا توجد بعد نسخة تجريبية عامة، بل فقط مقاطع فيديو نموذجية وورقة تقنية.
وتُظهر الإعلاناتان معاً أن Odyssey تتحرك أبعد من التوليد السلبي نحو بيئات تفاعلية. وتكتسب هذه الوجهة أهمية لأن بعض أكثر التطبيقات قيمة لنماذج العالم قد لا تكون في المحتوى الشبيه بالسينما على الإطلاق، بل في البيئات المحاكية التي يحتاج فيها الوكلاء أو الروبوتات أو البشر إلى التصرف وملاحظة العواقب والتنسيق.
استخدامات محتملة في تدريب الذكاء الاصطناعي والروبوتات
تشير Odyssey صراحةً إلى تدريب وكلاء الذكاء الاصطناعي والروبوتات التعاونية كاستخدامات مستقبلية. والمنطق واضح. إذا كان النظام قادراً على محاكاة بيئة مشتركة مستمرة تضم عدة فاعلين، فقد يصبح مساحة اختبار للتنسيق والتخطيط واتخاذ القرار المجسد.
في الروبوتات، ليس الاتساق بين عدة وكلاء ميزة تجميلية. فالروبوتات التي تعمل معاً تحتاج إلى معتقدات متوافقة بشأن المكان والأشياء وأفعال بعضها بعضاً. وسيكون نموذج عالم متعلماً قادراً على الحفاظ على هذه العلاقات تحت زوايا رؤية متغيرة مفيداً ليس فقط للتدريب الاصطناعي، بل ربما أيضاً لاختبار السياسات قبل النشر.
وينطبق الأمر نفسه على وكلاء الذكاء الاصطناعي الذين يتعلمون التعاون أو التنافس أو التواصل. ومساحات الاختبار لمستخدم واحد مفيدة، لكن كثيراً من المهام الواقعية تشمل عدة فاعلين يتشاركون بيئة واحدة. ويُعد Agora-1 محاولة مبكرة لنمذجة هذه الحالة مباشرة.
موقعه في المشهد التنافسي
يقارن النص المصدر Agora-1 بمولدات الفيديو مثل Sora من OpenAI وVeo 3 من Google، والتي تنتج مقاطع بدلاً من محاكاة مستمرة. كما يذكر Genie 3 من Google بوصفه منافساً أكثر شهرة في مجال نماذج العالم الأوسع. وهذه المقارنة مفيدة لأنها توضح فئة المنتج. فـ Agora-1 لا يهدف أساساً إلى فيديو أجمل، بل إلى تفاعل مستمر ضمن عالم كامن مشترك.
وهذه مشكلة أصعب وبمعايير تقييم مختلفة. جودة الإطارات مهمة، لكن الاتساق والاستجابة واستقرار قواعد العالم عبر الزمن مهمة أيضاً.
خطوة مبكرة لكنها ذات معنى
لا يزال Agora-1 نظاماً تجريبياً، ولا يدّعي النص الأصلي أنه جاهز للإنتاج. لكنه يشير إلى انتقال مهم في الذكاء الاصطناعي التوليدي. فالمجال ينتقل من توليد مخرجات إعلامية منفصلة إلى محاكاة بيئات يمكن أن يعيش فيها عدة مشاركين ويتصرفوا فيها في الوقت نفسه.
إذا استمر هذا الانتقال، فإن أهميته ستتجاوز بكثير إعادة إحياء الألعاب القديمة. فقد تصبح نماذج العالم المشتركة بنية تحتية لتدريب الوكلاء، ونمذجة الواجهات، واستكشاف أشكال جديدة من الوسائط التفاعلية. إن تجربة GoldenEye من Odyssey عرض ضيق، لكنها تجسد تحولاً تقنياً أوسع: أنظمة الذكاء الاصطناعي تبدأ في نمذجة ليس المشاهد فقط، بل العوالم التي تتسم بالاستمرارية والقواعد وتعدد وجهات النظر.
هذا المقال يستند إلى تقرير من The Decoder. اقرأ المقال الأصلي.
Originally published on the-decoder.com




