باحثو الروبوتات يتجاوزون الذكاء الاصطناعي التفاعلي
إحدى نقاط الضعف الأساسية في أنظمة الروبوتات اليوم هي أن كثيرًا منها يتعلم ترابطًا مباشرًا بين ما تراه الكاميرا والحركة التالية التي ينبغي للآلة أن تقوم بها. قد ينتج عن ذلك سلوك مفيد، لكنه يترك فجوة في الفهم. فقد يتعلم الروبوت ما الفعل الذي يلي صورة معينة عادةً، من دون أن يتعلم كيف يغيّر فعله هو العالم.
وتقول ورقة مراجعة جديدة أُشير إليها في التقرير المرفق إن نماذج الفعل العالمي، أو WAMs، صُممت لسد هذه الفجوة. فبدلًا من الاكتفاء بربط الملاحظات بالأفعال، تتنبأ هذه النماذج أيضًا بكيفية تغير البيئة على الأرجح بعد تنفيذ فعل ما. وبذلك تمنح الروبوتات طريقة لمحاكاة العواقب قصيرة المدى قبل التحرك.
لماذا يهم ذلك
الوعد العملي هنا كبير. فإذا استطاع الروبوت نمذجة نتيجة حركته قبل تنفيذها، فسيكون في وضع أفضل للتعميم على أشياء وبيئات غير مألوفة. وهذه مشكلة كبيرة في الروبوتات، إذ غالبًا ما تعمل الأنظمة جيدًا في ظروف تدريب ضيقة ثم تتراجع عندما تتغير البيئة.
ويشير التقرير المرفق أيضًا إلى ميزة أخرى: بيانات التدريب. فالأنظمة الروبوتية التقليدية تعتمد كثيرًا على مجموعات بيانات تكون فيها أفعال الروبوت موسومة، وهو أمر مكلف وبطيء الإنتاج. ويمكن لنماذج الفعل العالمي أن تتعلم من مقاطع فيديو يومية غير موسومة، بما في ذلك اللقطات الملتقطة من منظور الشخص الأول، لأنها لا تتعلم الأوامر فقط، بل تتعلم العلاقة بين الأفعال والعالم البصري المتغير.
ظهور فرعين رئيسيين في التصميم
بحسب المراجعة، يندرج نحو مئة ورقة بحثية ضمن فئة هذا النموذج، ويقسمها المؤلفون إلى عائلتين معماريتين واسعتين. يبدأ أحد المسارين بتوليد فيديو متوقع للمستقبل ثم يستنبط منه أوامر التحكم. أما المسار الآخر فيعالج المدخلات البصرية والأفعال معًا وبالتوازي.
وتكتسب هذه القسمة أهمية لأنها تظهر أن المجال ينضج من تجارب معزولة إلى منطقة بحثية يمكن تمييزها وبداخلها بنية داخلية. وتتتبع المراجعة هذه الفروع كما توسعت منذ عام 2024، مانحة باحثي الروبوتات إطارًا مشتركًا لمقارنة الأنظمة التي تحاول الجمع بين التنبؤ والتحكم.
ما وراء نماذج العالم الصرفة
تشير المقالة المرفقة إلى تمييز مهم. فمولد الفيديو الصرف يمكنه إنتاج إطارات مستقبلية تبدو معقولة، لكن ذلك وحده لا يجعله مفيدًا للتحكم. أما نماذج الفعل العالمي فمقصود بها أن تلبّي المتطلبين معًا: التنبؤ بالحالة التالية للبيئة مع ربط هذا التنبؤ مباشرةً بتوليد الفعل.
وهذا يجعل WAMs ذات صلة خاصة بينما يحاول مجال الروبوتات الانتقال من العروض المبهرة إلى أنظمة مجسدة أكثر موثوقية. فالروبوت الذي يستطيع تخيل مستقبل قريب وربطه بقرارات حركية يقترب من الفعل ببصيرة، لا برد الفعل فقط.
خطوة نحو روبوتات أكثر قابلية للتكيف
لا تزال نماذج الفعل العالمي إطارًا بحثيًا، لا فئة منتج مكتملة. لكن المراجعة الموصوفة في التقرير المرفق توحي بأنها قد تصبح فكرة تنظيمية مهمة للموجة التالية من الذكاء الاصطناعي للروبوتات. وإذا نجح النهج كما هو مقصود، فقد تصبح الروبوتات أقل هشاشة، وأقل اعتمادًا على التسميات المنقحة بعناية، وأكثر قدرة على التعامل مع البيئات غير المألوفة عبر التفكير في العواقب المحتملة قبل الفعل.
هذه المقالة مبنية على تقرير The Decoder. اقرأ المقال الأصلي.
Originally published on the-decoder.com




