كانت رسالة Google في I/O تدور حول السرعة والوكلاء وتعدد الوسائط الأوسع
استخدمت Google حدث I/O 2026 لتقديم قائمة طويلة من الإطلاقات والعروض التوضيحية وتحديثات المنتجات، لكن الإشارة الأوضح في النص المصدر المقدم تتركز حول إطلاقين في مجال الذكاء الاصطناعي: Gemini 3.5 Flash وGemini Omni. ويُظهر هذان الإطلاقان معًا الاتجاه الذي تريد Google أن يرى السوق منصتها تسير نحوه: نحو نماذج أسرع موجهة للوكلاء من أجل المطورين، ونحو أنظمة متعددة الوسائط أوسع يمكنها في النهاية تحويل أي إدخال إلى أي إخراج.
صيغ المقال الأصلي على أنه استعراض لـ100 إعلان، ما يجعله بطبيعته متباينًا بوصفه مادة إخبارية. لكن داخل تلك القائمة، يكون تموضع المنتج متماسكًا. فـGoogle لا تضيف مجرد نسخة أخرى من النموذج، بل تصف طبقة تقنية تستهدف في الوقت نفسه العمل البرمجي العملي وإنشاء الوسائط التوليدية الأكثر ثراءً.
يُطرح Gemini 3.5 Flash كرهان على السرعة والقدرة معًا
تقول Google إن Gemini 3.5 Flash هو الأول في أحدث سلسلة نماذج لديها، حيث يجمع بين ما تسميه الذكاء المتقدم والعمل. كما تقول الشركة إن النموذج متاح عمومًا عبر منصتها التطويرية، وواجهة Gemini API في Google AI Studio وAndroid Studio.
التركيز في النص المصدر لا ينصب على الجِدة وحدها، بل على تقليل المقايضة. تدعي Google أن 3.5 Flash يقدم ذكاءً يضاهي النماذج الرائدة الكبيرة مع الحفاظ على ملف الكمون المنخفض المتوقع من خط Flash. وتشير إلى تفوقه في الاختبارات المعيارية على Gemini 3.1 Pro في مهام البرمجة والمهام الوكيلية، بما في ذلك Terminal-Bench 2.1 وGDPval-AA وMCP Atlas.
هذه الإشارات إلى الاختبارات المعيارية جزء من النمط التنافسي المألوف في إعلانات الذكاء الاصطناعي، لكن الادعاء الأساسي مهم استراتيجيًا: تريد Google أن يعتقد المطورون أنهم لم يعودوا بحاجة إلى الاختيار بشكل حاد بين الجودة والسرعة. وهذا مهم خصوصًا للعمل الوكالي طويل الأفق، حيث قد يحتاج النموذج إلى التخطيط والبناء والمراجعة وإنجاز سلاسل من المهام بدلًا من توليد استجابة واحدة فقط.
ويذكر النص المصدر أيضًا أن Gemini 3.5 Flash مخصص لأعمال مثل بناء التطبيقات وصيانة قواعد الشفرة وإعداد المستندات المالية. وما إذا كانت كل حالة استخدام ستؤدي كما هو معلن سيُختبر عمليًا، لكن السوق المستهدف واضح. إنه نموذج يُقدَّم بوصفه أداة عمل، لا مجرد ترقية لشات بوت.
كما تراهن Google على توليد واجهات المستخدم والرسوميات
يقول النص المصدر إن 3.5 Flash يبني على الأساس متعدد الوسائط في Gemini 3 لتوليد واجهات ويب ورسوميات أغنى وأكثر تفاعلية. وهذا مهم لأنه يوسّع عرض النموذج من الاستدلال والبرمجة إلى جودة المخرجات الخاصة بالأصول الموجهة للمستخدم. وعمليًا، تحاول Google ربط التنفيذ الوكالي بإنشاء الواجهة الأمامية بدلًا من التعامل معهما كقدرتين منفصلتين في الذكاء الاصطناعي.
وبالنسبة للمطورين، يوحي هذا التأطير بسير عمل يمكن فيه للعائلة نفسها من النماذج أن تساعد في التفكير عبر المهام وكتابة الشفرة أو تعديلها وإنتاج مكونات تفاعلية أكثر صقلًا. إنها طموحات واسعة، لكنها تتماشى مع اتجاه الصناعة نحو أنظمة ذكاء اصطناعي يُتوقع منها أن تتولى أجزاء أكبر من العمل النهائي من البداية إلى النهاية.
Gemini Omni هو الرهان الأوسع
إذا كان Gemini 3.5 Flash إعلانًا عمليًا عن أداة، فإن Gemini Omni هو بيان الرؤية الأكثر طموحًا. تصفه Google بأنه نموذج يمكنه “إنشاء أي شيء من أي إدخال”، بدءًا من إخراج الفيديو. ووفقًا للنص المصدر، يجمع النموذج بين ذكاء Gemini وأنظمة الوسائط التوليدية لدى Google للوصول إلى مستوى جديد من فهم العالم وتعدد الوسائط والتحرير.
الطرح الأولي يركز على الفيديو، لكن Google تقول إن الهدف الأطول مدى أوسع بكثير: نظام قادر على توليد أي إخراج من أي إدخال. هذا ادعاء واسع النطاق، والمقال المقدم يعرضه كخارطة طريق لا كقدرة مكتملة. ومع ذلك، فهو يسلط الضوء على اتجاه أصبح مركزيًا في المنافسة على الذكاء الاصطناعي المتقدم. فمطورو النماذج ينتقلون من أنظمة النص والصورة إلى محركات أكثر توحيدًا يمكنها الفهم والإنتاج عبر وسائط متعددة ضمن إطار واحد.
ويذكر النص أيضًا أن Gemini Omni يتمتع بفهم محسّن لقوى فيزيائية مثل الجاذبية والطاقة الحركية وديناميكيات الموائع، إلى جانب وصوله إلى معرفة أوسع بالتاريخ والعلوم والثقافة. وفي سرد Google، يساعد ذلك على ربط الواقعية الفوتوغرافية بالسرد الهادف. وبصياغة أبسط، تقول الشركة إن الوسائط التوليدية الأفضل لا تعتمد فقط على الدقة البصرية، بل أيضًا على فهم أقوى لكيفية عمل العالم.
لماذا تهم هذه الإعلانات
حتى بعد إزالة بريق الخطاب الرئيسي السنوي والصيغة الترويجية لمراجعة تضم 100 بند، تشير الإعلانات إلى استراتيجية منتج مهمة. تحاول Google تغطية طرفي نطاق تبني الذكاء الاصطناعي في الوقت نفسه. الطرف الأول هو فائدة المؤسسات والمطورين: نماذج أسرع، ومساعدة في البرمجة، وسير عمل وكيلية، وتكامل عبر أدوات مألوفة. أما الطرف الثاني فهو الإبداع التعبيري: الفيديو، والتحرير، والتوليد متعدد الوسائط، وفي النهاية محرك تحويل أكثر شمولًا.
كما أن الإشارة إلى أن Gemini 3.5 Pro يُستخدم بالفعل داخليًا ومن المتوقع إطلاقه الشهر المقبل تضيف طبقة أخرى. فهذا يوحي بأن Google لا ترى الأمر كإطلاق واحد، بل كسلسلة سريعة من تحديثات النماذج بأدوار مختلفة في السعر والكمون والقدرة.
وبما أن النص المصدر هو ملخص Google نفسه، فيجب قراءة هذه الادعاءات بوصفها تموضعًا للمنتج وليس تحققًا مستقلاً من الأداء. لكن حتى على هذا الأساس، يكون الاتجاه واضحًا. تريد Google من المطورين والمبدعين أن ينظروا إلى Gemini بوصفه منصة مركزية بشكل متزايد للبناء والعمل والتوليد والتحرير عبر الوسائط المختلفة.
لذلك، قد يكون الجزء الأكثر تأثيرًا في I/O 2026 أقل ارتباطًا بعدد الإعلانات نفسه وأكثر ارتباطًا بالبنية الكامنة خلفها: نماذج سريعة للأعمال الوكيلية، وتوليد مخرجات أغنى، ودفع معلن نحو أنظمة تتولى مزيدًا من سير العمل من الإدخال حتى المنتج النهائي.
هذه المقالة مستندة إلى تغطية Google AI Blog. اقرأ المقال الأصلي.
Originally published on blog.google



