جوجل توسع Gemini من روبوت محادثة إلى مساعد لنظام التشغيل
تدفع جوجل مشروع Gemini الخاص بها إلى عمق أكبر في تفاصيل الاستخدام اليومي لنظام Android، منتقلَةً من مساعد ذكاء اصطناعي مستقل إلى برمجيات يمكنها مساعدة المستخدمين على تنفيذ المهام عبر التطبيقات والخدمات. وقبل مؤتمر Google I/O، كشفت الشركة عن مجموعة من الميزات الجديدة تحت مظلة Gemini Intelligence، والمصممة لأتمتة الإجراءات متعددة الخطوات، وتحسين التعبئة التلقائية، وتلخيص محتوى الويب، وتحويل المدخلات الصوتية الخام إلى نص مكتوب أكثر صقلًا.
ومن المقرر أن يبدأ الإطلاق الأول هذا الصيف على Samsung Galaxy S26 وGoogle Pixel 10، وفقًا لإعلان الشركة الذي استند إليه النص المصدر. وقالت جوجل أيضًا إن دعم الأجهزة الأوسع مخطط له لاحقًا هذا العام، بما في ذلك الساعات الذكية والسيارات وسماعات الرأس وأجهزة الكمبيوتر المحمولة. وهذه الجداول الزمنية مهمة لأنها تشير إلى أن جوجل لا تتعامل مع هذه الميزات كتجربة هامشية، بل تصوغ Gemini كطبقة يمكن أن تمتد عبر منظومة Android وتصبح تدريجيًا جزءًا من كيفية تنقل الناس بين أجهزتهم وخدماتهم.
من الإجابات إلى الأفعال
أهم تغيير هو أن Gemini يُقدَّم الآن بوصفه نظامًا لا يقتصر على توليد الردود، بل يمكنه إنجاز المهام. وتقول جوجل إن المساعد سيكون قادرًا على التعامل مع إجراءات مثل حجز الرحلات أو نقل قائمة تسوق من تطبيق الملاحظات إلى عربة التسوق. وتشير هذه الأمثلة إلى نموذج للذكاء الاصطناعي الاستهلاكي يعتمد على التنسيق لا على المحادثة وحدها. فالقيمة ليست فقط في أن يفهم الذكاء الاصطناعي الطلب، بل في قدرته على ترجمة النية إلى سلسلة من الخطوات عبر واجهات متعددة.
أصبح هذا التحول واحدًا من أهم ميادين المنافسة في الذكاء الاصطناعي. فروبوتات المحادثة تستطيع الإجابة عن الأسئلة، وتلخيص النصوص، وصياغة الرسائل، لكن المستخدمين غالبًا ما يظلون مضطرين إلى النقر بين الصفحات، ونسخ التفاصيل، وإنهاء الإجراءات بأنفسهم. ومن خلال تضمين سلوك أقرب إلى الوكيل داخل Android مباشرة، تحاول جوجل سد هذه الفجوة وجعل مساعدها مفيدًا في اللحظات التي تكون فيها الاحتكاكات الرقمية في أعلى مستوياتها.
Chrome وGboard يتحولان إلى حقول اختبار
يظهر مثالان واضحان داخل Chrome وGboard. ففي Chrome، سيقوم Gemini بتلخيص محتوى الويب والمساعدة في تعبئة النماذج المعقدة. وتقول جوجل إن سلوك تعبئة النماذج لن يكون نشطًا إلا عندما يفعله المستخدمون صراحةً، وهي تفصيلة توحي بأن الشركة تتوقع تدقيقًا يتعلق بالخصوصية والتحكم ومخاطر الأخطاء. تُعد النماذج هدفًا طبيعيًا لأتمتة الذكاء الاصطناعي لأنها متكررة وتستغرق وقتًا، لكنها تتعامل أيضًا مع بيانات شخصية ولا تتحمل الأخطاء كثيرًا. ومن خلال إبقاء الميزة اختيارية، تبدو جوجل وكأنها توازن بين الراحة وطمأنة المستخدمين إلى أن الأتمتة لن تستولي بصمت على المهام الحساسة.
أما Gboard فسيحصل على ميزة تسمى Rambler، تحول الأفكار المنطوقة وغير المصقولة إلى رسائل نصية أوضح. ووفقًا للمصدر، يمكن لهذه الميزة دعم عدة لغات في الوقت نفسه. وقد يجعلها ذلك مفيدة بشكل خاص في المناطق أو الأسر متعددة اللغات، حيث ينتقل الناس طبيعيًا بين اللغات في منتصف الجملة. كما يعكس ذلك اتجاهًا أوسع في واجهات الذكاء الاصطناعي: إذ تهدف الأنظمة بشكل متزايد إلى تقليل الجهد المطلوب لتحويل المدخلات البشرية غير المرتبة إلى شيء قابل للعرض، بدلًا من مطالبة المستخدمين بالتحدث أو الكتابة بصيغ صارمة.
التخصيص بوصفه أمرًا مباشرًا
ميزة أخرى، Create My Widget، موجهة إلى تخصيص الواجهة. يمكن للمستخدمين وصف نوع الودجت الذي يريدونه، مثل ودجت يركز على اقتراحات الوصفات أو معلومات طقس محددة، ثم يقوم النظام بإنشائه. وعلى السطح، يبدو هذا الإعلان أصغر من أتمتة مهام الذكاء الاصطناعي. لكنه يوضح كيف تتعامل جوجل مع اللغة الطبيعية بوصفها طبقة تحكم جديدة في إنشاء البرمجيات. فبدلًا من التنقل عبر القوائم أو أدوات التصميم، يصف المستخدم عنصر الواجهة ويترك للنظام مهمة تركيبه.
إذا نجح هذا النهج بشكل موثوق، فقد يخفض عتبة تخصيص الأجهزة ويمنح Android نقطة تمايز أخرى. ولسنوات، كان Android يتنافس جزئيًا بفضل مرونته. والسماح للناس بإنشاء عناصر واجهة وظيفية عبر الوصف يوسّع تلك الهوية إلى عصر الذكاء الاصطناعي.
خطوة تنافسية قبل Google I/O
التوقيت لافت أيضًا. فالمصدر يربط دفع Gemini Intelligence بسعي جوجل إلى تضييق الفجوة مع OpenAI وAnthropic في سوق وكلاء الذكاء الاصطناعي. وهذا السوق يتحدد بشكل متزايد بالأنظمة التي تفعل أكثر من مجرد إنتاج النص. فالشركات تتسابق لبناء مساعدين قادرين على التنقل في البرمجيات، واسترجاع المعلومات، واتخاذ إجراءات ذات معنى مع تدخل محدود من المستخدم.
ويشير قرار جوجل في أوائل مايو بإيقاف وكيل المتصفح التجريبي Project Mariner ودمج تقنيته في Gemini Agent الجديد إلى وجود توحيد داخلي حول استراتيجية أكثر اتساقًا. فبدلًا من إبقاء القدرات التجريبية للوكيل منفصلة، يبدو أن جوجل تدمجها في حزمة الذكاء الاصطناعي الاستهلاكية الرئيسية لديها. وقد يكون لمثل هذا التوحيد أهمية لا تقل عن جودة النموذج نفسه، لأن المستخدمين يميلون إلى تبني الميزات التي تظهر في الأماكن التي يعملون فيها أصلًا، مثل لوحات المفاتيح والمتصفحات وأنظمة التشغيل.
لماذا يهم هذا الإطلاق
لا تثبت هذه الإعلانات أن وكلاء الذكاء الاصطناعي أصبحوا مسألة محلولة. فما زالت الأتمتة الواقعية تصطدم بواجهات هشة، ونوايا مبهمة للمستخدم، ومخاطر تنفيذ إجراءات خاطئة. لكن تحديث جوجل يشير إلى أن الصناعة تدخل مرحلة أكثر عملية. فالمجال يتحول من إثبات أن النماذج تثير الإعجاب في العروض التوضيحية، إلى دمجها في الروتينات التي يكررها الناس كل يوم.
إذا سار الإطلاق بسلاسة، فقد يبدأ مستخدمو Android في التعامل مع الذكاء الاصطناعي أقل بوصفه وجهة، وأكثر بوصفه بنية تحتية خلفية: أداة تلخيص في المتصفح، ومصححًا في لوحة المفاتيح، ومساعدًا في تدفقات التجارة، ومولدًا لمكونات واجهة مخصصة. وسيكون ذلك خطوة ملموسة في تبني الذكاء الاصطناعي الاستهلاكي لأنه يربط الذكاء بالمنفعة بدلًا من الجِدة.
- تقول جوجل إن Gemini Intelligence ستنطلق أولًا على Galaxy S26 وPixel 10 هذا الصيف.
- الميزات الجديدة تستهدف الأتمتة، والتلخيص، وصياغة الرسائل، وإنشاء الودجتات.
- هذه الخطوة تضع Gemini بصورة أوضح في مواجهة الشركات الأخرى التي تطور وكلاء ذكاء اصطناعي قادرين على العمل عبر البرمجيات.
هذه المقالة مبنية على تغطية The Decoder. اقرأ المقال الأصلي.
Originally published on the-decoder.com
