أصبح Android منصة أكثر نشاطًا للذكاء الاصطناعي
تستعد Google لدفع أوسع لـ Gemini على Android، متجاوزةً كونه مجرد روبوت دردشة مستقل ليتعمق أكثر داخل نظام التشغيل نفسه. وقبل مؤتمر المطورين Google I/O، أعلنت الشركة عن Gemini Intelligence، وهي مجموعة من الميزات المدعومة بالذكاء الاصطناعي والمصممة لإدخال Gemini بشكل أكثر مباشرة في الاستخدام اليومي على الهاتف المحمول.
صياغة Google واضحة: الهدف ليس فقط الرد على الطلبات، بل مساعدة المستخدمين على إنجاز الأمور بشكل استباقي عبر التطبيقات والخدمات. وتقول الشركة إن Gemini Intelligence ستجلب ما تسميه أفضل ما في Gemini إلى أجهزتها الأكثر تقدمًا عبر مزيج من العتاد والبرمجيات المتميزة.
هذه اللغة مهمة لأنها تشير إلى اتجاه مألوف في الذكاء الاصطناعي الاستهلاكي. فالمنافسة تنتقل من سؤال من يملك روبوت دردشة إلى من يستطيع دمج الذكاء الاصطناعي في الإجراءات الروتينية. ووفقًا لرواية Google، أصبح Android ساحة اختبار لهذا التحول.
من مساعد إلى منفذ
أكثر مجموعة ميزات تأثيرًا هي أتمتة المهام. وصفت Google Gemini Intelligence بأنه قادر على التعامل مع أنشطة تمتد عبر عدة تطبيقات، وهي خطوة نحو النموذج الوكيلي الذي ألمحت إليه كثير من شركات المنصات الكبرى خلال الأشهر الماضية.
الأمثلة التي اختارتها Google عملية أكثر من كونها استعراضية. فقد يساعد النظام المستخدمين في حجز دراجة في الصف الأمامي لحصة سبين، والعثور على منهج مقرر داخل Gmail، ثم وضع الكتب المطلوبة في سلة تسوق. كما يمكنه التقاط صورة لقائمة مشتريات وإضافة العناصر المقابلة إلى سلة Instacart.
تشير هذه الأمثلة إلى أن Google تراهن على أن الراحة، لا المحادثة، ستكون الحجة الأكثر إقناعًا للمستهلكين بشأن الذكاء الاصطناعي على الهواتف. إذا عملت الميزة بشكل موثوق، فإنها تقلل عدد النقرات والتبديلات بين التطبيقات اللازمة للانتقال من النية إلى الفعل. وإذا عملت بشكل غير متسق، فقد تحوّل المهام اليومية العادية إلى إخفاقات أتمتة غير واضحة.
النقطة الاستراتيجية واضحة في كلتا الحالتين. تريد Google أن يعمل Gemini داخل البرمجيات، لا أن يتحدث عنها فقط.
Rambler والمرحلة التالية من الإدخال الصوتي
ميزة أخرى بارزة هي Rambler، وهي أداة تحويل الكلام إلى نص صُممت للتعامل مع أنماط الكلام الطبيعية، بما في ذلك كلمات الحشو والتكرار. وبدلاً من مطالبة المستخدمين بالإملاء بشكل مصقول، تقول Google إن Rambler يمكنه تحديد الأجزاء المهمة مما قيل وصياغتها في رسالة موجزة.
قد يبدو ذلك تحسينًا تدريجيًا، لكنه يعالج نقطة ضعف حقيقية في واجهات الصوت. كثير من الناس لا يتحدثون بجمل نظيفة جاهزة لوضع علامات الترقيم. إنهم يصححون أنفسهم في الوقت الحقيقي، ويكررون العبارات، ويبتعدون عن الفكرة قبل الوصول إليها. وقد يجعل نظام قادر على استخلاص هذا النوع من الكلام بوضوح الإدخال الصوتي أكثر فائدة في سياقات المراسلة وتدوين الملاحظات.
وتقول Google أيضًا إن Rambler يمكنه التبديل بين لغات مختلفة داخل الرسالة نفسها. وتعكس هذه الميزة كيفية عمل التواصل متعدد اللغات في الواقع، خاصة في المناطق التي يكون فيها التبديل بين اللغات أمرًا عاديًا لا استثنائيًا.
وأضافت الشركة أيضًا إشارة إلى الخصوصية، قائلة إن Rambler يوضح بجلاء متى يكون مفعلاً، وأن الصوت يُستخدم فقط للنسخ الفوري ولا يتم تخزينه أو حفظه.
البيانات الشخصية، وضوابط الاشتراك، واتساع دور المتصفح
تعمل Google أيضًا على توسيع الملء التلقائي المدعوم بالذكاء الاصطناعي عبر Gemini Intelligence. ويمكن للنظام ملء النماذج وحقول النص نيابةً عن المستخدم بالاعتماد على Personal Intelligence، وهي طبقة اشتراك اختياري تمنح Gemini الوصول إلى معلومات مثل سجل YouTube وسجلات بحث Google.
ومن المرجح أن يكون هذا أحد أكثر أجزاء الإطلاق إثارة للجدل. فمن ناحية، يصبح الملء التلقائي أكثر فائدة عندما يعرف سياق المستخدم. ومن ناحية أخرى، تثير هذه العمق السياقي المخاوف المتوقعة بشأن مقدار ما ينبغي للمساعد الشخصي معرفته، ومدى ارتياح المستخدمين لتسليم تلك البيانات. ورد Google هو التأكيد على أن الميزة اختيارية بالكامل.
كما يتجه Gemini أعمق داخل Chrome على Android. وتقول Google إن المساعد سيكون قادرًا على تلخيص ومقارنة المحتوى عبر الويب، على غرار تجارب سطح المكتب، وسيحصل على قدرة تصفح تلقائي يمكنها أتمتة المهام القائمة على المتصفح مثل حجز موعد.
يمتد بذلك المنطق التشغيلي نفسه من التطبيقات إلى الويب: يجري وضع الذكاء الاصطناعي كطبقة تنفيذ بين المستخدمين والواجهات التي بُنيت أصلًا للتنقل اليدوي.
طرح متدرج مع دلالات أوسع
تقول Google إن الميزات الجديدة ستصل على مراحل، بدءًا من أحدث هواتف Samsung Galaxy وGoogle Pixel. كما أشارت إلى أن بعض القدرات المرتبطة بـ Chrome متوقعة في يونيو.
ويؤكد الطرح المتدرج حقيقة مهمة في سوق الذكاء الاصطناعي الحالي. فحتى عندما تصف الشركات التحسينات البرمجية بعبارات عامة، فإنها غالبًا ما تطلقها أولًا كميزات للأجهزة المتميزة. وقد يساعد ذلك في ضبط توقعات الأداء ومتطلبات العتاد، لكنه يعني أيضًا أن المرحلة التالية من ذكاء الهواتف قد تكون متاحة في البداية لشريحة أضيق من المستخدمين.
ومع ذلك، تمثل هذه الإعلانات تحولًا واضحًا في الاتجاه. فلم يعد Gemini يُقدَّم أساسًا كمساعد اختياري يقف إلى جانب Android. بل يجري نسجه في السلوكيات المحمولة الأساسية: الكتابة، والتصفح، والتسوق، والجدولة، والتنسيق بين التطبيقات.
أما ما إذا كان المستخدمون سيتقبلون ذلك، فيعتمد على سؤالين لم يُحسما بعد. الأول هو الموثوقية. فالادعاءات الوكيلية لا تكون مقنعة إلا عندما يستطيع النظام إكمال المهام بدقة ويمكن التنبؤ بها. والثاني هو الثقة. فكلما أصبحت هذه الأنظمة أكثر قدرة، زادت حاجتها إلى الوصول إلى السياق الشخصي، وزاد على المستخدمين أن يقرروا ما إذا كانت هذه المقايضة تستحق ذلك.
وقد اختارت Google المضي قدمًا في كلا المسارين في الوقت نفسه. وهذا يجعل Gemini Intelligence من أهم تغييرات Android التي تستحق المتابعة، ليس لأنه يثبت أن الذكاء الاصطناعي المحمول قد اكتمل، بل لأنه يوضح مدى العدوانية التي تريد بها شركات المنصات اليوم أن يختفي الذكاء الاصطناعي داخل نظام التشغيل ويبدأ بالتصرف نيابةً عن المستخدم.
هذه المقالة مستندة إلى تقرير من Gizmodo. اقرأ المقال الأصلي.
Originally published on gizmodo.com

