تدفع Google توليد الصور بالذكاء الاصطناعي نحو السياق الشخصي بدلًا من تعقيد الأوامر
تطرح Google ميزات جديدة في تطبيق Gemini تستخدم ما تسميه Personal Intelligence إلى جانب Google Photos ونموذج Nano Banana 2 لإنشاء صور أكثر تخصيصًا. والفكرة الأساسية بسيطة: بدلًا من الاعتماد على أوامر طويلة ومكتوبة بعناية أو على عمليات رفع يدوية متكررة، يمكن للتطبيق استخدام تفضيلات الشخص المخزنة ومكتبة الصور المتصلة لديه لتوليد صور ترتبط أكثر بحياته.
وقالت الشركة إن الميزة تُطرح على مدى عدة أيام للمشتركين في الولايات المتحدة في خطط Google AI Plus أو Pro أو Ultra. وتقول Google إن المستخدمين سيتمكنون من طلب مشاهد تشملهم هم أو أحباءهم، مع قيام Gemini بالاستفادة من السياق ذي الصلة في الحسابات المتصلة.
التحول في المنتج من التوليد العام إلى التوليد الفردي
لا تزال معظم أدوات الصور بالذكاء الاصطناعي السائدة تعتمد بدرجة كبيرة على الصياغة الصريحة للأوامر. يصف المستخدمون الموضوع والمشهد والأسلوب وأي تفاصيل مرجعية يريدون الحفاظ عليها. أما تحديث Google فيتجه في مسار مختلف. فالشركة تحاول تقليل عبء التحديد من خلال السماح لـ Gemini باستنتاج المزيد من سياق المستخدم الحالي.
وهذا مهم لأنه يغيّر ما الذي يُعدّ جودة للمنتج. في مولد الصور التقليدي، غالبًا ما تُقاس الجودة بالدقة البصرية أو بالتحكم الأسلوبي. أما في المولد الشخصي، فتصبح الصلة بالسياق لا تقل أهمية. فالنتيجة المفيدة ليست مجرد صورة مصقولة تقنيًا، بل صورة تعكس الأشخاص والتفضيلات وتفاصيل الخلفية الصحيحة مع قدر أقل من التعقيد في الإعداد.
وتقول Google عمليًا إن مستقبل الذكاء الاصطناعي التوليدي للمستهلكين لا يتعلق فقط بجعل النماذج أكثر قدرة بشكل مجرد. بل يتعلق أيضًا بجعلها أكثر إدراكًا للمستخدم الذي يقف وراء الطلب. وتمثل Personal Intelligence الإطار الذي تقدمه الشركة لهذه الفكرة داخل Gemini.
تصبح Google Photos مدخلًا مباشرًا إلى الناتج الإبداعي
أحد أبرز أجزاء الإعلان هو التكامل مع Google Photos. وتقول الشركة إن المستخدمين يمكنهم إدراج أنفسهم وأحبائهم في الصور المولدة من خلال ربط مكتبات صورهم، كما يمكنهم استبدال الصور المرجعية أو تحسين النتائج إذا لم تكن المخرجات الأولى مناسبة.
وهذه خطوة مهمة على مستوى المنتج لأن مكتبات الصور تحتوي تحديدًا على ذلك النوع من السياق البصري الشخصي والدائم الذي تفتقر إليه عادة أنظمة الذكاء الاصطناعي العامة. ومن خلال الاستفادة من هذا السياق، يمكن لـ Gemini الانتقال من إنتاج صور معقولة لـ“عائلة” أو لـ“شخص يشبهني” إلى إنشاء شيء أكثر ارتباطًا بحياة المستخدم الفردية على نحو محدد.
وفي الوقت نفسه، ترفع الميزة سقف الثقة والتعامل مع البيانات الشخصية. وتتناول Google هذه النقطة مباشرة في الإعلان، قائلة إن Gemini لا يدرّب نماذجه على مكتبة الصور الخاصة بالمستخدم. وهذا الضمان أساسي لطرح المنتج. فالأداة التي تصبح أكثر فائدة عندما تصبح أكثر شخصية، تصبح أيضًا أكثر حساسية بحكم التعريف.
لماذا يهم ذلك في المنافسة الأوسع في مجال الذكاء الاصطناعي
يُظهر هذا التحديث أين تتنافس الآن منصات الذكاء الاصطناعي الاستهلاكية الكبرى: ليس فقط على أداء النموذج، بل على ميزة المنظومة. لدى Google أفضلية طبيعية في هذا النوع من المنتجات لأنها موجودة بالفعل داخل خدمات يعتمد عليها كثير من المستخدمين يوميًا، بما في ذلك Photos وإشارات التفضيلات الأوسع على مستوى الحساب. وهذا يعني أنها تستطيع بناء ميزات تخصيص من دون مطالبة المستخدمين بإنشاء طبقة بيانات جديدة من الصفر.
وهذا مهم استراتيجيًا. فمنتجات الذكاء الاصطناعي للمستهلكين تسعى بشكل متزايد إلى أن تصبح مساعدين دائمين بدلًا من مولدات لمرة واحدة. ولتحقيق ذلك جيدًا، تحتاج إلى ذاكرة وسياق وإلى الوصول إلى أنواع المعلومات التي يخزنها الناس بالفعل عبر الخدمات الرقمية. وتندرج ميزات الصور الجديدة في Gemini ضمن هذا التحول الأكبر من مربع أوامر معزول إلى مساعد غني بالسياق.
كما يبرز هذا الطرح كيفية تغليف التوليد متعدد الوسائط للاستخدام الجماهيري. لا تقدمه Google باعتباره مجموعة إبداعية احترافية تتطلب هندسة أوامر واسعة. بل تقدمه كتجربة أخف وأكثر تلقائية: اطلب مشهدًا، ودع النظام يستخدم سياقك، ثم عدّل إذا لزم الأمر. ومن المرجح أن يكون هذا النوع من التبسيط ساحة معركة رئيسية لاعتماد الجمهور الواسع.
الفرصة الإبداعية تأتي مع حدود عملية
يؤكد الإعلان سهولة الاستخدام والتخصيص، لكنه يوضح أيضًا أن المستخدمين يظلون متحكمين في عملية التحسين. إذ يمكنهم تعديل المخرجات واستبدال الصور المرجعية. وهذا يشير إلى أن Google تدرك أن المولد المدرك للسياق لن يتخذ دائمًا القرارات الصحيحة من المحاولة الأولى. فالتخصيص يقلل الاحتكاك، لكنه لا يلغي التكرار.
كما أن الميزة محدودة، على الأقل في البداية، بالمشتركين في الولايات المتحدة على خطط Google AI محددة. وهذا يعني أن الطرح ليس تغييرًا شاملًا في المنصة بعد. إنه قدرة منتج متدرجة مرتبطة بالوصول المدفوع، وهو ما يتسق مع الطريقة التي تُطرح بها كثير من ميزات الذكاء الاصطناعي الرائدة تجاريًا.
ومع ذلك، فإن أهمية التحديث أكبر من قاعدة المشتركين الفورية. فGoogle تختبر نموذجًا لتوليد الصور بالذكاء الاصطناعي يعامل السياق الشخصي كمدخل أساسي لا كتحسين اختياري. وإذا استجاب المستخدمون بشكل جيد، فقد يحدد المنطق نفسه أشكالًا أخرى من الإبداع متعدد الوسائط أيضًا.
وبهذا المعنى، فهذه ليست مجرد تحديث لتوليد الصور. إنها إشارة إلى الوجهة التي تتجه إليها منتجات الذكاء الاصطناعي للمستهلكين. ومن المرجح أن تُعرّف المرحلة التالية بدرجة أقل من خلال من يستطيع إنتاج الصورة الأكثر إبهارًا من أمر مثالي، وبدرجة أكبر من خلال من يستطيع جعل التوليد يبدو متجذرًا بشكل طبيعي في حياة المستخدم الخاصة مع الحفاظ على الخصوصية والتحكم. وتحاول Google تمهيد Gemini لهذا التحول بالضبط.
يعتمد هذا المقال على تغطية Google AI Blog. اقرأ المقال الأصلي.
Originally published on blog.google



