الخطوة الأولى لفريق الذكاء الفائق
فريق الذكاء الفائق الذي تم تشكيله مؤخراً في Microsoft — مجموعة داخلية مكلفة بتطوير قدرات AI تتجاوز أداء نماذج اللغة الكبيرة الحالية — قد سلّم منتجه الأول: MAI-Image-2، وهو نموذج توليد صور من النصوص يقوم Microsoft بدمجه عبر مجموعة منتجاته بالكامل وإتاحته للمطورين من خلال منصة Azure AI عبر API.
يشير الإعلان إلى ظهور نتيجة ملموسة من قسم غامض نوعاً ما داخل Microsoft — قسم جذب موارد وعبقرية كبيرة حيث تضع الشركة نفسها لما تسميه المرحلة التالية من تطور AI. يدخل MAI-Image-2 سوقاً تنافسياً لتوليد الصور يشمل بالفعل DALL-E 3 (الذي تترخصه Microsoft من OpenAI)، و Midjourney، و Stable Diffusion، وسلسلة Imagen من Google.
ما هو MAI-Image-2
MAI-Image-2 هو نموذج توليدي من النص إلى الصورة — يدخل المستخدمون وصفاً نصياً والنموذج ينتج صورة مقابلة. تحسنت جودة وتماسك ومرونة الأسلوب لمثل هذه المخرجات بشكل كبير على مدى السنوات الثلاث الماضية، وتشمل الحالة الفنية الآن الصور الفوتوغرافية الواقعية والأساليب الفنية التي تتراوح من الرسم بالزيت إلى فن البكسل والمشاهد الإنشائية المعقدة التي كان من المستحيل توليدها تلقائياً قبل بضع سنوات فقط.
لم تصدر Microsoft مواصفات تقنية مفصلة لـ MAI-Image-2، لكن طرح النموذج عبر منتجات Microsoft يشير إلى أنه سيتم دمجه في أدوات مثل Microsoft Designer و Image Creator في Bing وربما مساعدات Copilot المدمجة في تطبيقات Office. يشير توفر API إلى أن Microsoft تنوي أيضاً التنافس على اعتماد المطورين — بناء خط أنابيب للتطبيقات الخارجية التي تستخدم MAI-Image-2 كخادم الجيل الخاص بها.
لماذا يحتاج Microsoft إلى نموذجه الخاص
تأتي القدرة الأساسية الحالية لتوليد الصور في Microsoft من خلال شراكتها مع OpenAI، عبر DALL-E 3. بناء قدرات الإنتاج الملكية يوفر لـ Microsoft عدة مزايا: الاستقلالية عن شريك قد لا تتوافق أولوياته دائماً، وتكاليف أقل لكل استدلال على نطاق واسع، والقدرة على ضبط النماذج لحالات استخدام Microsoft المحددة، وقوة المفاوضة التي تأتي مع وجود بدائل قابلة للحياة.
ولاية فريق الذكاء الفائق أوسع من توليد الصور — تشمل البحث عن بنى AI المستقبلية التي يمكن أن تتجاوز في النهاية النماذج الحالية القائمة على transformer. لكن شحن منتج يشير إلى أن الفريق يعمل بجداول زمنية للمنتج العملي بدلاً من آفاق البحث البحتة، وهو ما يغير كيف يجب على بقية صناعة AI أن تفكر في قدرات Microsoft الداخلية.
المشهد التنافسي
ميزة Microsoft هي التوزيع: يصل نظام Office إلى مئات الملايين من المستخدمين، ودمج توليد الصور مباشرة في Word و PowerPoint و Teams ينشئ نقطة دخول يمكن الوصول إليها بسهولة لا تتطلب من المستخدمين البحث عن خدمة توليد صور مستقلة. إذا كان أداء MAI-Image-2 تنافسياً مع حالة الفن الحالية، فقد تكون ميزة التوزيع مهمة أكثر من أي تمايز تقني.
قد تكون الأهمية الأوسع نطاقاً لـ MAI-Image-2 أقل عن القدرة المحددة وأكثر عن ما تشير إليه: أن Microsoft تستثمر في تطوير قدرات AI لا تسير عبر OpenAI، وأن عمل فريق الذكاء الفائق ينتج الآن نتائج مرئية للعالم الخارجي.
تم إعداد هذا المقال بناءً على التقارير من The Decoder. اقرأ المقال الأصلي.
Originally published on the-decoder.com


