يدخل Kimi K2.6 سباق النماذج المتقدمة بعرض مفتوح الأوزان

أطلقت Moonshot AI نموذج Kimi K2.6، وهو نموذج مفتوح الأوزان تقول الشركة إنه قادر على منافسة GPT-5.4 وClaude Opus 4.6 وGemini 3.1 Pro في معايير البرمجة والوكلاء. ويبرز هذا الإصدار ليس فقط بسبب ادعاءات الأداء، بل لأن Moonshot تقترن به باتجاه منتج طموح على نحو غير معتاد: تنفيذ متعدد الوكلاء على نطاق واسع.

وبحسب النص المصدر المقدم، يسجل K2.6 نتيجة 54.0 في HLE مع الأدوات، و58.6 في SWE-Bench Pro، و83.2 في BrowseComp. وتقول Moonshot إن النموذج يستطيع ربط أكثر من 4,000 استدعاء للأدوات والعمل بشكل متواصل لأكثر من 12 ساعة في لغات تشمل Rust وGo وPython. ويُوصف النموذج بأنه يواكب أفضل الأنظمة من OpenAI وAnthropic وGoogle في مهام البرمجة والوكلاء، مع تأخره في الاستدلال البحت والرؤية.

هذا المزيج من نقاط القوة والضعف كاشف. فـ K2.6 لا يحاول أن يكون كل شيء في وقت واحد. التركيز هنا على الأداء التشغيلي: مدى قدرة النموذج على تقسيم العمل، واستدعاء الأدوات، والبقاء على المهمة، ومواصلة سير العمل البرمجي أو البحثي الطويل. وهذا هو بالضبط الاتجاه الذي تتجه إليه سوق النماذج المتقدمة بصورة متزايدة، ولا سيما لدى المشترين من المؤسسات والمطورين الذين يهتمون أقل بعرض المقاييس وأكثر بما إذا كان النموذج قادرًا فعليًا على إنجاز المهمة.

الميزة الأبرز هي الحجم، لا الذكاء فقط

أكبر ادعاء من Moonshot هو Agent Swarm، وهو نظام يمكنه تشغيل ما يصل إلى 300 وكيل فرعي بالتوازي، بحيث يتولى كل وكيل ما يصل إلى 4,000 خطوة. وتقول الشركة إن النظام يفكك المهام تلقائيًا إلى مهام فرعية ويوزعها على وكلاء متخصصين. ويُوصف هؤلاء الوكلاء بأنهم يدمجون البحث على الويب وتحليل المستندات والكتابة، بهدف إنتاج مخرجات مكتملة مثل مواقع الويب والمستندات وعروض الشرائح والجداول في تنفيذ واحد.

إذا ثبتت هذه القدرات عمليًا، فستكون أهميتها كبيرة. فكثيرًا ما دار النقاش في سوق وكلاء الذكاء الاصطناعي حول ما إذا كان نموذج واحد يستطيع العمل باستقلالية. لكن Kimi K2.6 يعيد صياغة السؤال. فبدلًا من مطالبة وكيل واحد بإنجاز كل شيء، تدفع Moonshot نحو عمل منسق على مستوى النموذج، حيث تعمل عدة وكلاء بالتوازي ويدير نظام تنسيق حالات الفشل، وتسليم المهام، والتخصص.

ويذكر النص المصدر أيضًا ميزة معاينة تسمى "claw groups" تتيح للبشر وعدة وكلاء العمل معًا كفريق، مع قيام K2.6 بالتنسيق والتدخل عندما يفشل وكيل أو يتعطل. وتكتسب هذه الفكرة أهمية لأنها تشير إلى نموذج نشر أكثر واقعية: لا استقلالية كاملة، بل أسراب خاضعة للإشراف تتشارك فيها البرامج والبشر العمل.

تحدٍ أوضح للسيطرة المغلقة من النماذج المنافسة

يكتسب Kimi K2.6 أهمية إضافية لأن Moonshot تطرحه بوصفه نموذجًا مفتوح الأوزان. وفي سوق تُقدَّم فيه أقوى الأنظمة إلى حد كبير عبر واجهات API مغلقة ومنتجات اشتراك محكمة التحكم، فإن إصدارات الأوزان المفتوحة تخلق نوعًا مختلفًا من الضغط. فهي تمنح المطورين مساحة أكبر لفحص النماذج وتكييفها واستضافتها ودمجها في بنياتهم الخاصة، حتى عندما تتضمن التراخيص شروطًا.

في هذه الحالة، يُشحن النموذج تحت رخصة MIT معدلة. ويقول النص المصدر إن عمليات النشر التجارية التي تتجاوز 100 مليون مستخدم نشط شهريًا أو تحقق أكثر من 20 مليون دولار من الإيرادات الشهرية يجب أن تنسب "Kimi K2.6" بشكل واضح في واجهة المستخدم. وهذا ليس إصدارًا بلا قيود، لكنه يظل خطوة ذات معنى نحو إتاحة أوسع مقارنة بالأنظمة المتقدمة المغلقة بالكامل.

ويبدو أن الإتاحة مصممة أيضًا لتعظيم الوصول. إذ تطرح Moonshot K2.6 عبر kimi.com في وضع الدردشة والوكلاء، ومن خلال Kimi Code كأداة برمجة، وعبر API، وكتحميل مفتوح المصدر على Hugging Face. ويشير هذا الانتشار إلى أن الشركة تريد المنافسة عبر كامل مسار المطور، من التجريب إلى الإنتاج.

ما الذي تقوله عملية الإطلاق عن المرحلة التالية من الذكاء الاصطناعي

قد تكون أهم تفاصيل الإصدار هي التحول في معنى التقدم على مستوى النموذج. فـ Moonshot لا تقدم K2.6 أساسًا بوصفه روبوت محادثة أفضل، بل بوصفه نظامًا للتنفيذ الممتد. فالجولات الطويلة، والاستخدام المكثف للأدوات، والتفويض متعدد الوكلاء، والمخرجات المكتملة هي جوهر العرض.

وهذا يضع K2.6 مباشرة في المنافسة الناشئة حول تطوير البرمجيات الوكيلي. ويقول النص المصدر إن النموذج يستطيع إنشاء مواقع ويب كاملة مع رسوم متحركة واتصالات بقاعدة البيانات من أوامر نصية، كما يمكنه التعامل مع أعمال الواجهة الكاملة الأساسية مثل تسجيل المستخدمين وعمليات قاعدة البيانات وإدارة الجلسات. وما إذا كانت هذه المخرجات موثوقة بما يكفي للإنتاج مسألة منفصلة، لكن الاتجاه واضح: مزودو النماذج يريدون الآن امتلاك المسار من الأمر النصي إلى النظام العامل.

ويهم الإطار التنافسي أيضًا. فبتسمية GPT-5.4 وClaude Opus 4.6 بوصفهما نظيرين، تعلن Moonshot أن النماذج مفتوحة الأوزان لم يعد ينبغي وضعها كبدائل أرخص وأضعف فقط. بل يمكن تقديمها باعتبارها منافسين جديرين بالثقة في الفئة نفسها من الأداء، على الأقل في بعض أنواع العمل.

ولا يزال هناك قيد مهم في النص المقدم: فـ K2.6 يتراجع أمام أفضل الأنظمة في الاستدلال البحت والرؤية. وهذا يعني أن وعد النموذج يعتمد على تصميم سير العمل ودمج الأدوات أكثر من اعتماده على قدرة عامة خام. لكن قد يكون هذا هو المقصود تحديدًا. ففي التطبيقات الواقعية، قد تكون القدرة على تنسيق إجراءات أضيق كثيرة بمرور الوقت أهم من الفوز في مقارنة ذكاء عامة.

لذلك يبدو Kimi K2.6 أقل شبهاً بإطلاق نموذج تقليدي وأكثر شبهاً ببيان حول الاتجاه الذي يسير إليه تصميم منتجات الذكاء الاصطناعي: نحو وكلاء متوازيين، وتنفيذ طويل الأفق، ونماذج تُقاس بكمية العمل التي تنجزها لا بمدى إثارة انطباعها في محادثة قصيرة.

تعتمد هذه المقالة على تغطية The Decoder. اقرأ المقال الأصلي.

Originally published on the-decoder.com