OpenAI تطلق GPT-5.5 للبرمجة والبحث والعمل بالبيانات على نمط الوكلاء

النموذج التالي من OpenAI موجّه مباشرة إلى العمل الذاتي

أعلنت OpenAI عن GPT-5.5، ووصفتْه بأنه نموذج مخصص لـ“العمل الحقيقي” ولتشغيل وكلاء قادرين على إنجاز مهام أطول مع حاجة أقل إلى التوجيه المستمر. واستنادًا إلى المادة المصدرية المقدمة، تضع الشركة النموذج ضمن وعد مألوف لكنه لا يزال صعبًا في مجال الذكاء الاصطناعي: الانتقال من الردود الحوارية إلى أنظمة تستطيع فهم الهدف، وجمع السياق، واستخدام الأدوات، والتعافي من الغموض، ومواصلة العمل حتى اكتمال المهمة.

ويتضمن الإصدار أيضًا GPT-5.5 Pro، وهو إصدار أكثر قدرة تقول OpenAI إنه مخصص للأعمال الأعلى دقة. وذكرت التقارير أن النموذجين كانا متاحين لمستخدمي ChatGPT وCodex المشتركين، مع إضافة الوصول عبر واجهة API اعتبارًا من 25 أبريل 2026. ويذكر النص المصدر أن كل نموذج يأتي بنافذة سياق تبلغ مليون token، وهي مواصفة تشير إلى أن OpenAI تستهدف المهام متعددة الخطوات التي تتطلب قدرًا كبيرًا من السياق العملي بدلًا من الطلبات المنفصلة.

أين تقول OpenAI إن المكاسب تتركز

وفقًا للنص المصدر، ترى OpenAI أن أكبر التحسينات تتركز في أربعة مجالات: البرمجة الوكالية، واستخدام الحاسوب، والعمل المعرفي، والأبحاث العلمية المبكرة. وتكتسب هذه الفئات أهمية لأنها كلها تتضمن مزيجًا من التخطيط، واختيار الأدوات، والتكرار، والتحقق. فالنموذج الذي يحقق أداءً جيدًا في اختبار معياري لمرة واحدة ليس بالضرورة موثوقًا عندما يتعين عليه البحث والمراجعة وتنسيق الإجراءات عبر عدة خطوات.

ويؤكد وصف OpenAI لـ GPT-5.5 على هذه الحلقة التشغيلية الأوسع بالضبط. ويُقدَّم النموذج على أنه قوي بشكل خاص في كتابة الشيفرة وتصحيحها، وإجراء البحث على الويب، وتحليل البيانات، وإنشاء المستندات وجداول البيانات، وتشغيل البرمجيات. وبعبارة أخرى، لا تروّج الشركة لجواب أفضل فحسب، بل لإنجاز أفضل للمهمة.

وقد أصبحت هذه الفوارق مهمة بشكل متزايد مع تنافس شركات الذكاء الاصطناعي ليس فقط على نتائج الاختبارات المعيارية، بل على ما إذا كانت نماذجها يمكن دمجها في سير عمل يوفر وقتًا ملموسًا. وبالنسبة للمشترين من المؤسسات وفرق البرمجيات، فإن الفرق بين نموذج يقدم اقتراحًا مفيدًا وآخر يستطيع إكمال سلسلة متماسكة من الإجراءات هو فرق ذو أهمية تجارية.

OpenAI says "chat is dead" and plans to rebuild ChatGPT as a full-blown agent app

OpenAI Declares 'Chat is Dead,' Plans to Rebuild ChatGPT as a Full-Blown Agent App

OpenAI is overhauling ChatGPT into a 'superapp' that bundles coding tools, AI agents, and partner integrations like Canva and Booking.com, moving beyond simple chat.

Read article

الاختبارات المعيارية تشير إلى مكاسب، لكن من دون هيمنة شاملة

يقول النص المصدر المقدم إن OpenAI تدّعي أن GPT-5.5 يتفوق على منافسين كبار، منهم Claude Opus 4.7 من Anthropic وGemini 3.1 Pro من Google، في اختبارات معيارية رئيسية، خصوصًا في البرمجة والرياضيات المتقدمة، مع الحفاظ على السرعة. وفي الوقت نفسه، لا يعرض التقرير النموذج على أنه لا يُهزم في كل فئة. بل يقول إن GPT-5.5 لا يتصدر في جميع المجالات.

هذه الصياغة لافتة. فهي توحي بأن المشهد التنافسي لا يزال متقاربًا، مع تبادل الشركات للفوز عبر أحمال عمل مختلفة بدلًا من تحقيق تقدم حاسم في كل مكان. كما يستشهد النص باختبارات مستقلة من Artificial Analysis، التي وضعت GPT-5.5، بحسب ما ورد، في الصدارة الإجمالية بفارق طفيف، مع الإشارة أيضًا إلى ضعف في الهلاوس. وهذا المزيج ينسجم مع النمط الأوسع في سوق النماذج الحالية: الاستدلال الأقوى والقدرة الأوسع لا يزيلان تلقائيًا مشكلات الموثوقية.

وبالنسبة للمستخدمين الذين يقيّمون النموذج، فإن هذا التمييز مهم. فالمكسب الأبرز ليس مجرد أن GPT-5.5 أكثر قدرة، بل إن OpenAI تبدو وكأنها تحاول تجميع القدرة والسرعة واستخدام الأدوات في ملف وكيل أكثر جاهزية للإنتاج. وما إذا كان ذلك سيصمد في التطبيقات الفعلية سيعتمد على معدلات الفشل، والتكلفة، وكمية الإشراف البشري التي ستظل مطلوبة عمليًا.

الأسعار الأعلى تبرز اقتصاديات الذكاء الاصطناعي الوكالي

يحمل الإطلاق أيضًا رسالة تسعيرية. ويذكر النص المصدر أن OpenAI طرحت GPT-5.5 بسعر API أعلى نظريًا بنحو الضعف، لكن التحليل المستقل أشار إلى أن التكاليف الفعلية قد تكون أقرب إلى زيادة تقارب 20 في المئة فوق GPT-5.4، لأن انخفاض استخدام الـ token لكل مهمة قد يعوض جزءًا من الزيادة. وهذا الفرق مهم لأن الشركات لا تشتري الأسعار الاسمية بمعزل عن غيرها، بل تشتري العمل المفيد المنجز لكل دولار يُنفق.

وتعقّد النماذج الوكالية هذه المعادلة. فقد يظل النموذج الأعلى تكلفة جذابًا إذا خفّض إعادة المحاولات، أو قلّل تكاليف الإشراف، أو أنجز المهام في عدد أقل من الخطوات. لكن ارتفاع الأسعار الاسمية يرفع أيضًا سقف التوقعات. وسيترقب المشترون مكاسب أوضح في الإنتاجية، خاصة في سير العمل الخاص بالبرمجة والتحليل حيث يمكن للفرق مقارنة جودة المخرجات مباشرة.

وتعزز نافذة السياق البالغة مليون token حجة OpenAI بأن GPT-5.5 مخصص للمهام الأكبر لا للمحادثات الضيقة. غير أن السياق الكبير لا يكتسب قيمة تجارية إلا إذا استطاع النموذج استخدامه بفاعلية والبقاء مرتبطًا بالواقع مع تطور المهمة. وإلا فإنه يصبح مجرد مواصفة مكلفة بدلًا من أن يكون ميزة تشغيلية.

Microsoft Hacked to Deliver Malware to Claude and Gemini Users

Microsoft Shuts Down 70+ GitHub Repos After Hackers Plant Malware Targeting AI Coding Agents

Microsoft disabled over 70 GitHub repositories after hackers injected malware that steals credentials from AI coding tools like Claude Code and Gemini CLI.

Read article

لماذا يهم هذا الإطلاق

يبدو GPT-5.5 أقل كونه تحديثًا روتينيًا للنموذج وأكثر كونه بيانًا حول الاتجاه الذي تعتقد شركات الذكاء الاصطناعي الرائدة أن السوق يتجه إليه. تراهن OpenAI على أن الطبقة التنافسية التالية ستُعرَّف بالنماذج القادرة على العمل عبر الأدوات والحفاظ على سير عمل أطول، لا بالنماذج التي تولد نصًا مصقولًا فقط.

إذا صح هذا الرهان، فقد يواصل مركز الثقل في تصميم منتجات الذكاء الاصطناعي الانتقال من واجهات الدردشة إلى أنظمة الوكلاء المدمجة في بيئات التطوير والبرمجيات التجارية وأدوات البحث والعمليات الداخلية. والسؤال الأساسي لم يعد فقط مدى جودة إجابة النموذج، بل مدى جودة عمله.

استنادًا إلى الأدلة الواردة في المادة المقدمة، فإن GPT-5.5 هو أحدث محاولة من OpenAI لتحويل هذه الفكرة إلى طبقة منصة قابلة للبيع. وستُقاس أهميته الحقيقية ليس بلغة الإعلان، بل بما إذا كان المستخدمون سيجدون أنه يحتاج إلى توجيه أقل فعلًا بينما يقدم نتائج أكثر موثوقية عبر المهام الطويلة والمعقدة.

هذه المقالة مبنية على تقرير The Decoder. اقرأ المقال الأصلي.

Originally published on the-decoder.com