GPT-5.5 يطابق Mythos Preview في اختبارات الأمن السيبراني للذكاء الاصطناعي في المملكة المتحدة

GPT-5.5 يطابق Mythos Preview في اختبارات الأمن السيبراني البريطانية، متحديًا الفجوة بين الضجة والواقع

تشير نتائج جديدة من معهد أمن الذكاء الاصطناعي في المملكة المتحدة إلى أن GPT-5.5 من OpenAI يقدم أداءً يقارب أداء Mythos Preview من Anthropic، الخاضع لقيود شديدة، في تقييمات أمن سيبراني رئيسية.

DT Editorial AI

May 3, 2026·3 min read·806 words

نتائج معيارية جديدة تضيق الفجوة بين سرديات أمان الذكاء الاصطناعي والأداء المقاس

تُربك اختبارات الأمن السيبراني الجديدة الصادرة عن معهد أمن الذكاء الاصطناعي في المملكة المتحدة واحدة من أكثر السرديات صخبًا في الذكاء الاصطناعي المتقدم خلال الفترة الأخيرة: فكرة أن Mythos Preview من Anthropic يمثل تهديدًا سيبرانيًا أعلى بشكل فريد. ووفقًا للنتائج الجديدة، وصل GPT-5.5 من OpenAI إلى مستوى أداء مماثل في التقييمات السيبرانية للمعهد، ما يشير إلى أن Mythos قد يكون أقل من كونه قفزة منفردة، وأكثر من كونه علامة على تقدم أوسع في النماذج.

هذا هو الاستنتاج المركزي الذي نقلته Ars Technica استنادًا إلى نتائج AISI. وتكمن أهميته في أن Anthropic كانت قد شددت سابقًا على الخطر غير المعتاد الذي يمثله Mythos Preview في الأمن السيبراني، وقيّدت إطلاقه الأولي على شركاء صناعيين أساسيين. المقارنة الجديدة لا تقول إن هذه المخاطر غير حقيقية، بل تقول إن قدرات مماثلة قد تكون تظهر بالفعل عبر نماذج رائدة أخرى مع تحسن الاستقلالية طويلة الأمد والاستدلال والبرمجة.

ما الذي قيس في الاختبارات

منذ عام 2023، أجرت AISI على أنظمة الذكاء الاصطناعي المتقدمة 95 تحديًا من نوع Capture the Flag صُممت لاختبار القدرات السيبرانية في مجالات تشمل الهندسة العكسية، واستغلال الويب، والتشفير. هذه ليست انطباعات غامضة عن كفاءة النموذج، بل تقييمات قائمة على المهام، تهدف إلى كشف مدى قدرة الأنظمة على إنجاز أعمال سيبرانية هجومية ملموسة.

في مهام مستوى “Expert” الأعلى، حقق GPT-5.5 متوسط نجاح بلغ 71.4 في المئة، متقدمًا قليلًا على Mythos Preview الذي سجل 68.6 في المئة، وذلك ضمن هامش الخطأ. هذا التوصيف مهم. فالنتيجة لا تثبت فائزًا حاسمًا، بل تؤكد تعادلًا على مستوى مرتفع بما يكفي لتحدي فكرة أن نموذجًا واحدًا فقط قد دخل فئة جديدة من المخاطر.

News

تبيع Tesla مجددًا سيارات Model 3 المصنّعة في شنغهاي في كندا، ما خفّض سعر الدخول بشكل حاد بعد أن أعادت تغييرات التعرفة رسم اقتصاديات الاستيراد من الولايات المتحدة والصين.

DT Editorial AI·May 3, 2026·via engadget.com

News

قدمت OpenAI رفقاء متحركين اختياريين لـ Codex يعرضون حالة المهام ونشاط الخيوط وطلبات إدخال المستخدم دون إجبار المطورين على مغادرة مساحة العمل الحالية.

DT Editorial AI·May 3, 2026·via engadget.com

News

أزالت Apple جهاز Mac Mini بسعر 599 دولارًا من البيع، فرفعت السعر الابتدائي لسطح المكتب إلى 799 دولارًا بينما تحذر من قيود الإمداد وارتفاع تكاليف الذاكرة.

DT Editorial AI·May 3, 2026·via theverge.com

لماذا يهم هذا الآن

الأهمية الحقيقية لنتيجة GPT-5.5 ليست في حقوق التفاخر، بل في الدليل على أن القدرات السيبرانية المتقدمة أصبحت موزعة على نطاق أوسع بين النماذج الرائدة. هذا يغيّر كيفية تفكير المختبرات والجهات التنظيمية والمستخدمين المؤسسيين في التقييم، وضبط الوصول، واختبارات الفرق الحمراء، والاستعداد للحوادث. كما يرفع سقف النقاشات التجريبية حول السلامة. يمكن للشركات أن تطلق ادعاءات كبيرة عن تفرد نموذج ما، لكن الاختبارات المقارنة تقدم على نحو متزايد معيارًا يضبط هذه السرديات.

حتى الآن، تدعم الأدلة المتاحة خلاصة أضيق لكنها مهمة. فقد أدى GPT-5.5 أداءً يقارب Mythos Preview في التقييمات السيبرانية لـ AISI، وتفوق عليه قليلًا في بعض المقاييس، وكرر النمط الأوسع المتمثل في أن النماذج الرائدة أصبحت أكثر قدرة على المهام التقنية الممتدة. ربما تضيق فجوة الضجة، لكن منحنى القدرات يبدو أنه لا يزال صاعدًا.

هذه المقالة مبنية على تغطية Ars Technica. اقرأ المقال الأصلي.

GPT-5.5 يطابق Mythos Preview في اختبارات الأمن السيبراني البريطانية، متحديًا الفجوة بين الضجة والواقع

نتائج معيارية جديدة تضيق الفجوة بين سرديات أمان الذكاء الاصطناعي والأداء المقاس

ما الذي قيس في الاختبارات

Related Articles

Keep Reading

أمازون تواجه شهورًا من التعافي بعد أضرار الطائرات المسيّرة التي أصابت مراكز بيانات في الشرق الأوسط

أداء يبدو أكثر تشغيلية

الحدود لا تزال مهمة

يبدو أن أرخص طراز من Mac mini لدى Apple قد اختفى مع إعادة تشكيل الطلب على الذكاء الاصطناعي للتشكيلة

النقاش حول طريقة حديث الشركات عن المخاطر

لماذا يهم هذا الآن

ميتا تشتري شركة ARI الناشئة في مجال الذكاء الاصطناعي للروبوتات لتعزيز رهانها على الروبوتات البشرية

Comments (0)

تفتح Tesla من جديد مسارًا منخفض التكلفة لطراز Model 3 في كندا عبر واردات شنغهاي

تضيف OpenAI حيوانات أليفة مولدة بالذكاء الاصطناعي إلى Codex كطبقة جديدة لعرض حالة الوكيل

Apple تسحب أرخص Mac Mini مع تصاعد تكاليف الذاكرة وضغوط الإمداد