ما هي GPT-5.4 Thinking؟

أطلقت OpenAI أحدث نموذج تفكير أمامي لها، GPT-5.4 Thinking، إلى جانب بطاقة نظام مفصلة توثق قدرات النموذج وتقييمات السلامة والقيود. يمثل الإصدار خطوة أخرى في سعي OpenAI لتطوير أنظمة ذكاء اصطناعي قادرة على التعامل مع المشاكل المعقدة والمتعددة الخطوات من خلال سلاسل تفكير موسعة قبل تقديم الإجابات النهائية للمستخدمين.

على عكس نماذج اللغة القياسية التي تولد الإجابات رمزاً تلو الآخر دون تفكير، يستخدم GPT-5.4 Thinking تفكير سلسلة الأفكار — العمل على المشاكل داخلياً قبل الالتزام بالإخراج. تمكن هذه الهندسة المعمارية النموذج من التعامل مع الأدلة الرياضية والمهام البرمجية المعقدة والتفكير العلمي والتحليل المنطقي الدقيق بدقة أكبر بكثير من الأنظمة السابقة.

توفر بطاقة النظام، التي تنشرها OpenAI لجميع النماذج الأمامية، رؤية شفافة لكيفية تقييم الشركة للذكاء الاصطناعي قبل النشر. تغطي معايير السلامة ونتائج فريق الاختبار الأحمر والمخاطر المحتملة لسوء الاستخدام والتخفيفات المحددة المطبقة — مما يعطي الباحثين وعملاء المؤسسات المعلومات التي يحتاجونها لتقييم حالات الاستخدام المناسبة للنموذج الجديد.

تقييمات السلامة ونتائج اختبار الفريق الأحمر

اتبع الاختبار الأمني GPT-5.4 Thinking إطار عمل الاستعداد من OpenAI، وقيم النموذج عبر تهديدات الأمن السيبراني وتمكين الأسلحة البيولوجية والكيميائية والمخاطر الإشعاعية والحصول المستقل على الموارد. تضع بطاقة النظام GPT-5.4 Thinking في فئة المخاطر الإجمالية المتوسطة، مما يعني أنه يمكن نشره مع التخفيفات الأمنية القياسية الموضوعة دون تفعيل قيود إضافية.

اختبرت تقييمات فريق الاختبار الأحمر مقاومة النموذج للهجمات الاختراقية والحقن المطالب غير المباشر والمعالجة الخصومة متعددة الخطوات. أظهر GPT-5.4 Thinking مقاومة محسنة لعدد من نواقل الهجوم مقارنة بالأجيال السابقة، على الرغم من أنها لا تزال غير مثالية ضد المدخلات الخصومة المتطورة جداً — وهي تحفظ ينطبق على جميع أنظمة الذكاء الاصطناعي الحالية بغض النظر عن تعقيد التدريب.

كشفت تقييمات قدرات الإقناع والتلاعب بأن التدريب الأمني للنموذج يقلل بشكل كبير من استعداده لإنتاج محتوى مصمم لخداع أو إكراه المستخدمين. قيمت OpenAI أيضاً السلوك في الإعدادات الوكيلة، حيث قد يتخذ النموذج سلسلة من الإجراءات ذات عواقب في العالم الحقيقي، ووجدت الأداء ضمن معاملات السلامة المقبولة لعتبة تصنيف المخاطر المتوسطة.