مكافأة أخطاء تستهدف مخاطر البيولوجيا

فتحت OpenAI باب التقديم لبرنامج GPT-5.5 Bio Bug Bounty جديد، وهو برنامج red teaming موجّه يركّز على ما إذا كان الباحثون قادرين على اكتشاف jailbreak شامل يتجاوز الضمانات المرتبطة بالبيولوجيا لدى الشركة. والبنية هنا محددة على نحو غير معتاد. يُطلب من المشاركين تقديم prompt واحد يمكنه الإجابة بنجاح عن الأسئلة الخمسة كلها في اختبار السلامة البيولوجية الخاص بـ OpenAI من محادثة جديدة دون تفعيل المراجعة. وتبلغ الجائزة الكبرى 25,000 دولار لأول jailbreak شامل حقيقي ينجح في اجتياز الأسئلة الخمسة جميعًا.

وبحسب النص المصدر المرفق، ينطبق البرنامج على GPT-5.5 في Codex Desktop فقط. فُتحت الطلبات في 23 أبريل 2026، مع قبول متواصل حتى 22 يونيو 2026. ومن المقرر أن تبدأ الاختبارات في 28 أبريل وتستمر حتى 27 يوليو. وتقول OpenAI إنه قد تُمنح جوائز أصغر للنجاحات الجزئية وفقًا لتقديرها.

وهذا مهم لأنه يبيّن أن شركة ذكاء اصطناعي حدودية تتعامل مع إساءة الاستخدام البيولوجية ليس فقط باعتبارها مسألة سياسة، بل بوصفها مشكلة ملموسة لتقوية النظام. فبدلاً من تأطير تقييم السلامة عبر المراجعة الداخلية أو لغة السياسات العامة فقط، تدعو الشركة متخصصين خارجيين لمهاجمة نمط فشل محدد بدقة.

لماذا يهم jailbreak شامل

معظم حالات فشل السلامة القائمة على prompts تكون ظرفية. فقد يقاوم النموذج صياغة معينة، لكنه يفشل تحت صياغة أخرى. أما jailbreak الشامل فمختلف لأنه يشير إلى ضعف أعمّ في منظومة السلامة. وإذا كان prompt واحد قابل لإعادة الاستخدام يستطيع تجاوز السلوك الوقائي عبر عدة prompts خطيرة من محادثة جديدة، فإن ذلك يرفع خطورة الثغرة بشكل كبير.

إن اختيار OpenAI التركيز على اختبار السلامة البيولوجية المؤلف من خمسة أسئلة يوحي بنهج قائم على العتبة: فالشركة أقل اهتمامًا بالحالات الحدّية المعزولة، وأكثر اهتمامًا بالإخفاقات المنهجية التي من شأنها تقويض الثقة في دفاعات النموذج البيولوجية. ومن خلال مكافأة طريقة شاملة بدلًا من أمثلة متفرقة، فهي تطلب من فرق red team فحص سلامة طبقة المحاذاة ككل.

كما أن حجم الجائزة يشير إلى الأولوية. فمبلغ 25,000 دولار متواضع مقارنة بحجم برامج الثغرات البرمجية الكبرى، لكنه كبير بما يكفي لجذب متخصصين موثوقين في أمن الذكاء الاصطناعي والأمن البيولوجي. والأهم أنه يوضح أن OpenAI مستعدة للدفع مقابل دليل على إمكانية كسر ضماناتها في ظروف مضبوطة قبل أن تُستغل هذه الثغرات في أماكن أخرى.