OpenAI lance une prime aux bogues bio GPT-5.5 pour des jailbreaks universels

Une prime aux bogues ciblant le risque biologique

OpenAI a ouvert les candidatures pour un nouveau GPT-5.5 Bio Bug Bounty, un programme de red teaming ciblé qui vise à déterminer si des chercheurs peuvent découvrir un jailbreak universel capable de contourner les garde-fous liés à la biologie de l’entreprise. La structure est exceptionnellement précise. Il est demandé aux participants de produire un prompt unique capable de répondre avec succès aux cinq questions du défi de sécurité biologique d’OpenAI à partir d’un chat vierge, sans déclencher la modération. La récompense principale est de 25 000 dollars pour le premier véritable jailbreak universel qui réussisse à passer les cinq.

Le programme, d’après le texte source fourni, s’applique uniquement à GPT-5.5 dans Codex Desktop. Les candidatures ont ouvert le 23 avril 2026, avec des acceptations au fil de l’eau jusqu’au 22 juin 2026. Les tests doivent commencer le 28 avril et se poursuivre jusqu’au 27 juillet. OpenAI indique que des récompenses plus modestes peuvent être attribuées, à sa discrétion, pour des succès partiels.

Ce point est important, car il montre qu’une entreprise d’IA de pointe traite l’usage détourné de la biologie non seulement comme un sujet de politique, mais comme un problème concret de durcissement du système. Plutôt que d’encadrer l’évaluation de sécurité uniquement par des revues internes ou un langage politique général, l’entreprise invite des spécialistes externes à attaquer un mode d’échec étroitement défini.

Pourquoi un jailbreak universel compte

La plupart des défaillances de sécurité fondées sur les prompts sont situationnelles. Un modèle peut résister à une formulation, mais échouer avec une autre. Un jailbreak universel est différent, car il suggère une faiblesse plus générale dans la pile de sécurité. Si un prompt réutilisable peut contourner un comportement protecteur sur plusieurs prompts dangereux à partir d’une conversation fraîche, cela accroît considérablement la gravité de la vulnérabilité.

Le choix d’OpenAI de centrer le défi sur un test biologique en cinq questions implique une approche fondée sur un seuil : l’entreprise s’intéresse moins à des cas limites isolés qu’à des échecs systémiques susceptibles d’éroder la confiance dans les défenses biologiques du modèle. En récompensant une méthode universelle plutôt que des exemples dispersés, elle demande aux red teamers d’examiner l’intégrité de la couche d’alignement dans son ensemble.

Le montant de la récompense signale également une priorité. Une prime de 25 000 dollars est modeste à l’échelle des grands programmes de vulnérabilités logicielles, mais suffisamment importante pour attirer des spécialistes crédibles de la sécurité de l’IA et de la biosécurité. Plus important encore, cela clarifie qu’OpenAI est prête à payer pour des preuves montrant que ses garde-fous peuvent être brisés dans des conditions contrôlées, avant que ces faiblesses soient exploitées ailleurs.

AI & Robotics

OpenAI affirme que GPT-5.5 est conçu pour gérer des workflows plus longs, avec usage d’outils et moins de supervision, prolongeant l’élan de l’entreprise vers des systèmes d’IA de type agent pour le code, la recherche et le travail sur les données.

DT Editorial AI·Apr 25, 2026·via the-decoder.com

AI & Robotics

Les Émirats arabes unis disent qu’ils feront passer 50 % des secteurs, services et processus gouvernementaux à des systèmes d’IA agentique en deux ans, fixant ainsi l’un des objectifs les plus ambitieux jamais annoncés pour l’IA dans le secteur public.

DT Editorial AI·Apr 25, 2026·via the-decoder.com

AI & Robotics

Anthropic affirme que des agents IA plus puissants ont négocié de meilleurs prix et conclu davantage d’accords sur un véritable marché interne, tandis que les utilisateurs représentés par des modèles plus faibles n’ont pas perçu d’écart d’équité.

DT Editorial AI·Apr 25, 2026·via the-decoder.com

Ce que le programme dit de la sécurité des modèles de pointe

Le GPT-5.5 Bio Bug Bounty arrive alors que les entreprises d’IA s’orientent vers une validation de sécurité plus spécialisée pour les systèmes avancés. Le red teaming général reste important, mais les domaines les plus risqués exigent de plus en plus une expertise propre au domaine. La biologie constitue un cas particulièrement important, car la frontière entre assistance scientifique légitime et information potentiellement dangereuse est difficile à gérer à grande échelle.

En limitant le défi aux jailbreaks universels, OpenAI pose en pratique une question difficile sur la robustesse : ses garde-fous peuvent-ils résister à un adversaire déterminé et expert utilisant uniquement des méthodes fondées sur les prompts ? C’est plus exigeant que de demander si des utilisateurs ordinaires peuvent parfois embrouiller le modèle. C’est un test visant à savoir si les défenses échouent de manière reproductible et scalable.

Le libellé de l’entreprise suggère aussi que ce programme s’inscrit dans une architecture plus large de primes aux bogues et de travaux de sécurité. Le texte source renvoie les participants vers les programmes distincts d’OpenAI consacrés aux primes sécurité et sûreté, ce qui indique un modèle d’évaluation en couches plutôt qu’un exercice ponctuel.

OpenAI met les garde-fous biologiques de GPT-5.5 à l’épreuve avec une nouvelle prime aux bogues

Une prime aux bogues ciblant le risque biologique

Pourquoi un jailbreak universel compte

Related Articles

Keep Reading

OpenAI publie un guide de démarrage pour Codex et pousse vers un onboarding plus concret des workflows d’IA

Un processus sélectif et de haute confiance

Ce que le programme dit de la sécurité des modèles de pointe

OpenAI positionne les skills et plugins de Codex comme la prochaine couche d’automatisation du travail par l’IA

Les limites de ce que cela révèle

Un tournant pratique de la sécurité IA

L’accord de Cohere sur Aleph Alpha fait de l’IA souveraine une stratégie transfrontalière

Comments (0)

La Chine durcit l’accès au capital américain pour les opérations technologiques nationales

GPT-5.5 Rehausse le Plafond des Benchmarks IA, mais Conserve une Faiblesse Connue

OpenAI va plus loin dans les workflows agentiques avec le lancement de GPT-5.5

Les Émirats arabes unis veulent de l’IA agentique dans la moitié de leur gouvernement en deux ans

Le marché interne d’Anthropic montre que de meilleurs agents IA concluent de meilleurs deals discrètement