La règle « pas de gobelins » d’OpenAI révèle un vrai défi produit pour l’IA

La « règle anti-gobelins » d’OpenAI montre comment les comportements étranges de l’IA deviennent un vrai problème produit

Les consignes dans les outils Codex d’OpenAI indiquent explicitement au modèle de ne pas mentionner les gobelins, gremlins, trolls, pigeons ou autres créatures sauf si c’est clairement pertinent, transformant un mème étrange en histoire révélatrice sur l’IA.

DT Editorial AI

Apr 29, 2026·4 min read·938 words

Une consigne bizarre qui dit quelque chose de sérieux

L’une des lignes les plus commentées cette semaine dans les outils de codage d’OpenAI ne concernait ni la qualité logicielle, ni la sécurité, ni la latence. Elle concernait les gobelins. Comme l’a rapporté Wired, les consignes dans Codex CLI indiquent explicitement au modèle de ne pas parler de gobelins, gremlins, ratons laveurs, trolls, ogres, pigeons ou autres créatures, sauf si le sujet est clairement pertinent pour la demande de l’utilisateur.

À première vue, cela ressemble à une blague interne qui aurait fini en production. En pratique, cela révèle quelque chose de plus important : le comportement des modèles n’est plus façonné seulement par l’entraînement et l’architecture, mais aussi par des garde-fous opérationnels très spécifiques conçus pour supprimer des schémas récurrents que les utilisateurs continuent de rencontrer dans la vraie vie.

Cela compte parce que les cas limites étranges des assistants IA ne sont plus confinés aux démonstrations de recherche. Les agents de codage sont désormais positionnés comme de véritables outils de productivité. Lorsque les éditeurs les déploient dans des environnements de ligne de commande, des flux d’automatisation de bureau ou des systèmes agentiques capables d’agir à travers des applications, même de petites bizarreries récurrentes peuvent devenir des problèmes au niveau produit.

De l’oddity du modèle à l’exigence produit

Selon le reportage de Wired, des utilisateurs sur X ont indiqué que les modèles d’OpenAI devenaient parfois obsédés par les gobelins et des créatures similaires, surtout lorsqu’ils étaient associés à OpenClaw, un outil permettant à l’IA de contrôler un ordinateur et des applications pour effectuer des tâches. Certains utilisateurs trouvaient ce comportement drôle. D’autres y voyaient un mode d’échec reconnaissable. Quoi qu’il en soit, la réponse d’OpenAI semble avoir été simple : inscrire l’interdiction directement dans les consignes.

Le résultat offre un aperçu utile de la manière dont les produits IA modernes sont réellement réglés. Le récit public lisse sur les capacités d’un modèle met généralement l’accent sur les benchmarks, le raisonnement et la réussite de tâches réelles. Sous cette couche en existe une autre : l’ingénierie des consignes visant à empêcher des comportements techniquement inoffensifs mais, en pratique, perturbateurs. Si un modèle dérive à répétition vers des métaphores indésirables ou un langage fantaisiste lorsqu’il écrit du code, cela peut éroder la confiance, distraire les utilisateurs et donner au système une impression d’instabilité même lorsque la sortie technique est correcte.

Autrement dit, « ne pas mentionner les gobelins » ne parle pas vraiment des gobelins. Il s’agit de fiabilité. Les utilisateurs veulent un assistant de codage qui reste concentré sur la tâche, conserve un ton professionnel et n’introduise pas d’obsessions thématiques aléatoires dans des workflows censés faire gagner du temps.

Pourquoi les systèmes agentiques compliquent la chose

Wired note que les grands modèles de langage sont des systèmes probabilistes entraînés à prédire la suite, et que des comportements inhabituels peuvent devenir plus probables lorsque le modèle est utilisé dans un « cadre agentique » qui ajoute davantage d’instructions et de contexte. Ce cadre est important. Plus il y a de couches autour d’un modèle de base, plus il existe de surfaces d’interaction où des comportements étranges peuvent émerger.

Un assistant de codage utilisé dans une simple boucle question-réponse est une chose. Un système qui lit de longues consignes, récupère de la mémoire, manipule des outils, pilote des logiciels et maintient une personnalité en est une autre. Ces environnements plus riches peuvent offrir davantage d’occasions à des motifs locaux de prompt, à des dérives de style ou à des thèmes récurrents d’apparaître. Ce qui semble absurde isolément peut être le symptôme d’une complexité plus large de la pile.

L’article replace aussi la question dans un contexte concurrentiel. La dernière sortie de modèle d’OpenAI mettait l’accent sur les performances en codage à un moment où les éditeurs se livrent une course pour définir le développement logiciel assisté par IA comme un marché central. Cela rend le polissage comportemental plus important, pas moins. Si les agents de codage deviennent une catégorie produit phare, alors les aspérités qui paraissaient autrefois anecdotiques peuvent devenir des handicaps de marque.

Le mème et le marché

La découverte est rapidement devenue un mème, les utilisateurs produisant blagues, images et même de jolies extensions « goblin mode ». Ce contrecoup culturel est familier dans l’IA. Les bizarreries de produit deviennent souvent des artefacts Internet bien avant que les entreprises ne les expliquent. Mais la vitesse du cycle des mèmes ne doit pas masquer l’importance industrielle. Les entreprises apprennent que les produits IA n’ont pas seulement besoin de capacités. Ils ont aussi besoin de confinement comportemental.

Cela inclut le ton, la discipline de persona et la suppression de schémas peu utiles qui apparaissent assez souvent pour justifier une intervention explicite. Le fait qu’un éditeur code une liste de créatures dans les consignes montre à quel point ce processus est devenu concret. C’est un exemple particulièrement vivant du travail ingrat derrière la transformation de modèles de pointe en outils du quotidien.

La leçon plus large est que le public voit souvent les systèmes IA comme des intelligences monolithiques, alors que les produits déployés sont en réalité des constructions en couches, remplies de correctifs, de filtres, de consignes cachées et de garde-fous comportementaux. Ces mécanismes ne se contentent pas d’affiner un modèle. Ils définissent l’expérience utilisateur.

La règle anti-gobelins d’OpenAI est drôle parce qu’elle est si précise. Elle est importante pour la même raison. Lorsqu’une équipe produit décide que des créatures mythiques nécessitent une suppression explicite, cela suggère que la frontière entre comportement émergent du modèle et contrôle qualité logiciel est désormais très mince. Pour les entreprises qui construisent des agents de codage, c’est peut-être là la véritable histoire.

Cet article s’appuie sur un reportage de Wired. Lire l’article original.

La « règle anti-gobelins » d’OpenAI montre comment les comportements étranges de l’IA deviennent un vrai problème produit

Une consigne bizarre qui dit quelque chose de sérieux

De l’oddity du modèle à l’exigence produit

Keep Reading

L’investissement de 100 millions de dollars de Match dans Sniffies suscite des inquiétudes sur l’avenir des plateformes queer de niche

Pourquoi les systèmes agentiques compliquent la chose

Le mème et le marché

La chaîne d’approvisionnement de l’IA de Meta fait face à un coût humain alors que des centaines d’emplois d’étiquetage sont menacés

Comments (0)