Le récit cybersécurité d’Anthropic se heurte à la pression de la réplication
Anthropic a présenté Claude Mythos comme un modèle de cybersécurité étroitement contrôlé, doté de capacités suffisamment fortes pour justifier un accès restreint. Selon le texte source fourni, l’entreprise a limité Mythos Preview via Project Glasswing à un consortium de onze organisations, en invoquant un potentiel offensif. Des tests internes et un audit de l’AI Security Institute du Royaume-Uni auraient conclu que le modèle pouvait repérer des bugs logiciels, construire des exploits fonctionnels de manière autonome et compromettre des réseaux d’entreprise entiers en simulation, à condition que ces réseaux soient petits, peu défendus et vulnérables.
Cela constitue un ensemble d’affirmations sérieux, et la nouveauté n’est pas que ces affirmations aient été réfutées. C’est que des éléments du récit d’exclusivité sont désormais contestés. Deux efforts de réplication indépendants décrits dans la source suggèrent que des modèles plus petits et plus ouverts peuvent reproduire une grande partie de l’analyse des vulnérabilités qu’Anthropic a présentée publiquement.
La distinction est importante. Le débat passe de la question de savoir si Mythos est capable à celle de savoir si les capacités mises en avant sont réellement uniques.
Ce que les efforts de réplication ont trouvé
Le premier effort de réplication est venu d’AISLE, une entreprise qui mène depuis la mi-2025 une chasse aux bugs assistée par l’IA sur des logiciels open source. La source indique qu’AISLE a signalé 15 vulnérabilités dans OpenSSL et cinq dans curl. Le fondateur Stanislav Fort aurait utilisé des extraits de code provenant des exemples publics d’Anthropic pour tester jusqu’où une série de modèles plus petits et partiellement ouverts pouvaient aller par eux-mêmes.
Le second effort est venu de Vidoc Security, qui a associé GPT-5.4 et Claude Opus 4.6 à l’agent de codage open source OpenCode. Ensemble, ces études cherchent à répondre à une question pratique : lorsque Anthropic démontre une capacité impressionnante à détecter des bugs ou à raisonner sur des exploits, quelle part de cette performance est propre à Mythos, et quelle part reflète une frontière de capacités qui s’élargit dans l’ensemble du paysage des modèles ?
La réponse initiale du texte source semble être que la frontière est peut-être plus large que ne le laissent entendre les contrôles d’accès d’Anthropic.
L’exemple FreeBSD est le cas de test clé
L’exemple le plus concret dans le matériau fourni concerne un bug NFS de FreeBSD identifié comme CVE-2026-4747. Anthropic avait mis en avant ce cas comme démonstration de la découverte et de l’exploitation autonomes par Mythos. AISLE a ensuite testé huit modèles sur la fonction concernée et, selon l’article, chacun d’eux a détecté le bug mémoire.
C’est l’attaque la plus forte du rapport. Non seulement les huit modèles auraient signalé la faille comme critique, mais ils ont aussi produit un raisonnement plausible sur l’exploitation et sur les raisons pour lesquelles les protections standard du système d’exploitation ne s’appliqueraient pas. Un modèle, GPT-OSS-120b, aurait produit une séquence de gadgets qu’AISLE a jugée proche de l’exploit réel. Un autre, Kimi K2, aurait déduit que l’attaque pouvait se propager automatiquement d’une machine infectée à d’autres, un détail que l’article dit qu’Anthropic elle-même n’a pas mentionné.
Si ces résultats sont exacts, ils affaiblissent l’idée que l’identification et l’analyse de cette catégorie de vulnérabilité soient l’apanage d’un seul modèle étroitement contrôlé.
Là où l’écart semble encore exister
En même temps, le texte source ne gomme pas toutes les différences entre Mythos et les plus petits modèles ouverts. Il pointe une étape créative plus exigeante dans la chaîne d’exploit réelle : faire tenir une charge utile de plus de 1 000 octets dans environ 304 octets d’espace disponible. Selon l’article, Mythos y est parvenu en répartissant la charge utile sur 15 requêtes réseau distinctes. Aucun des efforts de réplication décrits dans le texte visible n’a égalé ce niveau de construction d’exploit.
Cette nuance est essentielle. Elle suggère que l’écart ne se situe peut-être plus dans la reconnaissance initiale des vulnérabilités ou dans le raisonnement de haut niveau sur les exploits, mais dans l’ingénierie plus difficile nécessaire pour transformer une vulnérabilité en attaque pleinement exploitable sous des contraintes strictes.
Autrement dit, les études de réplication ne prouvent pas que Mythos est banal. Elles suggèrent en revanche que certains des exemples phares utilisés pour justifier son aura pourraient être moins singuliers qu’ils ne le paraissaient au départ.
Pourquoi cela compte pour la politique de sécurité de l’IA
Les implications vont bien au-delà d’un différend entre fournisseurs de modèles. Les restrictions d’accès, les politiques de sécurité et les débats sur la sécurité nationale dépendent de plus en plus d’affirmations sur les systèmes qui franchissent réellement des seuils de capacité. Si de petits modèles ou des modèles partiellement ouverts peuvent reproduire une grande partie du travail démontré, alors les décideurs et les laboratoires devront peut-être définir plus précisément ce qui compte comme réellement nouveau ou particulièrement dangereux.
C’est l’une des tensions centrales de la gouvernance de l’IA de pointe. Une entreprise peut sincèrement restreindre l’accès à un modèle puissant, mais les exemples publics qu’elle utilise pour justifier ces restrictions peuvent être rapidement testés face à un écosystème ouvert en rapide amélioration. Dans ce cas, la question n’est plus seulement de savoir si le modèle phare est fort, mais si la capacité restreinte est déjà en train de se diffuser.
Le cadrage de l’article suggère que c’est exactement ce qui se passe dans la recherche en cybersécurité assistée par l’IA. Des capacités qui semblaient récemment exceptionnelles peuvent désormais être reproduites à moindre coût et avec davantage d’ouverture que ne l’ont laissé entendre certains fournisseurs.
La portée concurrentielle pour le marché des modèles
Il existe aussi un angle commercial. Le positionnement d’Anthropic autour de Mythos repose en partie sur l’idée qu’il occupe un niveau rare de capacité offensive en cybersécurité. Si des modèles publics ou semi-ouverts peuvent approcher une grande partie du même travail, la proposition de valeur change.
Cela n’efface pas les avantages en matière de fiabilité, de profondeur ou d’automatisation de bout en bout. Mais cela affaiblit le récit selon lequel un ou deux systèmes protégés seulement peuvent réaliser une analyse autonome significative des vulnérabilités. Pour les acheteurs, les évaluateurs et les chercheurs en sécurité, cela pourrait accélérer la pression du benchmarking sur un ensemble plus large de modèles.
Cela pourrait aussi renforcer le rôle des agents et des chaînes d’outils plutôt que celui des seuls poids du modèle. L’un des efforts de réplication décrits dans la source associe des modèles de pointe à un agent de codage ouvert, rappelant que les systèmes composites comptent de plus en plus autant que la capacité brute d’un modèle unique.
Un mythe plus étroit, pas un effondrement des capacités
Le titre de l’article source est volontairement tranchant, mais les éléments décrits appuient une conclusion plus précise. L’histoire de Mythos ne s’effondre pas parce que le modèle manquerait de capacités. Elle se resserre parce que les exemples utilisés pour dramatiser son unicité sont désormais reproduits, au moins en partie, par des alternatives plus petites et plus ouvertes.
Cela reste un développement majeur. En IA, le statut repose souvent autant sur la perception comparative que sur la performance absolue. Si l’aura d’exclusivité s’affaiblit, la conversation stratégique change.
Pour les lecteurs de Developments Today, le principal enseignement est le suivant : la frontière des capacités de cybersécurité en IA pourrait se diffuser plus vite que les récits institutionnels ne peuvent l’absorber. Anthropic dispose peut-être toujours d’un système puissant. Mais si des groupes indépendants peuvent reproduire une grande partie de ses démonstrations publiques avec des modèles moins coûteux et plus ouverts, alors la véritable histoire ne porte plus seulement sur l’outil extraordinaire d’un laboratoire, mais sur une classe de capacités de plus en plus difficile à monopoliser.
Cet article s’appuie sur un reportage de The Decoder. Lire l’article original.
Originally published on the-decoder.com





