A história de cibersegurança da Anthropic encontra pressão de replicação
A Anthropic apresentou o Claude Mythos como um modelo de cibersegurança rigidamente controlado, com capacidades fortes o suficiente para justificar acesso restrito. De acordo com o texto-fonte fornecido, a empresa limitou o Mythos Preview por meio do Project Glasswing a um consórcio de onze organizações, citando potencial ofensivo. Testes internos e uma auditoria do AI Security Institute do Reino Unido teriam constatado que o modelo podia localizar bugs de software, construir exploits funcionais por conta própria e comprometer redes corporativas inteiras em simulação, desde que essas redes fossem pequenas, pouco protegidas e vulneráveis.
Esse é um conjunto sério de alegações, e o novo desenvolvimento não é que elas tenham sido refutadas. É que partes da narrativa de exclusividade agora estão sendo contestadas. Dois esforços independentes de replicação descritos na fonte sugerem que modelos menores e mais abertos podem reproduzir grande parte da análise de vulnerabilidades que a Anthropic mostrou publicamente.
Essa distinção importa. O debate está mudando de se o Mythos é capaz para se as capacidades demonstradas são realmente únicas.
O que os esforços de replicação encontraram
O primeiro esforço de replicação veio da AISLE, uma empresa que vem conduzindo caça a bugs assistida por IA em software de código aberto desde meados de 2025. A fonte diz que a AISLE relatou 15 vulnerabilidades no OpenSSL e cinco no curl. O fundador Stanislav Fort teria usado trechos de código das amostras públicas da Anthropic para testar até onde uma série de modelos menores e parcialmente abertos poderia chegar sozinha.
O segundo esforço veio da Vidoc Security, que combinou GPT-5.4 e Claude Opus 4.6 com o agente de codificação aberto OpenCode. Juntos, esses estudos tentam responder a uma pergunta prática: quando a Anthropic demonstra uma capacidade impressionante de encontrar bugs ou raciocinar sobre exploits, quanto desse desempenho é exclusivo do Mythos e quanto reflete uma fronteira de capacidade que está se ampliando em todo o panorama de modelos?
A resposta inicial do texto-fonte parece ser que a fronteira pode ser mais ampla do que os controles de acesso da Anthropic sugerem.
O exemplo do FreeBSD é o caso de teste-chave
O exemplo mais concreto no material fornecido envolve um bug de NFS no FreeBSD identificado como CVE-2026-4747. A Anthropic havia destacado esse caso como demonstração de o Mythos realizar descoberta e exploração autônomas. A AISLE então testou oito modelos na função relevante e, segundo o artigo, todos eles detectaram o bug de memória.
Esse é o desafio mais forte no relatório. Não apenas os oito modelos teriam sinalizado a falha como crítica, mas também geraram raciocínios plausíveis sobre a exploração e sobre por que as proteções padrão do sistema operacional não se aplicariam. Um modelo, GPT-OSS-120b, teria produzido uma sequência de gadgets que a AISLE considerou próxima do exploit real. Outro, Kimi K2, teria inferido que o ataque poderia se espalhar automaticamente de uma máquina infectada para outras, um detalhe que o artigo diz que a própria Anthropic não mencionou.
Se esses resultados estiverem corretos, eles enfraquecem a ideia de que identificar e analisar essa classe de vulnerabilidade seja exclusivo de um único modelo rigidamente controlado.
Onde a diferença ainda parece existir
Ao mesmo tempo, o texto-fonte não apaga todas as distinções entre Mythos e modelos abertos menores. Ele aponta para uma etapa criativa mais exigente na cadeia real do exploit: encaixar uma carga útil de mais de 1.000 bytes em cerca de 304 bytes de espaço disponível. Segundo o artigo, o Mythos conseguiu isso dividindo a carga útil em 15 requisições de rede separadas. Nenhum dos esforços de replicação descritos no texto visível igualou esse nível de construção do exploit.
Essa nuance é essencial. Ela sugere que a diferença pode não estar mais no reconhecimento inicial da vulnerabilidade ou no raciocínio de alto nível sobre exploits, mas na engenharia mais difícil necessária para transformar uma vulnerabilidade em um ataque totalmente funcional sob restrições rígidas.
Em outras palavras, os estudos de replicação não provam que o Mythos é comum. Eles sugerem que alguns dos exemplos de destaque usados para justificar sua mística podem ser menos singulares do que pareciam à primeira vista.
Por que isso importa para a política de segurança em IA
As implicações vão muito além de uma disputa entre fornecedores de modelos. Restrições de acesso, políticas de segurança e debates de segurança nacional dependem cada vez mais de alegações sobre quais sistemas cruzam de forma significativa determinados limiares de capacidade. Se modelos pequenos ou parcialmente abertos conseguem reproduzir grande parte do trabalho apresentado, então formuladores de políticas e laboratórios podem precisar de uma definição mais precisa do que conta como algo materialmente novo ou especialmente perigoso.
Essa é uma das tensões centrais da governança de IA de fronteira. Uma empresa pode restringir de forma sincera o acesso a um modelo poderoso, mas os exemplos públicos usados para justificar essas restrições podem ser rapidamente testados diante de um ecossistema aberto que melhora depressa. Quando isso acontece, a questão deixa de ser apenas se o modelo principal é forte e passa a ser se a capacidade restrita já está se difundindo.
A formulação do artigo sugere que é exatamente isso que está acontecendo na pesquisa de cibersegurança assistida por IA. Capacidades que recentemente pareciam excepcionais podem agora ser reproduzíveis a um custo menor e com mais abertura do que alguns fornecedores deram a entender.
O significado competitivo para o mercado de modelos
Há também um ângulo comercial. O posicionamento da Anthropic em torno do Mythos depende em parte da crença de que ele ocupa um nível raro de capacidade ofensiva em cibersegurança. Se modelos públicos ou semiabertos conseguem aproximar grande parte do mesmo trabalho, a proposta de valor muda.
Isso não apaga vantagens em confiabilidade, profundidade ou automação de ponta a ponta. Mas enfraquece a narrativa de que apenas um ou dois sistemas protegidos podem realizar análise autônoma de vulnerabilidades de forma relevante. Para compradores, avaliadores e pesquisadores de segurança, isso pode acelerar a pressão por benchmarking em um conjunto mais amplo de modelos.
Também pode fortalecer o papel de agentes e cadeias de ferramentas, e não apenas dos pesos do modelo. Um dos esforços de replicação descritos na fonte combina modelos de fronteira com um agente de codificação aberto, lembrando que sistemas compostos estão se tornando tão importantes quanto a capacidade bruta de um único modelo.
Um mito mais estreito, não um colapso da capacidade
O título do artigo-fonte é deliberadamente contundente, mas as evidências descritas sustentam uma conclusão mais precisa. A história do Mythos não está desmoronando porque o modelo carece de capacidade. Ela está se estreitando porque os exemplos usados para dramatizar sua singularidade agora estão sendo correspondidos, ao menos em parte, por alternativas menores e mais abertas.
Isso ainda é um desenvolvimento importante. Em IA, status muitas vezes depende tanto da percepção comparativa quanto do desempenho absoluto. Se a aura de exclusividade enfraquece, a conversa estratégica muda.
Para os leitores do Developments Today, a conclusão central é esta: a fronteira da capacidade de IA para cibersegurança pode estar se espalhando mais rápido do que as narrativas institucionais conseguem conter. A Anthropic pode ainda ter um sistema poderoso. Mas, se grupos independentes conseguem reproduzir grande parte do trabalho mostrado publicamente com modelos mais baratos e mais abertos, então a verdadeira história já não é apenas sobre a ferramenta extraordinária de um laboratório, e sim sobre uma classe de capacidade cada vez mais difícil de monopolizar.
Este artigo é baseado na reportagem do The Decoder. Leia o artigo original.
Originally published on the-decoder.com






