La historia de ciberseguridad de Anthropic se enfrenta a la presión de la replicación
Anthropic ha presentado a Claude Mythos como un modelo de ciberseguridad fuertemente controlado, con capacidades lo bastante potentes como para justificar un acceso restringido. Según el texto fuente proporcionado, la empresa limitó Mythos Preview mediante Project Glasswing a un consorcio de once organizaciones, citando su potencial ofensivo. Pruebas internas y una auditoría del AI Security Institute del Reino Unido habrían encontrado que el modelo podía localizar errores de software, construir exploits funcionales por sí solo y comprometer redes corporativas enteras en simulación, siempre que esas redes fueran pequeñas, estuvieran poco defendidas y fueran vulnerables.
Ese es un conjunto de afirmaciones serio, y el nuevo desarrollo no es que esas afirmaciones hayan sido refutadas. Es que partes de la narrativa de exclusividad están siendo cuestionadas. Dos esfuerzos independientes de replicación descritos en la fuente sugieren que modelos más pequeños y más abiertos pueden reproducir gran parte del análisis de vulnerabilidades que Anthropic ha mostrado públicamente.
La distinción importa. El debate está pasando de si Mythos es capaz a si las capacidades mostradas son realmente únicas.
Qué encontraron los esfuerzos de replicación
El primer esfuerzo de replicación vino de AISLE, una empresa que ha estado realizando búsqueda de errores asistida por IA en software de código abierto desde mediados de 2025. La fuente dice que AISLE ha informado de 15 vulnerabilidades en OpenSSL y cinco en curl. El fundador Stanislav Fort habría utilizado fragmentos de código de las muestras públicas de Anthropic para probar hasta dónde podían llegar por sí solos una serie de modelos más pequeños y parcialmente abiertos.
El segundo esfuerzo vino de Vidoc Security, que combinó GPT-5.4 y Claude Opus 4.6 con el agente de codificación abierto OpenCode. Juntos, estos estudios intentan responder una pregunta práctica: cuando Anthropic demuestra una capacidad impresionante para encontrar errores o razonar sobre exploits, ¿cuánto de ese rendimiento es exclusivo de Mythos y cuánto refleja un frente de capacidades que se está ampliando en todo el panorama de modelos?
La respuesta inicial del texto fuente parece ser que el frente puede ser más amplio de lo que sugieren los controles de acceso de Anthropic.
El ejemplo de FreeBSD es el caso de prueba clave
El ejemplo más concreto del material proporcionado involucra un error de NFS en FreeBSD identificado como CVE-2026-4747. Anthropic había destacado este caso como demostración de que Mythos podía descubrir y explotar vulnerabilidades de forma autónoma. AISLE luego probó ocho modelos contra la función relevante y, según el artículo, todos detectaron el error de memoria.
Ese es el desafío más fuerte del informe. No solo los ocho modelos habrían marcado la falla como crítica, sino que también generaron razonamientos plausibles sobre la explotación y sobre por qué no aplicarían las protecciones estándar del sistema operativo. Un modelo, GPT-OSS-120b, habría producido una secuencia de gadgets que AISLE consideró cercana al exploit real. Otro, Kimi K2, habría inferido que el ataque podría propagarse automáticamente de una máquina infectada a otras, un detalle que el artículo dice que Anthropic no mencionó.
Si esos resultados son correctos, socavan la idea de que identificar y analizar esta clase de vulnerabilidad sea exclusivo de un solo modelo fuertemente controlado.
Dónde todavía parece existir la brecha
Al mismo tiempo, el texto fuente no borra todas las diferencias entre Mythos y los modelos abiertos más pequeños. Señala un paso creativo más exigente en la cadena real del exploit: encajar una carga útil de más de 1.000 bytes en unos 304 bytes de espacio disponible. Según el artículo, Mythos lo consiguió dividiendo la carga útil en 15 solicitudes de red separadas. Ninguno de los esfuerzos de replicación descritos en el texto visible igualó ese nivel de construcción del exploit.
Ese matiz es esencial. Sugiere que la brecha quizá ya no esté en el reconocimiento inicial de vulnerabilidades ni en el razonamiento de alto nivel sobre exploits, sino en la ingeniería más difícil necesaria para convertir una vulnerabilidad en un ataque plenamente funcional bajo restricciones estrictas.
En otras palabras, los estudios de replicación no demuestran que Mythos sea ordinario. Sí sugieren que algunos de los ejemplos de mayor impacto usados para justificar su aura pueden ser menos singulares de lo que parecían al principio.
Por qué esto importa para la política de seguridad de IA
Las implicaciones van mucho más allá de una disputa entre proveedores de modelos. Las restricciones de acceso, las políticas de seguridad y los debates de seguridad nacional dependen cada vez más de afirmaciones sobre qué sistemas cruzan de forma significativa umbrales de capacidad. Si modelos pequeños o parcialmente abiertos pueden reproducir gran parte del trabajo mostrado, entonces los responsables políticos y los laboratorios quizá necesiten una definición más precisa de qué cuenta como algo materialmente novedoso o especialmente peligroso.
Esta es una de las tensiones centrales de la gobernanza de la IA de frontera. Una empresa puede restringir sinceramente el acceso a un modelo potente, pero los ejemplos públicos que usa para justificar esas restricciones pueden ser rápidamente puestos a prueba frente a un ecosistema abierto que mejora con rapidez. Cuando eso sucede, la pregunta ya no es solo si el modelo insignia es fuerte, sino si la capacidad restringida ya se está difundiendo.
El enfoque del artículo sugiere que eso es exactamente lo que está ocurriendo en la investigación de ciberseguridad asistida por IA. Capacidades que hace poco parecían excepcionales quizá ya sean reproducibles a menor costo y con más apertura de la que algunos proveedores han dado a entender.
El significado competitivo para el mercado de modelos
También existe un ángulo comercial. El posicionamiento de Anthropic en torno a Mythos depende en parte de la idea de que se sitúa en un nivel poco común de capacidad ofensiva en ciberseguridad. Si modelos públicos o semipúblicos pueden aproximar gran parte del mismo trabajo, la propuesta de valor cambia.
Eso no elimina las ventajas en fiabilidad, profundidad o automatización de extremo a extremo. Pero sí debilita la narrativa de que solo uno o dos sistemas protegidos pueden realizar análisis autónomos de vulnerabilidades de forma significativa. Para compradores, evaluadores e investigadores de seguridad, esto podría acelerar la presión de benchmarking en un conjunto más amplio de modelos.
También podría reforzar el papel de los agentes y las cadenas de herramientas más que el de los pesos del modelo por sí solos. Uno de los esfuerzos de replicación descritos en la fuente empareja modelos de frontera con un agente de codificación abierto, recordando que los sistemas compuestos importan cada vez tanto como la capacidad bruta de un solo modelo.
Un mito más estrecho, no un colapso de la capacidad
El título del artículo fuente es deliberadamente contundente, pero la evidencia descrita respalda una conclusión más precisa. La historia de Mythos no se está derrumbando porque el modelo carezca de capacidad. Se está estrechando porque los ejemplos usados para dramatizar su singularidad ahora están siendo igualados, al menos en parte, por alternativas más pequeñas y más abiertas.
Eso sigue siendo un desarrollo importante. En IA, el estatus a menudo depende tanto de la percepción comparativa como del rendimiento absoluto. Si el aura de exclusividad se debilita, la conversación estratégica cambia.
Para los lectores de Developments Today, la conclusión principal es esta: el frente de capacidad de IA para ciberseguridad podría estar extendiéndose más rápido de lo que las narrativas institucionales pueden contener. Anthropic puede seguir teniendo un sistema potente. Pero si grupos independientes pueden reproducir gran parte del trabajo mostrado públicamente con modelos más baratos y más abiertos, entonces la historia real ya no trata solo de la herramienta extraordinaria de un laboratorio, sino de una clase de capacidades cada vez más difícil de monopolizar.
Este artículo se basa en el reportaje de The Decoder. Leer el artículo original.
Originally published on the-decoder.com





