Modelos abiertos reproducen las demostraciones de ciberseguridad de Anthropic sobre Mythos, según estudios

La historia de ciberseguridad de Anthropic se enfrenta a la presión de la replicación

Anthropic ha presentado a Claude Mythos como un modelo de ciberseguridad fuertemente controlado, con capacidades lo bastante potentes como para justificar un acceso restringido. Según el texto fuente proporcionado, la empresa limitó Mythos Preview mediante Project Glasswing a un consorcio de once organizaciones, citando su potencial ofensivo. Pruebas internas y una auditoría del AI Security Institute del Reino Unido habrían encontrado que el modelo podía localizar errores de software, construir exploits funcionales por sí solo y comprometer redes corporativas enteras en simulación, siempre que esas redes fueran pequeñas, estuvieran poco defendidas y fueran vulnerables.

Ese es un conjunto de afirmaciones serio, y el nuevo desarrollo no es que esas afirmaciones hayan sido refutadas. Es que partes de la narrativa de exclusividad están siendo cuestionadas. Dos esfuerzos independientes de replicación descritos en la fuente sugieren que modelos más pequeños y más abiertos pueden reproducir gran parte del análisis de vulnerabilidades que Anthropic ha mostrado públicamente.

La distinción importa. El debate está pasando de si Mythos es capaz a si las capacidades mostradas son realmente únicas.

Qué encontraron los esfuerzos de replicación

El primer esfuerzo de replicación vino de AISLE, una empresa que ha estado realizando búsqueda de errores asistida por IA en software de código abierto desde mediados de 2025. La fuente dice que AISLE ha informado de 15 vulnerabilidades en OpenSSL y cinco en curl. El fundador Stanislav Fort habría utilizado fragmentos de código de las muestras públicas de Anthropic para probar hasta dónde podían llegar por sí solos una serie de modelos más pequeños y parcialmente abiertos.

El segundo esfuerzo vino de Vidoc Security, que combinó GPT-5.4 y Claude Opus 4.6 con el agente de codificación abierto OpenCode. Juntos, estos estudios intentan responder una pregunta práctica: cuando Anthropic demuestra una capacidad impresionante para encontrar errores o razonar sobre exploits, ¿cuánto de ese rendimiento es exclusivo de Mythos y cuánto refleja un frente de capacidades que se está ampliando en todo el panorama de modelos?

La respuesta inicial del texto fuente parece ser que el frente puede ser más amplio de lo que sugieren los controles de acceso de Anthropic.

How we used Gemini to build Google I/O 2026

Google detalla cómo Gemini ayudó a producir I/O 2026

Google dice que los equipos usaron Gemini y otras herramientas de IA para ayudar a crear películas, elementos visuales y piezas del evento de Google I/O 2026, presentando la conferencia como una demostración interna de producción asistida por IA.

Read article

El ejemplo de FreeBSD es el caso de prueba clave

El ejemplo más concreto del material proporcionado involucra un error de NFS en FreeBSD identificado como CVE-2026-4747. Anthropic había destacado este caso como demostración de que Mythos podía descubrir y explotar vulnerabilidades de forma autónoma. AISLE luego probó ocho modelos contra la función relevante y, según el artículo, todos detectaron el error de memoria.

Ese es el desafío más fuerte del informe. No solo los ocho modelos habrían marcado la falla como crítica, sino que también generaron razonamientos plausibles sobre la explotación y sobre por qué no aplicarían las protecciones estándar del sistema operativo. Un modelo, GPT-OSS-120b, habría producido una secuencia de gadgets que AISLE consideró cercana al exploit real. Otro, Kimi K2, habría inferido que el ataque podría propagarse automáticamente de una máquina infectada a otras, un detalle que el artículo dice que Anthropic no mencionó.

Si esos resultados son correctos, socavan la idea de que identificar y analizar esta clase de vulnerabilidad sea exclusivo de un solo modelo fuertemente controlado.

Dónde todavía parece existir la brecha

Al mismo tiempo, el texto fuente no borra todas las diferencias entre Mythos y los modelos abiertos más pequeños. Señala un paso creativo más exigente en la cadena real del exploit: encajar una carga útil de más de 1.000 bytes en unos 304 bytes de espacio disponible. Según el artículo, Mythos lo consiguió dividiendo la carga útil en 15 solicitudes de red separadas. Ninguno de los esfuerzos de replicación descritos en el texto visible igualó ese nivel de construcción del exploit.

Ese matiz es esencial. Sugiere que la brecha quizá ya no esté en el reconocimiento inicial de vulnerabilidades ni en el razonamiento de alto nivel sobre exploits, sino en la ingeniería más difícil necesaria para convertir una vulnerabilidad en un ataque plenamente funcional bajo restricciones estrictas.

En otras palabras, los estudios de replicación no demuestran que Mythos sea ordinario. Sí sugieren que algunos de los ejemplos de mayor impacto usados para justificar su aura pueden ser menos singulares de lo que parecían al principio.

OpenAI starts with infrastructure robots but aims for "everyone having a personal robot doing anything they need"

OpenAI está reconstruyendo su área de robótica en torno al trabajo de infraestructura y una visión de consumo a más largo plazo

OpenAI ha reconstruido su equipo de robótica, empezando por tareas de infraestructura, mientras el CEO Sam Altman describe un objetivo a más largo plazo de robots personales para todos.

Read article

Por qué esto importa para la política de seguridad de IA

Las implicaciones van mucho más allá de una disputa entre proveedores de modelos. Las restricciones de acceso, las políticas de seguridad y los debates de seguridad nacional dependen cada vez más de afirmaciones sobre qué sistemas cruzan de forma significativa umbrales de capacidad. Si modelos pequeños o parcialmente abiertos pueden reproducir gran parte del trabajo mostrado, entonces los responsables políticos y los laboratorios quizá necesiten una definición más precisa de qué cuenta como algo materialmente novedoso o especialmente peligroso.

Esta es una de las tensiones centrales de la gobernanza de la IA de frontera. Una empresa puede restringir sinceramente el acceso a un modelo potente, pero los ejemplos públicos que usa para justificar esas restricciones pueden ser rápidamente puestos a prueba frente a un ecosistema abierto que mejora con rapidez. Cuando eso sucede, la pregunta ya no es solo si el modelo insignia es fuerte, sino si la capacidad restringida ya se está difundiendo.

El enfoque del artículo sugiere que eso es exactamente lo que está ocurriendo en la investigación de ciberseguridad asistida por IA. Capacidades que hace poco parecían excepcionales quizá ya sean reproducibles a menor costo y con más apertura de la que algunos proveedores han dado a entender.

El significado competitivo para el mercado de modelos

También existe un ángulo comercial. El posicionamiento de Anthropic en torno a Mythos depende en parte de la idea de que se sitúa en un nivel poco común de capacidad ofensiva en ciberseguridad. Si modelos públicos o semipúblicos pueden aproximar gran parte del mismo trabajo, la propuesta de valor cambia.

Eso no elimina las ventajas en fiabilidad, profundidad o automatización de extremo a extremo. Pero sí debilita la narrativa de que solo uno o dos sistemas protegidos pueden realizar análisis autónomos de vulnerabilidades de forma significativa. Para compradores, evaluadores e investigadores de seguridad, esto podría acelerar la presión de benchmarking en un conjunto más amplio de modelos.

También podría reforzar el papel de los agentes y las cadenas de herramientas más que el de los pesos del modelo por sí solos. Uno de los esfuerzos de replicación descritos en la fuente empareja modelos de frontera con un agente de codificación abierto, recordando que los sistemas compuestos importan cada vez tanto como la capacidad bruta de un solo modelo.

Un estudio encuentra que el uso de agentes de programación con IA está marcadamente desequilibrado en las ciencias sociales

Un estudio de Anthropic encontró grandes disparidades en la adopción de agentes de programación en las ciencias sociales, con brechas por género, campo, etapa profesional y rango universitario.

Read article

Un mito más estrecho, no un colapso de la capacidad

El título del artículo fuente es deliberadamente contundente, pero la evidencia descrita respalda una conclusión más precisa. La historia de Mythos no se está derrumbando porque el modelo carezca de capacidad. Se está estrechando porque los ejemplos usados para dramatizar su singularidad ahora están siendo igualados, al menos en parte, por alternativas más pequeñas y más abiertas.

Eso sigue siendo un desarrollo importante. En IA, el estatus a menudo depende tanto de la percepción comparativa como del rendimiento absoluto. Si el aura de exclusividad se debilita, la conversación estratégica cambia.

Para los lectores de Developments Today, la conclusión principal es esta: el frente de capacidad de IA para ciberseguridad podría estar extendiéndose más rápido de lo que las narrativas institucionales pueden contener. Anthropic puede seguir teniendo un sistema potente. Pero si grupos independientes pueden reproducir gran parte del trabajo mostrado públicamente con modelos más baratos y más abiertos, entonces la historia real ya no trata solo de la herramienta extraordinaria de un laboratorio, sino de una clase de capacidades cada vez más difícil de monopolizar.

Este artículo se basa en el reportaje de The Decoder. Leer el artículo original.

Originally published on the-decoder.com

Los modelos abiertos cuestionan el halo en torno a las afirmaciones de ciberseguridad de Anthropic sobre Mythos

La historia de ciberseguridad de Anthropic se enfrenta a la presión de la replicación

Qué encontraron los esfuerzos de replicación

Google detalla cómo Gemini ayudó a producir I/O 2026

El ejemplo de FreeBSD es el caso de prueba clave

Dónde todavía parece existir la brecha

OpenAI está reconstruyendo su área de robótica en torno al trabajo de infraestructura y una visión de consumo a más largo plazo

Por qué esto importa para la política de seguridad de IA

El significado competitivo para el mercado de modelos

Un estudio encuentra que el uso de agentes de programación con IA está marcadamente desequilibrado en las ciencias sociales

Un mito más estrecho, no un colapso de la capacidad

Comments (0)

Related Articles

Anthropic prohíbe las herramientas de IA en las entrevistas para evaluar a los candidatos

Los modelos de IA separan la lógica de las recetas de la química del sabor

Keep Reading