Microsoft impulsa la IA agentiva hacia la seguridad defensiva
Microsoft dice que ha construido un sistema de descubrimiento de vulnerabilidades impulsado por IA que no depende de un solo modelo, sino de un enjambre coordinado de agentes especializados. El sistema, llamado MDASH, siglas de Multi-Model Agentic Scanning Harness, utiliza más de 100 agentes para analizar software, debatir sobre posibles fallos e intentar validar si los errores sospechosos realmente pueden explotarse.
Según Microsoft, el enfoque ya ha dado resultados dentro de uno de los entornos más difíciles de auditar: su propia pila de software propietario. En el Patch Tuesday del 12 de mayo de 2026, la empresa informó de 16 vulnerabilidades de Windows descubiertas por MDASH en componentes de red y autenticación. Cuatro fueron clasificadas como críticas. Los componentes afectados incluían el componente del kernel
tcpip.sys, el servicio IKEv2 en
ikeext.dll,
netlogon.dll y
dnsapi.dll.
Un pipeline diseñado para el desacuerdo
La arquitectura descrita por Microsoft importa tanto como el número de vulnerabilidades. MDASH opera en cuatro etapas. Primero, analiza el código fuente y mapea la superficie de ataque. Después, un conjunto de agentes auditores busca patrones sospechosos o rutas de código arriesgadas. En la tercera etapa, otro conjunto de agentes, descritos como debatidores, argumenta a favor y en contra de si cada hallazgo probablemente sea real y explotable. Por último, los llamados agentes Evidence Leader intentan activar el problema usando entradas específicas.
Esa estructura busca resolver un problema conocido en el escaneo de seguridad automatizado: los falsos positivos. Las herramientas de seguridad pueden generar un gran número de alertas plausibles pero de bajo valor. Al obligar a agentes especializados a cuestionar las afirmaciones de los demás antes de pasar a los intentos de explotación, Microsoft presenta MDASH como un sistema que filtra ruido en lugar de amplificarlo sin más.
Por qué Microsoft cree que este enfoque es diferente
Uno de los argumentos de Microsoft es que su propia base de código interna ofrece una prueba especialmente útil. Windows, Hyper-V y Azure son propietarios y, por tanto, no aparecen en los datos de entrenamiento públicos. Eso significa que el sistema no puede limitarse a reproducir ejemplos memorizados de repositorios de código abierto. Si encuentra problemas reales en código cerrado, Microsoft puede sostener con fundamento que el sistema está realizando análisis y no simple recuperación.
La empresa también dice que el pipeline es agnóstico al modelo. Cuando aparece un nuevo modelo, puede intercambiarse en la configuración sin rediseñar todo el sistema. Los expertos también pueden añadir complementos con conocimientos específicos de un dominio, como las convenciones de llamada del kernel o los límites de confianza en la comunicación entre procesos, permitiendo que el sistema opere con contexto técnico que un modelo fundacional de uso general no tendría de forma inherente.
Lo que encontró MDASH
La empresa dice que MDASH descubrió 16 nuevas vulnerabilidades en la pila de red y autenticación de Windows. Diez de las 16 afectan al modo kernel, y la mayoría son accesibles desde la red sin autenticación. Esas características hacen que los hallazgos sean más graves que una lista rutinaria de errores. Las vulnerabilidades del kernel pueden generar un amplio impacto en el sistema, mientras que el acceso remoto por red aumenta el valor de un exploit para los atacantes.
Microsoft clasificó cuatro de los fallos descubiertos como críticos. En términos de seguridad, ese es el argumento práctico más fuerte a favor de la utilidad del sistema. Una puntuación de benchmark puede atraer atención, pero los errores críticos en software de producción importan más.
Liderazgo en benchmarks, con matices
Microsoft dice que MDASH obtuvo un 88,45 % en el benchmark público CyberGym, el mejor resultado reportado hasta ahora. Eso le da a la empresa una afirmación medible de liderazgo técnico en esta categoría emergente de herramientas de seguridad agentiva. Pero la comparación no es del todo directa. Microsoft no ha revelado los modelos exactos que alimentan el sistema, y las condiciones de los benchmarks no siempre se trasladan de forma directa a la complejidad de los entornos de software del mundo real.
Aun así, el resultado respalda una tendencia más amplia. La investigación en seguridad está avanzando más allá de los prompts aislados hacia sistemas orquestados en los que varios modelos o agentes reparten el trabajo, se critican entre sí y prueban hipótesis de forma iterativa. MDASH forma parte de ese cambio, y su diseño sugiere que Microsoft ve el debate y la verificación, no solo el resumen de código, como la clave del trabajo práctico de seguridad automatizada.
Por qué importa más allá de Microsoft
Si el relato de Microsoft se sostiene, MDASH ofrece un adelanto de cómo podría cambiar la seguridad empresarial. Los grandes proveedores mantienen bases de código inmensas que son difíciles de auditar de forma exhaustiva por equipos humanos. Los sistemas agentivos capaces de escanear, cuestionar y validar hallazgos de forma continua podrían convertirse en un multiplicador de fuerza para los programas internos de seguridad, especialmente cuando el código propietario impide depender en gran medida de modelos entrenados con datos públicos.
También hay una implicación operativa. Como el sistema es agnóstico al modelo, las mejoras en los modelos subyacentes podrían acumularse rápidamente. Un mejor modelo de lenguaje no tendría que reemplazar el flujo de trabajo; podría integrarse en un pipeline ya establecido que sabe cómo distribuir tareas y verificar resultados.
Por ahora, la evidencia más sólida de Microsoft es concreta: 16 vulnerabilidades de Windows reportadas, incluidas cuatro fallas críticas, descubiertas por un sistema multiagente que, según la empresa, puede razonar sobre software de código cerrado. La compañía no ha revelado todos los detalles de implementación, y la industria querrá más validación independiente. Pero la señal es clara. La búsqueda de vulnerabilidades con IA está pasando de la novedad de demostración a la ingeniería de seguridad en producción.
Este artículo se basa en una nota de The Decoder. Leer el artículo original.
Originally published on the-decoder.com
