A Microsoft está levando a IA agentiva para a segurança defensiva

A Microsoft diz ter criado um sistema de descoberta de vulnerabilidades com IA que não depende de um único modelo, mas de um enxame coordenado de agentes especializados. O sistema, chamado MDASH, abreviação de Multi-Model Agentic Scanning Harness, usa mais de 100 agentes para analisar software, debater possíveis falhas e tentar validar se os bugs suspeitos podem de fato ser explorados.

Segundo a Microsoft, a abordagem já trouxe resultados em um dos ambientes mais difíceis de auditar: sua própria pilha de software proprietário. No Patch Tuesday de 12 de maio de 2026, a empresa informou 16 vulnerabilidades do Windows descobertas pelo MDASH em componentes de rede e autenticação. Quatro foram classificadas como críticas. Os componentes afetados incluíam o componente de kernel

tcpip.sys, o serviço IKEv2 em

ikeext.dll,

netlogon.dll e

dnsapi.dll.

Um pipeline feito para o desacordo

A arquitetura descrita pela Microsoft importa tanto quanto a contagem de vulnerabilidades. O MDASH opera em quatro etapas. Primeiro, ele analisa o código-fonte e mapeia a superfície de ataque. Depois, um conjunto de agentes auditores verifica padrões suspeitos ou caminhos de código arriscados. Na terceira etapa, outro conjunto de agentes, descritos como debatedores, argumenta a favor e contra a probabilidade de cada descoberta ser real e explorável. Por fim, os chamados agentes Evidence Leader tentam disparar o problema usando entradas específicas.

Essa estrutura foi pensada para resolver um problema familiar em varreduras automatizadas de segurança: falsos positivos. Ferramentas de segurança podem gerar um grande número de alertas plausíveis, mas de baixo valor. Ao forçar agentes especializados a contestar as alegações uns dos outros antes de partir para tentativas de exploração, a Microsoft apresenta o MDASH como um sistema que filtra ruído em vez de simplesmente amplificá-lo.

Por que a Microsoft acha que essa abordagem é diferente

Um dos argumentos da Microsoft é que sua própria base interna de código oferece um teste particularmente útil. Windows, Hyper-V e Azure são proprietários e, portanto, não aparecem em dados públicos de treinamento. Isso significa que o sistema não pode simplesmente regurgitar exemplos memorizados de repositórios de código aberto. Se estiver encontrando problemas reais em código fechado, a Microsoft pode afirmar de forma razoável que o sistema está fazendo análise, e não recuperação.

A empresa também diz que o pipeline é agnóstico ao modelo. Quando um novo modelo fica disponível, ele pode ser trocado na configuração sem redesenhar todo o sistema. Especialistas também podem adicionar plugins com conhecimento específico de domínio, como convenções de chamada do kernel ou limites de confiança na comunicação entre processos, permitindo que o sistema opere com contexto técnico que um modelo de uso geral não teria inerentemente.

O que o MDASH encontrou

A empresa diz que o MDASH descobriu 16 novas vulnerabilidades na pilha de rede e autenticação do Windows. Dez das 16 afetam o modo kernel, e a maioria pode ser acessada pela rede sem autenticação. Essas características tornam os achados mais graves do que uma lista rotineira de bugs. Vulnerabilidades de kernel podem causar impacto amplo no sistema, enquanto o acesso remoto pela rede aumenta o valor de um exploit para atacantes.

A Microsoft classificou quatro das falhas descobertas como críticas. Em termos de segurança, esse é o argumento prático mais forte a favor da utilidade do sistema. Uma pontuação de benchmark pode chamar atenção, mas bugs críticos em software de produção têm mais peso.

Liderança em benchmark, com ressalvas

A Microsoft diz que o MDASH alcançou 88,45% no benchmark público CyberGym, o melhor resultado reportado até agora. Isso dá à empresa uma reivindicação mensurável de liderança técnica nessa categoria emergente de ferramentas de segurança agentiva. Mas a comparação não é totalmente direta. A Microsoft não divulgou os modelos exatos que alimentam o sistema, e as condições de benchmark nem sempre se traduzem diretamente na complexidade de ambientes de software do mundo real.

Mesmo assim, o resultado sustenta uma tendência mais ampla. A pesquisa em segurança está avançando além de prompts isolados para sistemas orquestrados em que vários modelos ou agentes dividem o trabalho, criticam uns aos outros e testam hipóteses de forma iterativa. O MDASH faz parte dessa mudança, e seu design sugere que a Microsoft vê o debate e a verificação, e não apenas o resumo de código, como a chave para um trabalho prático de segurança automatizada.

Por que isso importa além da Microsoft

Se o relato da Microsoft se mantiver, o MDASH oferece uma prévia de como a segurança corporativa pode mudar. Grandes fornecedores mantêm bases de código imensas, difíceis de auditar de forma abrangente por equipes humanas. Sistemas agentivos capazes de varrer, contestar e validar descobertas continuamente podem se tornar um multiplicador de força para programas internos de segurança, especialmente quando o código proprietário impede uma grande dependência de modelos treinados com dados públicos.

Há também uma implicação operacional. Como o sistema é agnóstico ao modelo, melhorias nos modelos subjacentes podem se acumular rapidamente. Um modelo de linguagem melhor não precisaria substituir o fluxo de trabalho; ele poderia se encaixar em um pipeline estabelecido que já sabe como distribuir tarefas e verificar a saída.

Por enquanto, a evidência mais forte da Microsoft é concreta: 16 vulnerabilidades do Windows relatadas, incluindo quatro falhas críticas, descobertas por um sistema multiagente que, segundo a empresa, consegue raciocinar sobre software de código fechado. A empresa não revelou todos os detalhes de implementação, e o setor vai querer mais validação independente. Mas o sinal é claro o suficiente. A caça a vulnerabilidades com IA está saindo da fase de novidade de demonstração e avançando para a engenharia de segurança em produção.

Este artigo é baseado em uma reportagem do The Decoder. Leia o artigo original.

Originally published on the-decoder.com