Microsoft agentic AI को defensive security में आगे बढ़ा रहा है

Microsoft का कहना है कि उसने एक AI-संचालित vulnerability discovery system बनाया है, जो एक अकेले model पर नहीं, बल्कि विशेषीकृत agents के coordinated swarm पर निर्भर करता है। यह प्रणाली, जिसे MDASH कहा जाता है, जिसका पूरा नाम Multi-Model Agentic Scanning Harness है, 100 से अधिक agents का उपयोग करके software का विश्लेषण करती है, संभावित खामियों पर बहस करती है, और यह सत्यापित करने की कोशिश करती है कि संदिग्ध bugs का वास्तव में exploit किया जा सकता है या नहीं।

Microsoft के अनुसार, इस approach ने पहले ही उन सबसे कठिन environments में से एक में नतीजे दिए हैं जिन्हें audit करना मुश्किल होता है: उसका अपना proprietary software stack। Patch Tuesday, 12 मई 2026 को, कंपनी ने networking और authentication components में MDASH द्वारा खोजी गई Windows की 16 vulnerabilities की सूचना दी। इनमें से चार को critical वर्गीकृत किया गया। प्रभावित components में

tcpip.sys kernel component,

ikeext.dll में IKEv2 service,

netlogon.dll, और

dnsapi.dll शामिल थे।

विवाद के लिए बना pipeline

Microsoft द्वारा वर्णित architecture, vulnerability count जितनी ही महत्वपूर्ण है। MDASH चार stages में काम करता है। पहले, यह source code का विश्लेषण करता है और attack surface का मानचित्र बनाता है। फिर auditor agents का एक set संदिग्ध patterns या जोखिमपूर्ण code paths को स्कैन करता है। तीसरे चरण में, debaters के रूप में वर्णित agents का एक और set इस बात के पक्ष और विपक्ष में तर्क देता है कि हर finding वास्तविक और exploitable होने की संभावना रखती है या नहीं। अंत में, Evidence Leader agents नाम के तथाकथित agents विशिष्ट inputs का उपयोग करके issue को trigger करने की कोशिश करते हैं।

यह structure automated security scanning की एक परिचित समस्या को हल करने के लिए बनाया गया है: false positives। Security tools बड़ी संख्या में ऐसे alerts पैदा कर सकते हैं जो plausible तो लगते हैं, लेकिन कम मूल्य के होते हैं। Exploit प्रयासों पर जाने से पहले specialized agents को एक-दूसरे के दावों को चुनौती देने के लिए मजबूर करके, Microsoft MDASH को एक ऐसे system के रूप में पेश कर रहा है जो noise को बढ़ाने के बजाय फ़िल्टर करता है।

Microsoft क्यों मानता है कि यह तरीका अलग है

Microsoft के तर्कों में से एक यह है कि उसका अपना internal code base एक विशेष रूप से उपयोगी test प्रस्तुत करता है। Windows, Hyper-V, और Azure proprietary हैं और इसलिए public training data में मौजूद नहीं हैं। इसका मतलब है कि system open-source repositories से memorized examples को बस दोहरा नहीं सकता। यदि यह बंद code में वास्तविक issues खोज रहा है, तो Microsoft उचित रूप से दावा कर सकता है कि system retrieval नहीं, analysis कर रहा है।

कंपनी यह भी कहती है कि pipeline model-agnostic है। जब कोई नया model उपलब्ध होता है, तो पूरे system को फिर से डिजाइन किए बिना उसे configuration में बदला जा सकता है। Experts domain-specific knowledge वाले plugins भी जोड़ सकते हैं, जैसे kernel calling conventions या inter-process communication में trust boundaries, जिससे system उस technical context के साथ काम कर सके जो सामान्य-purpose foundation model में स्वाभाविक रूप से नहीं होता।

MDASH ने क्या पाया

कंपनी का कहना है कि MDASH ने Windows networking और authentication stack में 16 नई vulnerabilities खोजीं। इनमें से 16 में से 10 kernel mode को प्रभावित करती हैं, और अधिकांश network के जरिए बिना authentication के पहुंच योग्य हैं। ये गुण निष्कर्षों को एक सामान्य bug list से अधिक गंभीर बनाते हैं। Kernel vulnerabilities व्यापक system impact पैदा कर सकती हैं, जबकि remote network reachability attackers के लिए exploit के मूल्य को बढ़ा देती है।

Microsoft ने खोजी गई चार खामियों को critical वर्गीकृत किया। Security terms में, यह system की उपयोगिता के लिए सबसे मजबूत व्यावहारिक तर्क है। एक benchmark score ध्यान आकर्षित कर सकता है, लेकिन production software में critical bugs अधिक मायने रखते हैं।

Benchmark leadership, कुछ सावधानियों के साथ

Microsoft का कहना है कि MDASH ने public CyberGym benchmark पर 88.45% स्कोर किया, जो अब तक का सबसे ऊंचा परिणाम है। इससे कंपनी को इस उभरती agentic security tooling श्रेणी में तकनीकी नेतृत्व का एक मापनीय दावा मिलता है। लेकिन तुलना पूरी तरह सरल नहीं है। Microsoft ने system को शक्ति देने वाले exact models का खुलासा नहीं किया है, और benchmark स्थितियां हमेशा वास्तविक दुनिया के software environments की जटिलता में सीधे अनुवादित नहीं होतीं।

फिर भी, यह परिणाम एक व्यापक प्रवृत्ति का समर्थन करता है। Security research single-shot prompting से आगे बढ़कर orchestrated systems की ओर जा रहा है, जिनमें कई models या agents काम बांटते हैं, एक-दूसरे की आलोचना करते हैं, और hypotheses का iterative परीक्षण करते हैं। MDASH उसी बदलाव का हिस्सा है, और इसका design संकेत देता है कि Microsoft practical automated security work की कुंजी के रूप में केवल code summarization नहीं, बल्कि debate और verification को देखता है।

Microsoft से परे यह क्यों मायने रखता है

अगर Microsoft का विवरण सही बैठता है, तो MDASH इस बात की झलक देता है कि enterprise security कैसे बदल सकती है। बड़े vendors विशाल code bases बनाए रखते हैं जिनका human teams द्वारा व्यापक audit करना कठिन होता है। ऐसे agentic systems जो लगातार scan, challenge, और findings को validate कर सकते हैं, internal security programs के लिए एक force multiplier बन सकते हैं, खासकर तब जब proprietary code public-data-trained models पर भारी निर्भरता को रोकता है।

एक operational implication भी है। क्योंकि system model-agnostic है, underlying models में सुधार तेज़ी से compound हो सकते हैं। एक बेहतर language model को workflow को बदलने की जरूरत नहीं होगी; वह एक स्थापित pipeline में plug हो सकता है जो पहले से जानता है कि tasks को कैसे distribute करना है और output को कैसे verify करना है।

फिलहाल, Microsoft का सबसे मजबूत सबूत ठोस है: 16 reported Windows vulnerabilities, जिनमें चार critical flaws शामिल हैं, एक multi-agent system द्वारा खोजी गईं जिसे वह closed-source software में reasoning करने में सक्षम बताता है। कंपनी ने हर implementation detail उजागर नहीं किया है, और व्यापक industry अधिक independent validation चाहेगी। लेकिन संकेत पर्याप्त स्पष्ट है। AI vulnerability hunting demo-stage novelty से आगे बढ़कर production security engineering की ओर जा रहा है।

यह लेख The Decoder की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on the-decoder.com