Anthropic की साइबरसुरक्षा कहानी को पुनरुत्पादन का दबाव मिला

Anthropic ने Claude Mythos को एक सख्ती से नियंत्रित साइबरसुरक्षा मॉडल के रूप में पेश किया है, जिसकी क्षमताएँ इतनी मजबूत बताई गईं कि उन पर सीमित पहुँच उचित ठहराई जा सके। उपलब्ध स्रोत पाठ के अनुसार, कंपनी ने Project Glasswing के माध्यम से Mythos Preview को ग्यारह संगठनों के एक संघ तक सीमित रखा, यह कहते हुए कि उसमें offensive potential है। आंतरिक परीक्षणों और UK’s AI Security Institute के एक audit में कथित तौर पर पाया गया कि मॉडल software bugs ढूँढ सकता है, अपने दम पर working exploits बना सकता है और simulation में पूरे corporate networks को compromise कर सकता है, बशर्ते वे नेटवर्क छोटे, कमजोर रूप से सुरक्षित और vulnerable हों।

ये गंभीर दावे हैं, और नया विकास यह नहीं है कि इन दावों को गलत साबित कर दिया गया है। बात यह है कि exclusivity narrative के कुछ हिस्सों को अब चुनौती मिल रही है। स्रोत में वर्णित दो स्वतंत्र replication efforts संकेत देते हैं कि छोटे और अधिक खुले मॉडल Anthropic द्वारा सार्वजनिक रूप से दिखाए गए vulnerability analysis के बड़े हिस्से को दोहरा सकते हैं।

यह भेद महत्वपूर्ण है। बहस अब इस पर नहीं है कि Mythos सक्षम है या नहीं, बल्कि इस पर है कि क्या दिखाए गए capabilities सचमुच अद्वितीय हैं।

Replication efforts ने क्या पाया

पहला replication effort AISLE से आया, एक कंपनी जो mid-2025 से open source software पर AI-assisted bug hunting चला रही है। स्रोत कहता है कि AISLE ने OpenSSL में 15 vulnerabilities और curl में पाँच vulnerabilities रिपोर्ट की हैं। संस्थापक Stanislav Fort ने कथित तौर पर Anthropic के public samples से code snippets लेकर यह जाँचा कि अलग-अलग छोटे और आंशिक रूप से खुले मॉडल अकेले कितनी दूर तक जा सकते हैं।

दूसरा प्रयास Vidoc Security से आया, जिसने GPT-5.4 और Claude Opus 4.6 को open coding agent OpenCode के साथ जोड़ा। साथ मिलकर, ये अध्ययन एक व्यावहारिक प्रश्न का उत्तर देने की कोशिश करते हैं: जब Anthropic प्रभावशाली bug-finding या exploit reasoning दिखाता है, तो उसमें कितना हिस्सा Mythos के लिए विशिष्ट है, और कितना मॉडल landscape में फैलती हुई capability frontier को दर्शाता है?

स्रोत पाठ के अनुसार प्रारंभिक उत्तर यह लगता है कि frontier, Anthropic के access controls से अधिक व्यापक हो सकती है।

FreeBSD उदाहरण निर्णायक परीक्षण है

दिए गए सामग्री का सबसे ठोस उदाहरण एक FreeBSD NFS bug से जुड़ा है, जिसे CVE-2026-4747 के रूप में पहचाना गया। Anthropic ने इस मामले को Mythos द्वारा autonomous discovery और exploitation के प्रदर्शन के रूप में उजागर किया था। फिर AISLE ने संबंधित function के विरुद्ध आठ models का परीक्षण किया और, लेख के अनुसार, हर एक ने उस memory bug को पकड़ लिया।

यह रिपोर्ट में सबसे मजबूत चुनौती है। न केवल सभी आठ models ने कथित तौर पर उस flaw को critical माना, बल्कि उन्होंने exploitation और इस बारे में भी plausible reasoning तैयार की कि standard operating-system protections क्यों लागू नहीं होंगी। GPT-OSS-120b नामक एक model ने कथित तौर पर gadget sequence तैयार किया, जिसे AISLE ने वास्तविक exploit के काफी करीब माना। Kimi K2 ने, लेख के अनुसार, यह भी अनुमान लगाया कि हमला एक संक्रमित मशीन से दूसरी मशीनों में स्वतः फैल सकता है, जो विवरण Anthropic ने स्वयं नहीं बताया था।

यदि ये परिणाम सही हैं, तो वे इस विचार को कमज़ोर करते हैं कि इस तरह की vulnerability की पहचान और विश्लेषण किसी एक सख्ती से नियंत्रित model तक सीमित है।

अंतर अभी कहाँ दिखाई देता है

साथ ही, स्रोत पाठ Mythos और छोटे open models के बीच सभी अंतर मिटा नहीं देता। वह exploit chain में एक अधिक कठिन रचनात्मक कदम की ओर इशारा करता है: 1,000 से अधिक bytes के payload को लगभग 304 bytes की उपलब्ध जगह में फिट करना। लेख के अनुसार, Mythos ने इसे 15 अलग-अलग network requests में payload को बाँटकर हासिल किया। वर्णित replication efforts में से किसी ने भी visible text के भीतर उस स्तर के exploit construction से मेल नहीं खाया।

यह nuance बहुत महत्वपूर्ण है। इसका मतलब है कि अंतर अब basic bug recognition या high-level exploit reasoning में नहीं, बल्कि उस अधिक कठिन engineering में हो सकता है जो किसी vulnerability को सीमित परिस्थितियों में एक पूरी तरह काम करने वाले attack में बदलता है।

दूसरे शब्दों में, replication studies यह साबित नहीं करते कि Mythos साधारण है। वे यह जरूर सुझाते हैं कि उसकी विशिष्टता को दिखाने वाले कुछ headline examples, पहली नज़र में जितने अनोखे लगे थे, उतने एकमात्र नहीं हो सकते।

AI सुरक्षा नीति के लिए यह क्यों मायने रखता है

इसके निहितार्थ एक मॉडल-विक्रेता विवाद से कहीं आगे जाते हैं। access restrictions, safety policies और national security debates increasingly इस पर निर्भर करते हैं कि कौन-से systems वास्तव में capability thresholds पार करते हैं। यदि छोटे या आंशिक रूप से खुले models दिखाए गए काम का बड़ा हिस्सा दोहरा सकते हैं, तो नीति-निर्माताओं और labs को यह परिभाषित करने की ज़रूरत होगी कि material novelty या विशेष रूप से खतरनाक क्या माना जाए।

यह frontier AI governance की केंद्रीय उलझनों में से एक है। कोई कंपनी शक्तिशाली model तक पहुँच सीमित करने में ईमानदार हो सकती है, लेकिन जिन public examples के आधार पर वह ये सीमाएँ उचित ठहराती है, उन्हें तेजी से बेहतर होते open ecosystem के विरुद्ध परखा जा सकता है। एक बार ऐसा हो जाने पर सवाल सिर्फ यह नहीं रहता कि flagship model मजबूत है या नहीं, बल्कि यह भी कि restricted capability पहले ही फैल रही है या नहीं।

लेख की रूपरेखा संकेत देती है कि AI-assisted cyber research में यही हो रहा है। जो क्षमताएँ हाल ही तक असाधारण लगती थीं, वे अब कम लागत पर और अधिक openness के साथ दोहराई जा सकती हैं, जितना कुछ vendors ने संकेत दिया था।

मॉडल बाज़ार के लिए प्रतिस्पर्धात्मक अर्थ

इसमें एक व्यावसायिक पहलू भी है। Mythos के इर्द-गिर्द Anthropic की positioning आंशिक रूप से इस धारणा पर निर्भर करती है कि वह offensive cyber capability के एक दुर्लभ tier में है। यदि सार्वजनिक या अर्ध-खुले मॉडल उसी काम का बड़ा हिस्सा लगभग हासिल कर सकते हैं, तो value proposition बदल जाती है।

यह reliability, depth या end-to-end automation के फायदे समाप्त नहीं करता। लेकिन यह इस narrative को कमजोर करता है कि केवल एक या दो संरक्षित systems ही meaningful autonomous vulnerability analysis कर सकते हैं। खरीदारों, evaluators और security researchers के लिए यह व्यापक model set में benchmarking pressure तेज कर सकता है।

यह agents और toolchains की भूमिका को भी model weights के बजाय अधिक महत्वपूर्ण बना सकता है। स्रोत में वर्णित replication efforts में से एक frontier models को open coding agent के साथ जोड़ता है, जो यह याद दिलाता है कि compound systems अक्सर किसी एक model की raw capability जितने ही महत्वपूर्ण होते जा रहे हैं।

कमज़ोर हुआ मिथ, लेकिन क्षमता का पतन नहीं

स्रोत लेख का शीर्षक जानबूझकर तीखा है, लेकिन वर्णित साक्ष्य एक अधिक सटीक निष्कर्ष का समर्थन करता है। Mythos की कहानी इसलिए नहीं ढह रही कि model में क्षमता नहीं है। वह इसलिए सीमित हो रही है क्योंकि उसकी विशिष्टता को नाटकीय बनाने के लिए उपयोग किए गए उदाहरण अब, कम-से-कम आंशिक रूप से, छोटे और अधिक खुले विकल्पों से मेल खा रहे हैं।

यह अभी भी एक बड़ा विकास है। AI में, status अक्सर absolute performance से अधिक comparative perception पर निर्भर करता है। यदि exclusivity का आभामंडल कमजोर पड़ता है, तो रणनीतिक बातचीत बदल जाती है।

Developments Today के पाठकों के लिए मुख्य निष्कर्ष यह है: AI cyber capability की frontier institutional narratives की तुलना में तेज़ी से फैल रही हो सकती है। Anthropic के पास अभी भी एक शक्तिशाली system हो सकता है। लेकिन अगर स्वतंत्र समूह cheaper और अधिक open models से उसके public showcase work का बड़ा हिस्सा दोहरा सकते हैं, तो असली कहानी अब केवल एक lab के extraordinary tool की नहीं रह जाती। यह एक ऐसी capability class की है जिसे monopolize करना कठिन होता जा रहा है.

यह लेख The Decoder की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on the-decoder.com