Anthropic ची सायबरसुरक्षा कथा replication च्या दबावाखाली
Anthropic ने Claude Mythos ला काटेकोरपणे नियंत्रित असलेला cybersecurity model म्हणून सादर केले आहे, ज्याची क्षमता restricted access ला योग्य ठरवेल इतकी मजबूत असल्याचा दावा करण्यात आला आहे. दिलेल्या स्रोत-पाठ्यानुसार, कंपनीने Project Glasswing द्वारे Mythos Preview ला अकरा संस्थांच्या consortium पुरते मर्यादित ठेवले, कारण म्हणून offensive potential सांगितले. अंतर्गत चाचण्या आणि UK’s AI Security Institute ने केलेल्या audit मध्ये, model software bugs शोधू शकतो, स्वतः working exploits तयार करू शकतो आणि simulation मध्ये संपूर्ण corporate networks compromise करू शकतो असे आढळल्याचे सांगितले गेले; मात्र त्या network लहान, कमी सुरक्षित आणि vulnerable असणे आवश्यक होते.
हे गंभीर दावे आहेत, आणि नवीन घडामोड अशी नाही की ते खोटे ठरले आहेत. exclusivity narrative च्या काही भागांना आता आव्हान मिळत आहे, इतकेच. स्रोतामध्ये वर्णन केलेल्या दोन स्वतंत्र replication प्रयत्नांनी सूचित केले आहे की लहान आणि अधिक open models Anthropic ने सार्वजनिकपणे दाखवलेल्या vulnerability analysis चा मोठा भाग पुन्हा तयार करू शकतात.
हा फरक महत्त्वाचा आहे. वाद आता Mythos सक्षम आहे का यावरून, दाखवलेली क्षमता खरोखरच अद्वितीय आहे का याकडे वळला आहे.
Replication प्रयत्नांनी काय शोधले
पहिला replication प्रयत्न AISLE कडून आला, जी mid-2025 पासून open source software वर AI-assisted bug hunting चालवत आहे. स्रोत सांगतो की AISLE ने OpenSSL मध्ये 15 vulnerabilities आणि curl मध्ये पाच vulnerabilities अहवालित केल्या आहेत. संस्थापक Stanislav Fort यांनी Anthropic च्या public samples मधील code snippets वापरून विविध लहान आणि अंशतः open models स्वतः किती दूर जाऊ शकतात याची चाचणी घेतली.
दुसरा प्रयत्न Vidoc Security कडून आला, ज्यांनी GPT-5.4 आणि Claude Opus 4.6 यांना open coding agent OpenCode सोबत जोडले. एकत्रितपणे, हे अभ्यास एका व्यावहारिक प्रश्नाचे उत्तर शोधतात: Anthropic जेव्हा प्रभावी bug-finding किंवा exploit reasoning दाखवते, तेव्हा त्यातील किती भाग Mythos साठीच खास आहे, आणि किती भाग model landscape मध्ये पसरत चाललेल्या capability frontier चे प्रतिबिंब आहे?
स्रोत-पाठ्यातील सुरुवातीचा इशारा असा दिसतो की Anthropic च्या access controls पेक्षा ही frontier अधिक व्यापक असू शकते.
FreeBSD उदाहरण हे मुख्य कसोटीचे प्रकरण
दिलेल्या साहित्यामधील सर्वात ठोस उदाहरण म्हणजे एक FreeBSD NFS bug, ज्याला CVE-2026-4747 असे ओळखले गेले. Anthropic ने हा प्रसंग Mythos च्या autonomous discovery आणि exploitation चा पुरावा म्हणून मांडला होता. त्यानंतर AISLE ने संबंधित function विरुद्ध आठ models ची चाचणी घेतली आणि, लेखानुसार, प्रत्येक model ने तो memory bug शोधून काढला.
हे अहवालातील सर्वात मजबूत आव्हान आहे. सर्व आठ models ने केवळ तो flaw critical म्हणून ओळखला नाही, तर exploitation कशी होऊ शकते आणि standard operating-system protections का लागू होणार नाहीत याबद्दलही plausible reasoning तयार केले. GPT-OSS-120b नावाच्या एका model ने AISLE च्या मते प्रत्यक्ष exploit जवळ जाणारा gadget sequence तयार केला. Kimi K2 ने, लेख सांगतो, हल्ला एका संक्रमित machine वरून दुसऱ्या machine कडे आपोआप पसरू शकतो असेही गृहित धरले, जी गोष्ट Anthropic ने स्वतः सांगितली नव्हती.
जर हे निकाल अचूक असतील, तर अशा प्रकारची vulnerability ओळखणे आणि विश्लेषण करणे हे एका काटेकोरपणे नियंत्रित model चेच वैशिष्ट्य आहे हा विचार कमकुवत होतो.
फरक अजून कुठे दिसतो
त्याच वेळी, स्रोत-पाठ्य Mythos आणि लहान open models मधील सर्व फरक नष्ट करत नाही. तो exploit chain मधील अधिक कठीण creative step कडे निर्देश करतो: 1,000 bytes पेक्षा जास्त payload सुमारे 304 bytes उपलब्ध जागेत बसवणे. लेखानुसार, Mythos ने हे 15 वेगवेगळ्या network requests मध्ये payload विभागून साध्य केले. वर्णन केलेल्या replication प्रयत्नांपैकी कोणतेही visible text मध्ये त्या पातळीच्या exploit construction च्या बरोबरीचे नव्हते.
हा nuance अत्यंत महत्त्वाचा आहे. याचा अर्थ gap आता basic bug recognition किंवा high-level exploit reasoning मध्ये नसून, मर्यादित परिस्थितीत vulnerability ला पूर्णपणे कार्यक्षम attack मध्ये रूपांतरित करण्यासाठी लागणाऱ्या कठीण engineering मध्ये असू शकतो.
दुसऱ्या शब्दांत सांगायचे तर, replication studies Mythos सामान्य आहे हे सिद्ध करत नाहीत. पण त्यातून असे सुचते की त्याची अनन्यता दाखवण्यासाठी वापरलेली काही headline examples सुरुवातीला वाटली तितकी एकमेव नसावीत.
AI सुरक्षा धोरणासाठी हे का महत्त्वाचे आहे
याचे परिणाम model vendor मधील वादापेक्षा खूप पुढे जातात. access restrictions, safety policies आणि national security debates increasingly कोणती systems खरोखर capability threshold ओलांडतात या दाव्यांवर अवलंबून आहेत. लहान किंवा अंशतः open models दाखवलेले काम मोठ्या प्रमाणावर पुन्हा तयार करू शकत असतील, तर policymakers आणि labs ना material novelty किंवा विशेष धोकादायक काय समजायचे याची अधिक स्पष्ट व्याख्या लागेल.
हे frontier AI governance मधील मुख्य ताणांपैकी एक आहे. एखादी कंपनी शक्तिशाली model वर access मर्यादित करण्यात प्रामाणिक असू शकते, पण त्या मर्यादा योग्य ठरवण्यासाठी वापरलेली public examples वेगाने सुधारत चाललेल्या open ecosystem विरुद्ध तपासली जाऊ शकतात. ते घडल्यावर प्रश्न फक्त flagship model मजबूत आहे का, एवढाच राहत नाही; restricted capability आधीच पसरत आहे का, हा होतो.
लेखाची मांडणी सूचित करते की AI-assisted cyber research मध्ये हेच घडत आहे. अलीकडेच असाधारण वाटणाऱ्या क्षमता आता काही vendor ने सूचित केले त्यापेक्षा कमी खर्चात आणि अधिक openness सह पुन्हा तयार करता येत आहेत.
Model market साठी स्पर्धात्मक अर्थ
यात व्यावसायिक बाजूही आहे. Mythos भोवती Anthropic चे positioning काही अंशी या विश्वासावर आधारलेले आहे की तो offensive cyber capability च्या दुर्मीळ स्तरात आहे. सार्वजनिक किंवा अर्ध-ओपन models जर त्याच कामाचा मोठा भाग जवळपास करू शकत असतील, तर value proposition बदलते.
यामुळे reliability, depth किंवा end-to-end automation चे फायदे नाहीसे होत नाहीत. पण meaningful autonomous vulnerability analysis फक्त एक-दोन protected systems करू शकतात हा narrative कमकुवत होतो. खरेदीदार, मूल्यांकनकर्ते आणि security researchers साठी हे अधिक विस्तृत model सेटमध्ये benchmarking pressure वाढवू शकते.
हे model weights पेक्षा agents आणि toolchains च्या भूमिकेला अधिक बळ देऊ शकते. स्रोतामध्ये वर्णन केलेल्या replication प्रयत्नांपैकी एक frontier models ना open coding agent सोबत जोडतो; हे compound systems एका model च्या raw capability इतकेच, कधी कधी त्याहूनही अधिक, महत्त्वाचे होत चालले आहेत याची आठवण करून देते.
मिथक कमी होत आहे, पण क्षमता कोसळत नाही
मूळ लेखाचे शीर्षक मुद्दाम धारदार आहे, पण वर्णन केलेले पुरावे अधिक अचूक निष्कर्षाला पाठिंबा देतात. Mythos ची कथा model कडे क्षमता नाही म्हणून कोसळत नाही. त्याची अनन्यता dramatize करण्यासाठी वापरलेली उदाहरणे आता किमान काही अंशी लहान आणि अधिक open पर्यायांशी जुळत असल्याने ती कमी प्रभावी ठरत आहेत.
हे तरीही मोठे घडामोडीचे चिन्ह आहे. AI मध्ये status अनेकदा absolute performance पेक्षा comparative perception वर अधिक अवलंबून असतो. exclusivity ची झळाळी कमी झाली, तर strategic conversation बदलते.
Developments Today च्या वाचकांसाठी मुख्य takeaway असे आहे: AI cyber capability ची frontier institutional narratives नियंत्रित करू शकतात त्यापेक्षा वेगाने पसरत असावी. Anthropic कडे अजूनही शक्तिशाली system असू शकतो. पण जर स्वतंत्र गट स्वस्त आणि अधिक open models वापरून त्याच्या public showcase work चा मोठा भाग पुन्हा तयार करू शकत असतील, तर खरे कथानक आता एका lab च्या extraordinary tool बद्दल नाही. ते एका capability class बद्दल आहे, जी monopolize करणे अधिक कठीण होत आहे.
हा लेख The Decoder च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.
Originally published on the-decoder.com




