Mozilla के Firefox दावे ने पहले से तनावपूर्ण एआई सुरक्षा बहस को और तेज कर दिया है

Mozilla का कहना है कि Anthropic के Mythos Preview मॉडल ने Firefox 150 के रिलीज़ से पहले 271 सुरक्षा कमजोरियों की पहचान करने में मदद की, और यह परिणाम तुरंत इस दौड़ के दांव बढ़ा देता है कि उन्नत एआई साइबर सुरक्षा को कैसे प्रभावित करेगा।

Ars Technica द्वारा रिपोर्ट किया गया यह निष्कर्ष एक ऐसी बहस के लिए असामान्य रूप से ठोस प्रमाण जोड़ता है, जो अब तक मुख्यतः अटकलों, बेंचमार्क दावों और एआई कंपनियों की चेतावनियों से संचालित रही है। अप्रैल की शुरुआत में, Anthropic ने कहा था कि Mythos vulnerabilities खोजने में इतना प्रभावी था कि कंपनी ने इसकी शुरुआती रिलीज़ को कुछ चुनिंदा महत्वपूर्ण उद्योग भागीदारों तक सीमित कर दिया। Mozilla का बताया गया अनुभव अब इस क्षमता का सबसे स्पष्ट वास्तविक-संकेतों में से एक है।

Firefox के CTO बॉबी हॉली ने इसके निहितार्थों को बड़े शब्दों में रखा, यह तर्क देते हुए कि रक्षात्मक सुरक्षा टीमें आखिरकार बढ़त हासिल कर सकती हैं। 271 खामियों के बारे में विस्तृत गंभीरता-स्तर की जानकारी के बिना भी, इस रिपोर्टेड परिणाम का पैमाना अनदेखा करना मुश्किल है।

कुछ दर्जन बग्स से एक ही रिलीज़ चक्र में सैकड़ों तक

स्रोत रिपोर्ट में सबसे चौंकाने वाली तुलना एआई और इंसानों के बीच नहीं, बल्कि एआई मॉडलों की एक पीढ़ी और अगली के बीच है। हॉली ने कहा कि Anthropic के Opus 4.6 मॉडल ने पिछले महीने Firefox 148 का विश्लेषण करते समय 22 सुरक्षा-संवेदनशील बग खोजे थे। Mythos Preview ने, जब Firefox 150 की जांच की, कथित तौर पर 271 कमजोरियां उजागर कीं।

यदि ये आंकड़े सीधे तुलना योग्य हैं, तो यह उछाल नाटकीय है। यह संकेत देता है कि भेद्यता विश्लेषण में मॉडल प्रगति रैखिक नहीं हो सकती। कोड या खोज-स्थितियों में अंतर को ध्यान में रखते हुए भी, इतनी कम अवधि में कुछ दर्जन से सैकड़ों निष्कर्षों तक पहुंचना क्षमता में सार्थक बदलाव का संकेत देता है।

स्रोत रिपोर्ट कहती है कि मॉडल ने इन समस्याओं को बस अप्रकाशित सोर्स कोड का विश्लेषण करके खोजा। यह बात इसलिए महत्वपूर्ण है क्योंकि यह मॉडल को बड़े पैमाने पर चलने वाले स्वचालित फज़िंग इंजन की बजाय एक तर्कशील प्रणाली के रूप में पेश करती है, जो कोडबेस पढ़ सकती है और संभावित कमजोरियों को चिन्हित कर सकती है।

हॉली ने इस काम की तुलना या तो स्वचालित फज़िंग से या जटिल ब्राउज़र कोड में गहराई से तर्क करने वाले श्रेष्ठ मानव शोधकर्ताओं से की। उनके अनुसार वास्तविक अंतर लागत और गति का है। यदि कोई एआई मॉडल महीनों की केंद्रित विशेषज्ञ मेहनत के बिना सुरक्षा खामियां ढूंढ सकता है, तो रक्षात्मक समीक्षा सस्ती और अधिक स्केलेबल बन जाती है।