मर्यादित AI मॉडेलवरील कथित प्रवेशाची Anthropic कडून समीक्षा
Anthropic ने पुष्टी केली आहे की Claude Mythos Preview वर अनधिकृत प्रवेशाच्या अहवालाची ती चौकशी करत आहे, ज्याला कंपनीने सार्वजनिक प्रकाशनासाठी अतिधोकादायक असे वर्णन केले आहे. हा प्रवेश तृतीय-पक्ष विक्रेता वातावरणामार्फत झाल्याचे सांगितले गेले आहे.
Bloomberg ने अहवाल दिलेल्या आणि Gizmodo ने पुढे मांडलेल्या कंपनीच्या निवेदनात, Anthropic ने सांगितले की त्यांच्या एका तृतीय-पक्ष विक्रेता वातावरणामार्फत Claude Mythos Preview वर अनधिकृत प्रवेश झाल्याचा दावा करणारा अहवाल त्यांना प्राप्त झाला होता. Bloomberg ने कथितरित्या त्या प्रवेशासाठी जबाबदार असल्याचे सांगितलेल्या गटातील एका सदस्याकडून लाईव्ह डेमो आणि स्क्रीनशॉट्स पाहिले.
सार्वजनिकरित्या उपलब्ध तथ्ये मर्यादित आहेत, आणि अहवालात संबंधित लोक आणि पद्धती ओळखताना काळजी घेतली आहे. तरीही, ही घटना अग्रगण्य AI लॅब्ससाठी एक गंभीर प्रशासनिक प्रश्न उभा करते: एखादे मॉडेल सार्वजनिक प्रकाशनापासून दूर ठेवले तरी, विक्रेता प्रवेश आणि अंतर्गत साधने अशी दारे निर्माण करू शकतात जी मॉडेलपेक्षाही अधिक सुरक्षित ठेवणे कठीण असते.
कथित प्रवेश कसा झाला
लेखात संक्षेपित केलेल्या स्रोत कथनानुसार, त्या गटाने अनेक माहितीचे तुकडे एकत्र केले. एक Discord गट अप्रकाशित AI मॉडेल्सची माहिती शोधण्यासाठी bots वापरत होता, असे सांगितले जाते. त्या कथनात AI प्रशिक्षण स्टार्टअप Mercor मधील डेटा भंगाचाही उल्लेख आहे. नंतर त्या गटाने ती माहिती Anthropic च्या एका कंत्राटदाराकडे काम करणाऱ्या व्यक्तीला उपलब्ध असलेल्या प्रवेशाशी जोडल्याचा आरोप आहे.
घटनांच्या त्या साखळीमुळे गटाला Claude Mythos चे ऑनलाइन स्थान ओळखता आले, असे सांगितले जाते. Anthropic ने Project Glasswing जाहीर केले त्याच दिवशी, 7 एप्रिलपासून त्या गटाने मॉडेलला प्रवेश मिळवला, असेही म्हटले आहे.
अहवालात उद्धृत केलेल्या स्रोताने दावा केला की गटाचा हेतू नुकसान करणे नव्हे, तर नवीन मॉडेल्सवर प्रयोग करणे हा होता. तो दावा प्रवेश समस्येचे गांभीर्य कमी करत नाही. जर एखादे मर्यादित मॉडेल अनधिकृत पक्षासाठी उपलब्ध असेल, तर जोखीम केवळ पहिल्या अहवालात नमूद केलेल्या गटाच्या हेतूवर अवलंबून नसते.
विक्रेता जोखमीचा प्रश्न
हा कथित प्रकार उच्च-सुरक्षा तंत्रज्ञान संचालनातील एक सामान्य कमकुवत दुवा दाखवतो: मुख्य कंपनी स्वतःची प्रणाली बंद ठेवू शकते, तर कंत्राटदार, विक्रेते आणि भागीदार वातावरण पुरेसा प्रवेश राखून आकर्षक लक्ष्य बनू शकतात.
AI कंपन्यांसाठी यातला दाव मोठा आहे. अग्रगण्य मॉडेल हे केवळ एक फाइल किंवा सेवा नसते. त्यात असे सामर्थ्य असू शकते जे विकसकाने जाणूनबुजून सार्वजनिक प्रकाशनापासून दूर ठेवलेले असते. प्रीव्ह्यू मॉडेल्स, मूल्यांकन प्रणाली किंवा कंत्राटदार वातावरणाभोवतीची प्रवेश-नियंत्रणे कमजोर असतील, तर मॉडेल सुरू होण्यापूर्वीच कंपनीच्या प्रकाशन धोरणाला धक्का लागू शकतो.
हा अहवाल प्रवेशाचा संपूर्ण व्याप, मॉडेल वेट्स उघड झाले का, किंवा प्रवेश फक्त एखाद्या इंटरफेसपुरता मर्यादित होता का, हे ठरवत नाही. हे फरक महत्त्वाचे आहेत. इंटरफेस प्रवेशही धोकादायक असू शकतो, पण तो मॉडेल वेट्स किंवा प्रशिक्षण मालमत्ता चोरी करण्यापेक्षा वेगळा आहे. Anthropic च्या तपासात नेमके काय उपलब्ध होते, किती काळ, आणि कोणत्या प्रणालींमधून, हे ठरवावे लागेल.
Anthropic पलीकडे हे का महत्त्वाचे आहे
AI लॅब्स मूल्यांकन, डेटा काम, red teaming, लेबलिंग आणि ऑपरेशन्ससाठी बाहेरील कंत्राटदारांवर अधिकाधिक अवलंबून आहेत. या वर्कफ्लोमुळे व्यापक प्रवेश पद्धती तयार होऊ शकतात, ज्यांचे निरीक्षण करणे कठीण असते, विशेषतः जेव्हा टीम्स अप्रकाशित प्रणाली तयार आणि चाचणी करण्यासाठी वेगाने काम करत असतात.
म्हणूनच Claude Mythos अहवाल अग्रगण्य मॉडेल सुरक्षिततेवरील व्यापक उद्योग चर्चेच्या केंद्रस्थानी येतो. काही मॉडेल्स प्रकाशनासाठी अतिशक्तिशाली आहेत, असा दावा कंपन्या करत असतील, तर त्यांनी हेही दाखवले पाहिजे की मर्यादित प्रवेश कार्यक्रम, विक्रेता प्रणाली आणि अंतर्गत प्रीव्ह्यू वातावरण यांचेही तितक्याच गांभीर्याने व्यवस्थापन केले जात आहे.
हा विश्वासाचाही प्रश्न आहे. AI विकासक अधिक सक्षम प्रणाली सुरक्षितपणे हाताळू शकतात, हे सरकारे, उद्योग ग्राहक आणि जनतेला मान्य करायला सांगितले जात आहे. विक्रेता वातावरणातून झालेला कथित अनधिकृत प्रवेश हा त्या दाव्याची परीक्षा घेणारा अपयश प्रकार आहे.
पुढे काय पाहायचे
आता मुख्य प्रश्न ठोस आहेत. Anthropic ला ठरवावे लागेल की असा प्रवेश प्रत्यक्षात झाला का, कोणतेही संवेदनशील डेटा किंवा मॉडेल क्षमता उघड झाली का, तो प्रवेश बंद केला आहे का, आणि तृतीय-पक्ष विक्रेता नियंत्रणांमध्ये बदल आवश्यक आहेत का.
व्यापक AI क्षेत्रही याकडे लक्ष ठेवेल की लॅब्स कंत्राटदार प्रवेश कडक करत आहेत का, प्रीव्ह्यू प्रणालींवरील निरीक्षण सुधारत आहेत का, आणि अप्रकाशित मॉडेल्सबद्दल शोधता येणारी माहिती मर्यादित करत आहेत का. सर्वात महत्त्वाचा धडा असा की मॉडेल सुरक्षा ही केवळ संशोधनाची समस्या नाही. ती पायाभूत सुविधा, प्रवेश नियंत्रण, आणि विक्रेता व्यवस्थापनाचीही समस्या आहे.
हा लेख Gizmodo च्या रिपोर्टिंगवर आधारित आहे. मूळ लेख वाचा.
Originally published on gizmodo.com





