Anthropic प्रतिबंधित AI मॉडल तक कथित पहुंच की समीक्षा कर रहा है

Anthropic ने पुष्टि की है कि वह Claude Mythos Preview तक अनधिकृत पहुंच की एक रिपोर्ट की जांच कर रहा है, जिसे कंपनी ने सार्वजनिक रिलीज़ के लिए अत्यधिक खतरनाक बताया है। बताया गया है कि यह पहुंच एक तृतीय-पक्ष विक्रेता वातावरण के माध्यम से हुई।

Bloomberg द्वारा रिपोर्ट की गई और Gizmodo द्वारा आगे प्रसारित कंपनी की बयानबाजी में कहा गया कि Anthropic को एक रिपोर्ट मिली थी जिसमें दावा किया गया था कि उसके किसी तृतीय-पक्ष विक्रेता वातावरण के माध्यम से Claude Mythos Preview तक अनधिकृत पहुंच बनाई गई। Bloomberg ने कथित रूप से उस समूह के एक सदस्य का लाइव डेमो और स्क्रीनशॉट देखे, जिसे इस पहुंच के लिए जिम्मेदार बताया गया।

सार्वजनिक रूप से उपलब्ध तथ्य सीमित हैं, और रिपोर्ट में शामिल लोगों और तरीकों की पहचान को लेकर सावधानी बरती गई है। फिर भी, यह घटना अग्रिम पंक्ति के AI प्रयोगशालाओं के लिए एक गंभीर शासन संबंधी प्रश्न उठाती है: जब किसी मॉडल को सार्वजनिक रिलीज़ से दूर रखा जाता है, तब भी विक्रेता पहुंच और आंतरिक टूलिंग ऐसे रास्ते बना सकती है जिन्हें स्वयं मॉडल से अधिक सुरक्षित रखना कठिन हो।

कथित पहुंच कैसे हुई

लेख में संक्षेपित स्रोत विवरण के अनुसार, समूह ने कई सूचनाओं को एक साथ जोड़ा। बताया गया है कि एक Discord समूह ने अनरिलीज़्ड AI मॉडलों की जानकारी खोजने के लिए bots का उपयोग किया। विवरण में AI प्रशिक्षण स्टार्टअप Mercor में एक डेटा उल्लंघन का भी उल्लेख है। इसके बाद समूह ने कथित तौर पर उस जानकारी को Anthropic के एक ठेकेदार के यहां काम करने वाले व्यक्ति की उपलब्ध पहुंच के साथ जोड़ दिया।

बताया गया है कि घटनाओं की उस श्रृंखला ने समूह को Claude Mythos की ऑनलाइन स्थिति का अनुमान लगाने में सक्षम बनाया। कहा जाता है कि समूह ने 7 अप्रैल से मॉडल तक पहुंच बनाई हुई थी, जो वही दिन है जब Anthropic ने Project Glasswing की घोषणा की थी।

रिपोर्ट में उद्धृत स्रोत ने दावा किया कि समूह को नुकसान पहुंचाने के बजाय नए मॉडलों के साथ प्रयोग करने में दिलचस्पी थी। यह दावा पहुंच संबंधी मुद्दे की गंभीरता को कम नहीं करता। यदि कोई प्रतिबंधित मॉडल किसी अनधिकृत पक्ष के लिए उपलब्ध है, तो जोखिम केवल इस बात पर निर्भर नहीं करता कि पहली रिपोर्ट में शामिल समूह का इरादा क्या था।

विक्रेता जोखिम की समस्या

रिपोर्ट की गई यह घटना उच्च-सुरक्षा तकनीकी संचालन के एक सामान्य कमजोर बिंदु को उजागर करती है: मुख्य कंपनी अपने सिस्टम को बंद रख सकती है, जबकि ठेकेदार, विक्रेता और साझेदार वातावरण पर्याप्त पहुंच बनाए रखते हैं और आकर्षक लक्ष्य बन जाते हैं।

AI कंपनियों के लिए दांव असामान्य रूप से बड़े हैं। एक अग्रिम पंक्ति का मॉडल सिर्फ एक फ़ाइल या सेवा नहीं होता। उसमें ऐसी क्षमताएं समाहित हो सकती हैं जिन्हें डेवलपर ने जानबूझकर सार्वजनिक रिलीज़ से रोका है। यदि प्रीव्यू मॉडलों, मूल्यांकन प्रणालियों, या ठेकेदार वातावरण के आसपास पहुंच नियंत्रण कमजोर हैं, तो कंपनी की रिलीज़ नीति मॉडल के लॉन्च से पहले ही कमजोर पड़ सकती है।

रिपोर्ट पहुंच की पूरी सीमा, क्या मॉडल वेट्स उजागर हुए, या पहुंच केवल किसी इंटरफ़ेस तक सीमित थी, यह स्थापित नहीं करती। ये भेद महत्वपूर्ण हैं। इंटरफ़ेस पहुंच भी जोखिमपूर्ण हो सकती है, लेकिन यह मॉडल वेट्स या प्रशिक्षण परिसंपत्तियों की चोरी से अलग है। Anthropic की जांच को यह तय करना होगा कि वास्तव में क्या पहुंच योग्य था, कितनी देर तक था, और किन प्रणालियों के माध्यम से था।

Anthropic से परे यह क्यों महत्वपूर्ण है

AI प्रयोगशालाएं मूल्यांकन, डेटा कार्य, रेड टीमिंग, लेबलिंग और संचालन के लिए तेजी से बाहरी ठेकेदारों पर निर्भर हो रही हैं। ये वर्कफ़्लो व्यापक पहुंच पैटर्न बना सकते हैं जिन्हें निगरानी में रखना कठिन होता है, खासकर जब टीमें अनरिलीज़्ड प्रणालियों को बनाने और परीक्षण करने के लिए तेजी से आगे बढ़ रही हों।

इसलिए Claude Mythos की रिपोर्ट अग्रिम मॉडल सुरक्षा पर एक बड़े उद्योग-विवाद के बीच आती है। यदि कंपनियां तर्क देती हैं कि कुछ मॉडल रिलीज़ करने के लिए बहुत शक्तिशाली हैं, तो उन्हें यह भी दिखाना होगा कि प्रतिबंधित पहुंच कार्यक्रम, विक्रेता प्रणालियां और आंतरिक प्रीव्यू वातावरण समान गंभीरता से शासित हैं।

यह विश्वास का मुद्दा भी है। सरकारें, एंटरप्राइज़ ग्राहक और जनता से यह स्वीकार करने को कहा जा रहा है कि AI डेवलपर लगातार अधिक सक्षम प्रणालियों को सुरक्षित रूप से प्रबंधित कर सकते हैं। विक्रेता वातावरण के माध्यम से कथित अनधिकृत पहुंच उस दावे की परीक्षा लेने वाली विफलता का उदाहरण है।

आगे क्या देखना है

अब मुख्य प्रश्न ठोस हैं। Anthropic को यह निर्धारित करना होगा कि क्या कथित पहुंच हुई थी, क्या कोई संवेदनशील डेटा या मॉडल क्षमताएं उजागर हुईं, क्या पहुंच काट दी गई है, और क्या तृतीय-पक्ष विक्रेता नियंत्रणों में बदलाव की जरूरत है।

व्यापक AI क्षेत्र इस बात के संकेतों पर नजर रखेगा कि क्या प्रयोगशालाएं ठेकेदार पहुंच को कड़ा कर रही हैं, प्रीव्यू प्रणालियों के आसपास निगरानी बेहतर कर रही हैं, और अनरिलीज़्ड मॉडलों के बारे में खोजी जा सकने वाली जानकारी सीमित कर रही हैं। सबसे महत्वपूर्ण सीख यह हो सकती है कि मॉडल सुरक्षा केवल एक अनुसंधान समस्या नहीं है। यह एक अवसंरचना, पहुंच नियंत्रण और विक्रेता प्रबंधन की समस्या भी है।

यह लेख Gizmodo की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on gizmodo.com