கட்டுப்படுத்தப்பட்ட AI மாடலுக்கு ஏற்பட்டதாகக் கூறப்படும் அணுகலை Anthropic ஆய்வு செய்கிறது
பொது வெளியீட்டிற்கு மிக ஆபத்தானது என்று நிறுவனம் விவரித்துள்ள Claude Mythos Preview-க்கு அனுமதியில்லா அணுகல் நடந்ததாக வந்துள்ள தகவலை Anthropic விசாரித்து வருவதாக உறுதிப்படுத்தியுள்ளது. இந்த அணுகல் மூன்றாம் தரப்பு விற்பனையாளர் சூழல் வழியாக ஏற்பட்டதாகக் கூறப்படுகிறது.
Bloomberg செய்தியாக வெளியிட்டு, Gizmodo அதனைத் தொடர்ந்த Anthropic-இன் அறிக்கையில், தனது எந்த ஒரு மூன்றாம் தரப்பு விற்பனையாளர் சூழலின் வழியாகவும் Claude Mythos Preview-க்கு அனுமதியில்லா அணுகல் ஏற்பட்டதாகக் கூறும் தகவல் கிடைத்ததாக நிறுவனம் தெரிவித்துள்ளது. அந்த அணுகலுக்கு பொறுப்பானதாகக் கூறப்படும் குழுவின் ஒருவரிடமிருந்து கிடைத்த நேரடி டெமோவும் ஸ்கிரீன்ஷாட்களும் Bloomberg மூலம் பார்க்கப்பட்டதாக கூறப்படுகிறது.
பொதுவாக கிடைக்கும் தகவல்கள் குறைவாக உள்ளன, மேலும் அறிக்கையில் தொடர்புடைய நபர்கள் மற்றும் முறைகளை அடையாளப்படுத்துவதில் எச்சரிக்கை கடைப்பிடிக்கப்பட்டுள்ளது. இருப்பினும், இந்த சம்பவம் முன்னணி AI ஆய்வகங்களுக்கு ஒரு முக்கிய நிர்வாகக் கேள்வியை எழுப்புகிறது: ஒரு மாடல் பொதுவெளியீட்டில் இருந்து வைக்கப்பட்டாலும், விற்பனையாளர் அணுகல் மற்றும் உள் கருவிகள் மாடலை விடப் பாதுகாப்பது கடினமான பாதைகளை உருவாக்கக்கூடும்.
கூறப்படும் அணுகல் எப்படி ஏற்பட்டது
கட்டுரையில் சுருக்கமாக கூறப்பட்ட மூலக் கணக்கின்படி, அந்தக் குழு பல தகவல் துண்டுகளை ஒன்றிணைத்தது. வெளிவராத AI மாடல்கள் குறித்த தகவல்களைத் தேடுவதற்கு ஒரு Discord குழு bots-ஐ பயன்படுத்தியதாகக் கூறப்படுகிறது. அதில் AI பயிற்சி ஸ்டார்ட்அப் Mercor-இல் ஏற்பட்ட தரவு மீறலையும் குறிப்பிடுகிறது. பின்னர் அந்தக் குழு, Anthropic ஒப்பந்ததாரரிடம் பணிபுரிந்த ஒருவருக்குக் கிடைத்திருந்த அணுகலுடன் அந்தத் தகவலை இணைத்ததாகக் கூறப்படுகிறது.
அந்த நிகழ்வுகளின் தொடர் Claude Mythos-இன் ஆன்லைன் இருப்பிடத்தை அந்தக் குழு ஊகிக்க உதவியதாகக் கூறப்படுகிறது. Anthropic Project Glasswing-ஐ அறிவித்த அதே நாளான ஏப்ரல் 7 முதல் அந்தக் குழு மாடலை அணுகியதாகவும் கூறப்படுகிறது.
அறிக்கையில் மேற்கோளிடப்பட்ட மூலக் கருத்துப்படி, அந்தக் குழு தீங்கு விளைவிப்பதைவிட புதிய மாடல்களைச் சோதிக்கவே ஆர்வமாக இருந்தது. ஆனால் அந்தக் கூற்று அணுகல் சம்பவத்தின் தீவிரத்தை குறைக்காது. ஒரு கட்டுப்படுத்தப்பட்ட மாடல் அனுமதியில்லாத தரப்புக்கு கிடைக்குமானால், முதல் தகவலில் கூறப்படும் குழு என்ன செய்ய நினைத்தது என்பதிலேயே ஆபத்து சார்ந்திருக்காது.
விற்பனையாளர் அபாயப் பிரச்சினை
இந்தக் கூறப்படும் சம்பவம் உயர்பாதுகாப்பு தொழில்நுட்ப செயல்பாடுகளில் உள்ள ஒரு பொதுவான பலவீனத்தை வெளிப்படுத்துகிறது: பிரதான நிறுவனம் தனது சொந்த அமைப்புகளைப் பூட்டி வைத்திருக்கலாம், ஆனால் ஒப்பந்ததாரர்கள், விற்பனையாளர்கள் மற்றும் கூட்டாளர் சூழல்கள் போதுமான அணுகலை வைத்திருந்து கவர்ச்சிகரமான இலக்குகளாக மாறக்கூடும்.
AI நிறுவனங்களுக்கு இதில் பங்கு அதிகம். ஒரு முன்னணி மாடல் என்பது வெறும் கோப்பு அல்லது சேவை மட்டுமல்ல. அது உருவாக்குநர் பொது வெளியீட்டில் இருந்து குறிப்பாகத் தவிர்த்துள்ள திறன்களை கொண்டிருக்கலாம். ப்ரீவ்யூ மாடல்கள், மதிப்பீட்டு அமைப்புகள் அல்லது ஒப்பந்ததாரர் சூழல்களைச் சுற்றியுள்ள அணுகல் கட்டுப்பாடுகள் பலவீனமாக இருந்தால், மாடல் வெளியிடப்படுவதற்கு முன்பே நிறுவனத்தின் வெளியீட்டுக் கொள்கை பாதிக்கப்படலாம்.
அறிக்கை அணுகலின் முழு பரப்பளவு, மாடல் எடைகள் வெளிப்பட்டனவா, அல்லது அணுகல் ஒரு இடைமுகத்துக்கே மட்டுப்பட்டதா என்பதைக் கூறவில்லை. அந்த வேறுபாடுகள் முக்கியமானவை. இடைமுக அணுகல் கூட ஆபத்தானதாக இருக்கலாம், ஆனால் அது மாடல் எடைகள் அல்லது பயிற்சி சொத்துகளின் திருட்டிலிருந்து வேறானது. Anthropic-ன் விசாரணை, உண்மையில் எதற்கு அணுகல் இருந்தது, எவ்வளவு நேரம், மற்றும் எந்த அமைப்புகள் வழியாக என்பதைத் துல்லியமாக நிர்ணயிக்க வேண்டும்.
Anthropic-ஐத் தாண்டி இது ஏன் முக்கியம்
AI ஆய்வகங்கள் மதிப்பீடு, தரவு வேலை, red teaming, லேபிளிங் மற்றும் செயல்பாடுகளுக்காக வெளியக ஒப்பந்ததாரர்களை அதிகமாக நம்புகின்றன. அந்த வேலைப்போக்குகள் பரந்த அணுகல் முறைகளை உருவாக்கலாம், அவற்றை கண்காணிப்பது கடினமாகும், குறிப்பாக வெளிவராத அமைப்புகளை உருவாக்கவும் சோதிக்கவும் குழுக்கள் வேகமாக நகரும் போது.
அதனால் Claude Mythos அறிக்கை முன்னணி மாடல் பாதுகாப்பு குறித்த பெரிய தொழில் விவாதத்தின் மத்தியில் வருகிறது. சில மாடல்கள் வெளியீட்டுக்கு மிக சக்திவாய்ந்தவை என்று நிறுவனங்கள் வாதிடுகிறால், அதே தீவிரத்துடன் கட்டுப்படுத்தப்பட்ட அணுகல் திட்டங்கள், விற்பனையாளர் அமைப்புகள் மற்றும் உள் ப்ரீவ்யூ சூழல்களும் நிர்வகிக்கப்பட வேண்டும் என்பதையும் காட்ட வேண்டும்.
இது நம்பிக்கை தொடர்பான விஷயமும் கூட. AI உருவாக்குநர்கள் மேலும் சக்திவாய்ந்த அமைப்புகளை பாதுகாப்பாக நிர்வகிக்க முடியும் என்பதை அரசாங்கங்கள், நிறுவன வாடிக்கையாளர்கள், மற்றும் பொதுமக்கள் ஏற்க வேண்டியுள்ளது. விற்பனையாளர் சூழல் வழியாக ஏற்பட்டதாகக் கூறப்படும் அனுமதியில்லா அணுகல் அந்தக் கூற்றைச் சோதிக்கும் வகையிலான தோல்வி.
அடுத்து கவனிக்க வேண்டியது
இப்போது முக்கியக் கேள்விகள் தெளிவானவை. உண்மையில் அந்த அணுகல் நடந்ததா, ஏதேனும் சென்சிட்டிவ் தரவு அல்லது மாடல் திறன்கள் வெளிப்பட்டனவா, அந்த அணுகல் துண்டிக்கப்பட்டுவிட்டதா, மற்றும் மூன்றாம் தரப்பு விற்பனையாளர் கட்டுப்பாடுகளை மாற்ற வேண்டுமா என்பதைக் Anthropic தீர்மானிக்க வேண்டும்.
பெரிய AI துறையும் ஆய்வகங்கள் ஒப்பந்ததாரர் அணுகலைக் கடுமைப்படுத்துகிறதா, ப்ரீவ்யூ அமைப்புகளைச் சுற்றிய கண்காணிப்பை மேம்படுத்துகிறதா, மற்றும் வெளிவராத மாடல்களைப் பற்றிய கண்டுபிடிக்கக்கூடிய தகவல்களை கட்டுப்படுத்துகிறதா என்பதற்கான அறிகுறிகளை கவனிக்கும். மிக முக்கியமான பாடம் மாடல் பாதுகாப்பு என்பது ஆராய்ச்சி பிரச்சினை மட்டுமல்ல; அது உள்கட்டமைப்பு, அணுகல் கட்டுப்பாடு, மற்றும் விற்பனையாளர் மேலாண்மை பிரச்சினையும் ஆகும்.
இந்தக் கட்டுரை Gizmodo செய்தியறிக்கையை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.
Originally published on gizmodo.com





