పరిమిత AI మోడల్‌కు జరిగినట్లు తెలిపిన ప్రాప్యతను Anthropic సమీక్షిస్తోంది

పబ్లిక్ విడుదలకు చాలా ప్రమాదకరమని కంపెనీ వివరించిన Claude Mythos Preview‌కు అనధికార ప్రాప్యత గురించి వచ్చిన నివేదికను తాము విచారిస్తున్నామని Anthropic ధృవీకరించింది. ఈ ప్రాప్యత మూడవ పక్ష విక్రేత వాతావరణం ద్వారా జరిగినట్లు చెప్పబడింది.

Bloomberg నివేదించి, Gizmodo తిరిగి తెలియజేసిన కంపెనీ ప్రకటనలో, తన మూడవ పక్ష విక్రేత వాతావరణాలలో ఒకటి ద్వారా Claude Mythos Preview‌కు అనధికార ప్రాప్యత జరిగిందని చెబుతున్న నివేదికను తాము అందుకున్నట్లు Anthropic తెలిపింది. ఆ ప్రాప్యతకు బాధ్యులమని చెప్పబడిన సమూహంలోని ఒక సభ్యుడి నుండి వచ్చిన ప్రత్యక్ష డెమో మరియు స్క్రీన్‌షాట్‌లను Bloomberg చూసినట్లు చెబుతున్నారు.

ప్రజలకు అందుబాటులో ఉన్న వాస్తవాలు పరిమితంగా ఉన్నాయి, మరియు నివేదికలో సంబంధిత వ్యక్తులు, పద్ధతులను గుర్తించడంలో జాగ్రత్త తీసుకున్నారు. అయినప్పటికీ, ఈ ఘటన అగ్రశ్రేణి AI ల్యాబ్‌లకు ఒక తీవ్రమైన పాలన ప్రశ్నను లేవనెత్తుతోంది: ఒక మోడల్‌ను పబ్లిక్ విడుదలకు దూరంగా ఉంచినా, విక్రేత ప్రాప్యత మరియు అంతర్గత సాధనాలు మోడల్‌కన్నా కష్టంగా భద్రపరచాల్సిన మార్గాలను సృష్టించగలవు.

కథనంలో చెప్పినట్లు ప్రాప్యత ఎలా జరిగింది

వ్యాసంలో సంక్షిప్తంగా ఇచ్చిన మూల కథనం ప్రకారం, ఆ సమూహం కొన్ని సమాచార భాగాలను కలిపింది. విడుదల కాని AI మోడళ్లపై సమాచారం కోసం ఒక Discord సమూహం bots‌ను ఉపయోగించిందని చెబుతున్నారు. ఆ కథనం AI ట్రైనింగ్ స్టార్టప్ Mercor‌లో జరిగిన డేటా బ్రీచ్‌ను కూడా సూచిస్తుంది. అనంతరం ఆ సమూహం, Anthropic కాంట్రాక్టర్ వద్ద పనిచేస్తున్న ఒక వ్యక్తికి లభించిన ప్రాప్యతతో ఆ సమాచారాన్ని కలిపిందని ఆరోపిస్తున్నారు.

ఆ ఘటనల శ్రేణి Claude Mythos యొక్క ఆన్‌లైన్ స్థలాన్ని ఊహించేందుకు ఆ సమూహాన్ని అనుమతించినట్లు చెబుతున్నారు. Anthropic Project Glasswing‌ను ప్రకటించిన అదే రోజు అయిన ఏప్రిల్ 7 నుండి ఆ సమూహం మోడల్‌కు ప్రాప్యత కలిగి ఉన్నట్లు చెప్పబడింది.

నివేదికలో పేర్కొన్న మూలం, ఆ సమూహం నష్టం కలిగించడంకన్నా కొత్త మోడళ్లతో ప్రయోగాలు చేయడంలో ఆసక్తి చూపిందని తెలిపింది. ఆ వాదన ప్రాప్యత సమస్య తీవ్రతను తగ్గించదు. ఒక పరిమిత మోడల్ అనధికార వ్యక్తికి అందుబాటులో ఉంటే, మొదట చెప్పబడిన సమూహం దానిని ఎలా ఉపయోగించాలనుకున్నదనే విషయం మాత్రమే ప్రమాదాన్ని నిర్ణయించదు.

విక్రేత ప్రమాద సమస్య

ఈ ఘటన అధిక భద్రత గల టెక్నాలజీ కార్యకలాపాల్లో సాధారణ బలహీనతను చూపిస్తోంది: ప్రధాన సంస్థ తన స్వంత వ్యవస్థలను లాక్ చేయగలదు, కానీ కాంట్రాక్టర్లు, విక్రేతలు, భాగస్వామ్య వాతావరణాలు సరిపడా ప్రాప్యతను ఉంచుకుని ఆకర్షణీయ లక్ష్యాలుగా మారవచ్చు.

AI కంపెనీలకు ఇందులో పణం అసాధారణంగా పెద్దది. అగ్రశ్రేణి మోడల్ అనేది కేవలం ఒక ఫైల్ లేదా సేవ కాదు. డెవలపర్ ఉద్దేశపూర్వకంగా ప్రజా విడుదలలో దాచిన సామర్థ్యాలను అది సంకేతీకరించి ఉండవచ్చు. ప్రీవ్యూ మోడళ్లు, మూల్యాంకన వ్యవస్థలు లేదా కాంట్రాక్టర్ వాతావరణాల చుట్టూ ఉన్న ప్రాప్యత నియంత్రణలు బలహీనంగా ఉంటే, మోడల్ ఎప్పుడూ లాంచ్ కాకముందే కంపెనీ విడుదల విధానం దెబ్బతినవచ్చు.

నివేదిక ప్రాప్యత పూర్తిస్థాయిని, మోడల్ వెయిట్లు బయటపడ్డాయా, లేదా ప్రాప్యత ఒక ఇంటర్‌ఫేస్‌కే పరిమితమైందా అనే విషయాలను స్థాపించలేదు. ఆ తేడాలు ముఖ్యమైనవి. ఇంటర్‌ఫేస్ ప్రాప్యత కూడా ప్రమాదకరం, కానీ అది మోడల్ వెయిట్లు లేదా ట్రైనింగ్ ఆస్తుల దొంగతనం కంటే భిన్నం. Anthropic దర్యాప్తు వాస్తవంగా ఏది చేరుకోగలిగారు, ఎంతసేపు, ఏ వ్యవస్థల ద్వారా అనే విషయాన్ని ఖచ్చితంగా నిర్ధారించాలి.

Anthropicకన్నా ముందుకు ఎందుకు ఇది ముఖ్యం

AI ల్యాబ్‌లు మూల్యాంకనం, డేటా పని, రెడ్ టీమింగ్, లేబెలింగ్, ఆపరేషన్ల కోసం ఎక్కువగా బయటి కాంట్రాక్టర్లపై ఆధారపడుతున్నాయి. ఆ వర్క్‌ఫ్లోలు విస్తృత ప్రాప్యత నమూనాలను సృష్టించగలవు, వీటిని పర్యవేక్షించడం కష్టం, ముఖ్యంగా విడుదల కాని వ్యవస్థలను నిర్మించి పరీక్షించేందుకు జట్లు వేగంగా పనిచేస్తున్నప్పుడు.

అందుకే Claude Mythos నివేదిక అగ్ర మోడల్ భద్రతపై ఉన్న విస్తృత పరిశ్రమ చర్చ మధ్యలో నిలుస్తుంది. కొన్ని మోడళ్లు విడుదలకు చాలా శక్తివంతమని కంపెనీలు వాదిస్తే, పరిమిత ప్రాప్యత కార్యక్రమాలు, విక్రేత వ్యవస్థలు, అంతర్గత ప్రీవ్యూ వాతావరణాలు కూడా అదే తీవ్రతతో నిర్వహించబడుతున్నాయని చూపాలి.

ఇది నమ్మక సమస్య కూడా. AI డెవలపర్లు మరింత సామర్థ్యవంతమైన వ్యవస్థలను సురక్షితంగా నిర్వహించగలరనే విషయాన్ని ప్రభుత్వాలు, సంస్థల కస్టమర్లు, ప్రజలు అంగీకరించాలని కోరుతున్నారు. విక్రేత వాతావరణం ద్వారా జరిగినట్లు చెబుతున్న అనధికార ప్రాప్యత ఆ দাবిని పరీక్షించే విధమైన వైఫల్యం.

తదుపరి ఏమి చూడాలి

ఇప్పుడు ప్రధాన ప్రశ్నలు స్పష్టంగా ఉన్నాయి. Anthropic, నిజంగా ఆ ప్రాప్యత జరిగిందా, ఏవైనా సున్నితమైన డేటా లేదా మోడల్ సామర్థ్యాలు బయటపడ్డాయా, ఆ ప్రాప్యతను నిలిపివేశారా, మరియు మూడవ పక్ష విక్రేత నియంత్రణల్లో మార్పులు అవసరమా అనే విషయాలను నిర్ణయించాలి.

విస్తృత AI రంగం కూడా ల్యాబ్‌లు కాంట్రాక్టర్ ప్రాప్యతను కఠినతరం చేస్తున్నాయా, ప్రీవ్యూ వ్యవస్థల చుట్టూ పర్యవేక్షణను మెరుగుపరుస్తున్నాయా, విడుదల కాని మోడళ్ల గురించి కనుగొనగల సమాచారాన్ని పరిమితం చేస్తున్నాయా అనే సంకేతాలను గమనిస్తుంది. అత్యంత ముఖ్యమైన పాఠం ఏమంటే, మోడల్ భద్రత కేవలం పరిశోధనా సమస్య కాదు. అది మౌలిక సదుపాయాలు, ప్రాప్యత నియంత్రణ, విక్రేత నిర్వహణ సమస్య కూడా.

ఈ వ్యాసం Gizmodo రిపోర్టింగ్‌పై ఆధారపడింది. అసలు వ్యాసాన్ని చదవండి.

Originally published on gizmodo.com