Claude Mythos Preview‌కు అనధికార ప్రాప్యతపై Anthropic విచారణ చేపట్టింది

పరిమిత AI మోడల్‌కు జరిగినట్లు తెలిపిన ప్రాప్యతను Anthropic సమీక్షిస్తోంది

పబ్లిక్ విడుదలకు చాలా ప్రమాదకరమని కంపెనీ వివరించిన Claude Mythos Preview‌కు అనధికార ప్రాప్యత గురించి వచ్చిన నివేదికను తాము విచారిస్తున్నామని Anthropic ధృవీకరించింది. ఈ ప్రాప్యత మూడవ పక్ష విక్రేత వాతావరణం ద్వారా జరిగినట్లు చెప్పబడింది.

Bloomberg నివేదించి, Gizmodo తిరిగి తెలియజేసిన కంపెనీ ప్రకటనలో, తన మూడవ పక్ష విక్రేత వాతావరణాలలో ఒకటి ద్వారా Claude Mythos Preview‌కు అనధికార ప్రాప్యత జరిగిందని చెబుతున్న నివేదికను తాము అందుకున్నట్లు Anthropic తెలిపింది. ఆ ప్రాప్యతకు బాధ్యులమని చెప్పబడిన సమూహంలోని ఒక సభ్యుడి నుండి వచ్చిన ప్రత్యక్ష డెమో మరియు స్క్రీన్‌షాట్‌లను Bloomberg చూసినట్లు చెబుతున్నారు.

ప్రజలకు అందుబాటులో ఉన్న వాస్తవాలు పరిమితంగా ఉన్నాయి, మరియు నివేదికలో సంబంధిత వ్యక్తులు, పద్ధతులను గుర్తించడంలో జాగ్రత్త తీసుకున్నారు. అయినప్పటికీ, ఈ ఘటన అగ్రశ్రేణి AI ల్యాబ్‌లకు ఒక తీవ్రమైన పాలన ప్రశ్నను లేవనెత్తుతోంది: ఒక మోడల్‌ను పబ్లిక్ విడుదలకు దూరంగా ఉంచినా, విక్రేత ప్రాప్యత మరియు అంతర్గత సాధనాలు మోడల్‌కన్నా కష్టంగా భద్రపరచాల్సిన మార్గాలను సృష్టించగలవు.

కథనంలో చెప్పినట్లు ప్రాప్యత ఎలా జరిగింది

వ్యాసంలో సంక్షిప్తంగా ఇచ్చిన మూల కథనం ప్రకారం, ఆ సమూహం కొన్ని సమాచార భాగాలను కలిపింది. విడుదల కాని AI మోడళ్లపై సమాచారం కోసం ఒక Discord సమూహం bots‌ను ఉపయోగించిందని చెబుతున్నారు. ఆ కథనం AI ట్రైనింగ్ స్టార్టప్ Mercor‌లో జరిగిన డేటా బ్రీచ్‌ను కూడా సూచిస్తుంది. అనంతరం ఆ సమూహం, Anthropic కాంట్రాక్టర్ వద్ద పనిచేస్తున్న ఒక వ్యక్తికి లభించిన ప్రాప్యతతో ఆ సమాచారాన్ని కలిపిందని ఆరోపిస్తున్నారు.

ఆ ఘటనల శ్రేణి Claude Mythos యొక్క ఆన్‌లైన్ స్థలాన్ని ఊహించేందుకు ఆ సమూహాన్ని అనుమతించినట్లు చెబుతున్నారు. Anthropic Project Glasswing‌ను ప్రకటించిన అదే రోజు అయిన ఏప్రిల్ 7 నుండి ఆ సమూహం మోడల్‌కు ప్రాప్యత కలిగి ఉన్నట్లు చెప్పబడింది.

నివేదికలో పేర్కొన్న మూలం, ఆ సమూహం నష్టం కలిగించడంకన్నా కొత్త మోడళ్లతో ప్రయోగాలు చేయడంలో ఆసక్తి చూపిందని తెలిపింది. ఆ వాదన ప్రాప్యత సమస్య తీవ్రతను తగ్గించదు. ఒక పరిమిత మోడల్ అనధికార వ్యక్తికి అందుబాటులో ఉంటే, మొదట చెప్పబడిన సమూహం దానిని ఎలా ఉపయోగించాలనుకున్నదనే విషయం మాత్రమే ప్రమాదాన్ని నిర్ణయించదు.

Seattle poised to ban new datacenters in blow to big tech hub

ఏఐ ఊపు మధ్య కొత్త డాటాసెంటర్లపై నిషేధం దిశగా సియాటిల్

మినహాయించలేని విద్యుత్ డిమాండ్, పర్యావరణ ప్రమాదాలు, మరియు ఖర్చులను అధికారులు పరిశీలిస్తున్న నేపథ్యంలో, కొత్త డాటాసెంటర్ నిర్మాణంపై ఏడాది పాటు మారటోరియం విధించేందుకు సియాటిల్ సిద్ధమవుతోంది.

Read article

విక్రేత ప్రమాద సమస్య

ఈ ఘటన అధిక భద్రత గల టెక్నాలజీ కార్యకలాపాల్లో సాధారణ బలహీనతను చూపిస్తోంది: ప్రధాన సంస్థ తన స్వంత వ్యవస్థలను లాక్ చేయగలదు, కానీ కాంట్రాక్టర్లు, విక్రేతలు, భాగస్వామ్య వాతావరణాలు సరిపడా ప్రాప్యతను ఉంచుకుని ఆకర్షణీయ లక్ష్యాలుగా మారవచ్చు.

AI కంపెనీలకు ఇందులో పణం అసాధారణంగా పెద్దది. అగ్రశ్రేణి మోడల్ అనేది కేవలం ఒక ఫైల్ లేదా సేవ కాదు. డెవలపర్ ఉద్దేశపూర్వకంగా ప్రజా విడుదలలో దాచిన సామర్థ్యాలను అది సంకేతీకరించి ఉండవచ్చు. ప్రీవ్యూ మోడళ్లు, మూల్యాంకన వ్యవస్థలు లేదా కాంట్రాక్టర్ వాతావరణాల చుట్టూ ఉన్న ప్రాప్యత నియంత్రణలు బలహీనంగా ఉంటే, మోడల్ ఎప్పుడూ లాంచ్ కాకముందే కంపెనీ విడుదల విధానం దెబ్బతినవచ్చు.

నివేదిక ప్రాప్యత పూర్తిస్థాయిని, మోడల్ వెయిట్లు బయటపడ్డాయా, లేదా ప్రాప్యత ఒక ఇంటర్‌ఫేస్‌కే పరిమితమైందా అనే విషయాలను స్థాపించలేదు. ఆ తేడాలు ముఖ్యమైనవి. ఇంటర్‌ఫేస్ ప్రాప్యత కూడా ప్రమాదకరం, కానీ అది మోడల్ వెయిట్లు లేదా ట్రైనింగ్ ఆస్తుల దొంగతనం కంటే భిన్నం. Anthropic దర్యాప్తు వాస్తవంగా ఏది చేరుకోగలిగారు, ఎంతసేపు, ఏ వ్యవస్థల ద్వారా అనే విషయాన్ని ఖచ్చితంగా నిర్ధారించాలి.

Anthropicకన్నా ముందుకు ఎందుకు ఇది ముఖ్యం

AI ల్యాబ్‌లు మూల్యాంకనం, డేటా పని, రెడ్ టీమింగ్, లేబెలింగ్, ఆపరేషన్ల కోసం ఎక్కువగా బయటి కాంట్రాక్టర్లపై ఆధారపడుతున్నాయి. ఆ వర్క్‌ఫ్లోలు విస్తృత ప్రాప్యత నమూనాలను సృష్టించగలవు, వీటిని పర్యవేక్షించడం కష్టం, ముఖ్యంగా విడుదల కాని వ్యవస్థలను నిర్మించి పరీక్షించేందుకు జట్లు వేగంగా పనిచేస్తున్నప్పుడు.

అందుకే Claude Mythos నివేదిక అగ్ర మోడల్ భద్రతపై ఉన్న విస్తృత పరిశ్రమ చర్చ మధ్యలో నిలుస్తుంది. కొన్ని మోడళ్లు విడుదలకు చాలా శక్తివంతమని కంపెనీలు వాదిస్తే, పరిమిత ప్రాప్యత కార్యక్రమాలు, విక్రేత వ్యవస్థలు, అంతర్గత ప్రీవ్యూ వాతావరణాలు కూడా అదే తీవ్రతతో నిర్వహించబడుతున్నాయని చూపాలి.

ఇది నమ్మక సమస్య కూడా. AI డెవలపర్లు మరింత సామర్థ్యవంతమైన వ్యవస్థలను సురక్షితంగా నిర్వహించగలరనే విషయాన్ని ప్రభుత్వాలు, సంస్థల కస్టమర్లు, ప్రజలు అంగీకరించాలని కోరుతున్నారు. విక్రేత వాతావరణం ద్వారా జరిగినట్లు చెబుతున్న అనధికార ప్రాప్యత ఆ দাবిని పరీక్షించే విధమైన వైఫల్యం.

The US Has a Plan to Combat Screwworm. It Involves a Lot More Flies

టెక్సాస్‌కు screwworm తిరిగి రావడంతో, అమెరికా sterile flies‌ను ఆశ్రయిస్తోంది

దక్షిణ టెక్సాస్‌లో New World screwworm తిరిగి కనిపించిన తర్వాత, అమెరికా అధికారులు దీర్ఘకాలంగా నిరూపితమైన ఒక biological control పద్ధతిని ఆశ్రయిస్తున్నారు: pests యొక్క breeding cycle‌ను విరగదీయడానికి sterilized flies‌ను విస్తరించడం.

Read article

తదుపరి ఏమి చూడాలి

ఇప్పుడు ప్రధాన ప్రశ్నలు స్పష్టంగా ఉన్నాయి. Anthropic, నిజంగా ఆ ప్రాప్యత జరిగిందా, ఏవైనా సున్నితమైన డేటా లేదా మోడల్ సామర్థ్యాలు బయటపడ్డాయా, ఆ ప్రాప్యతను నిలిపివేశారా, మరియు మూడవ పక్ష విక్రేత నియంత్రణల్లో మార్పులు అవసరమా అనే విషయాలను నిర్ణయించాలి.

విస్తృత AI రంగం కూడా ల్యాబ్‌లు కాంట్రాక్టర్ ప్రాప్యతను కఠినతరం చేస్తున్నాయా, ప్రీవ్యూ వ్యవస్థల చుట్టూ పర్యవేక్షణను మెరుగుపరుస్తున్నాయా, విడుదల కాని మోడళ్ల గురించి కనుగొనగల సమాచారాన్ని పరిమితం చేస్తున్నాయా అనే సంకేతాలను గమనిస్తుంది. అత్యంత ముఖ్యమైన పాఠం ఏమంటే, మోడల్ భద్రత కేవలం పరిశోధనా సమస్య కాదు. అది మౌలిక సదుపాయాలు, ప్రాప్యత నియంత్రణ, విక్రేత నిర్వహణ సమస్య కూడా.

ఈ వ్యాసం Gizmodo రిపోర్టింగ్‌పై ఆధారపడింది. అసలు వ్యాసాన్ని చదవండి.

Originally published on gizmodo.com

Claude Mythos Preview‌కు అనధికార ప్రాప్యతపై Anthropic విచారణ చేపట్టింది

పరిమిత AI మోడల్‌కు జరిగినట్లు తెలిపిన ప్రాప్యతను Anthropic సమీక్షిస్తోంది

కథనంలో చెప్పినట్లు ప్రాప్యత ఎలా జరిగింది

ఏఐ ఊపు మధ్య కొత్త డాటాసెంటర్లపై నిషేధం దిశగా సియాటిల్

విక్రేత ప్రమాద సమస్య

Anthropicకన్నా ముందుకు ఎందుకు ఇది ముఖ్యం

టెక్సాస్‌కు screwworm తిరిగి రావడంతో, అమెరికా sterile flies‌ను ఆశ్రయిస్తోంది

తదుపరి ఏమి చూడాలి

Comments (0)

Related Articles

క్రిప్టో ర్యాలీ కూలడంతో Bitcoin $60,000 కంటే దిగువకు పడింది

Anthropic ముందస్తు AI వేగాన్ని తగ్గించాలని ఆలోచిస్తోంది, కానీ పూర్తి డిమాండ్ వరకు వెళ్లలేదు

Grindr‌ను పాప్-అప్ కాన్సర్ట్ ఛానెల్‌గా మార్చేసింది మడోన్నా

Keep Reading