Anthropic investiga relato de acesso não autorizado ao Claude Mythos Preview

Anthropic revisa relato de acesso a modelo de IA restrito

A Anthropic confirmou que está investigando um relato de acesso não autorizado ao Claude Mythos Preview, um modelo que a empresa descreveu como perigoso demais para lançamento público. O acesso relatado teria ocorrido por meio de um ambiente de fornecedor terceirizado.

A declaração da empresa, reportada pela Bloomberg e repercutida pelo Gizmodo, dizia que a Anthropic havia recebido um relato afirmando que houve acesso não autorizado ao Claude Mythos Preview por meio de um de seus ambientes de fornecedores terceirizados. A Bloomberg teria analisado uma demonstração ao vivo e capturas de tela de um membro do grupo supostamente responsável pelo acesso.

Os fatos disponíveis publicamente são limitados, e o relato é cauteloso ao identificar as pessoas e os métodos envolvidos. Ainda assim, o incidente levanta uma questão séria de governança para laboratórios de IA de fronteira: mesmo quando um modelo é mantido fora do lançamento público, o acesso de fornecedores e as ferramentas internas podem criar rotas mais difíceis de proteger do que o próprio modelo.

Como o acesso relatado aconteceu

Segundo o relato da fonte resumido no artigo, o grupo combinou várias peças de informação. Um grupo no Discord teria usado bots para buscar no GitHub informações sobre modelos de IA ainda não lançados. O relato também menciona uma violação de dados na startup de treinamento de IA Mercor. Depois, o grupo teria combinado essas informações com acesso disponível a uma pessoa que trabalhava para um contratado da Anthropic.

Essa cadeia de घटनos teria permitido ao grupo inferir o local online do Claude Mythos. Diz-se que o grupo teve acesso ao modelo desde 7 de abril, o mesmo dia em que a Anthropic anunciou o Project Glasswing.

A fonte citada no relato afirmou que o grupo estava interessado em experimentar novos modelos, e não em causar danos. Essa afirmação não reduz a gravidade do problema de acesso. Se um modelo restrito está disponível para uma parte não autorizada, o risco não depende apenas do que o primeiro grupo relatado diz pretender fazer.

The US Has a Plan to Combat Screwworm. It Involves a Lot More Flies

EUA recorrem a moscas estéreis após retorno do berne a Texas

Depois do retorno do berne-do-Novo-Mundo ao sul do Texas, autoridades dos EUA estão apostando em um método de controle biológico já comprovado: inundar a área com moscas esterilizadas para quebrar o ciclo reprodutivo da praga.

Read article

O problema do risco de fornecedores

O incidente relatado destaca um ponto fraco comum em operações de tecnologia de alta segurança: a empresa principal pode proteger seus próprios sistemas enquanto contratados, fornecedores e ambientes de parceiros mantêm acesso suficiente para se tornarem alvos atraentes.

Para empresas de IA, os riscos são incomuns. Um modelo de fronteira não é apenas um arquivo ou serviço. Ele pode incorporar capacidades que o desenvolvedor deliberadamente reteve do lançamento público. Se os controles de acesso em torno de modelos de prévia, sistemas de avaliação ou ambientes de contratados forem fracos, a política de lançamento da empresa pode ser enfraquecida antes mesmo de o modelo ser lançado.

O relato não estabelece o escopo total do acesso, se os pesos do modelo foram expostos ou se o acesso se limitou a uma interface. Essas distinções importam. O acesso por interface ainda pode ser arriscado, mas é diferente do roubo de pesos do modelo ou de ativos de treinamento. A investigação da Anthropic precisará determinar exatamente o que estava acessível, por quanto tempo e por quais sistemas.

Por que isso importa além da Anthropic

Laboratórios de IA dependem cada vez mais de contratados externos para avaliação, trabalho com dados, red teaming, rotulagem e operações. Esses fluxos de trabalho podem criar padrões amplos de acesso difíceis de monitorar, especialmente quando as equipes se movem rapidamente para construir e testar sistemas não lançados.

O relato sobre o Claude Mythos, portanto, entra no meio de um debate mais amplo do setor sobre a segurança de modelos de fronteira. Se as empresas argumentam que certos modelos são poderosos demais para serem lançados, também precisam mostrar que programas de acesso restrito, sistemas de fornecedores e ambientes internos de prévia são governados com a mesma seriedade.

Há também uma questão de confiança. Governos, clientes corporativos e o público estão sendo convidados a aceitar que desenvolvedores de IA conseguem gerenciar com segurança sistemas cada vez mais capazes. Um caminho de acesso não autorizado relatado por meio de um ambiente de fornecedor é o tipo de falha que testa essa afirmação.

ICE’s Plan to Let Cops Around the Country Scan Faces to Verify Immigration Status

Plano do ICE ampliaria o uso de reconhecimento facial à polícia local

Registros internos do DHS indicam que o ICE quer que a polícia local use um aplicativo de reconhecimento facial para verificar identidade e possível status de remoção durante abordagens.

Read article

O que observar a seguir

As questões-chave agora são concretas. A Anthropic terá de determinar se o acesso relatado realmente ocorreu, se algum dado sensível ou capacidade do modelo foi exposto, se o acesso foi interrompido e se os controles de fornecedores terceirizados precisam mudar.

O setor mais amplo de IA estará atento a sinais de que os laboratórios estão apertando o acesso de contratados, melhorando o monitoramento de sistemas de prévia e limitando informações descobríveis sobre modelos não lançados. A lição mais importante pode ser que a segurança do modelo não é apenas um problema de pesquisa. Também é um problema de infraestrutura, controle de acesso e gestão de fornecedores.

Este artigo é baseado na cobertura do Gizmodo. Leia o artigo original.

Originally published on gizmodo.com

Anthropic investiga relato de acesso não autorizado ao Claude Mythos Preview

Anthropic revisa relato de acesso a modelo de IA restrito

Como o acesso relatado aconteceu

EUA recorrem a moscas estéreis após retorno do berne a Texas

O problema do risco de fornecedores

Por que isso importa além da Anthropic

Plano do ICE ampliaria o uso de reconhecimento facial à polícia local

O que observar a seguir

Comments (0)

Related Articles

Anthropic cogita desacelerar a IA de fronteira, mas para aquém de um pedido total

Madonna transforma o Grindr em um canal de show pop-up

xAI enfrenta uma ameaça jurídica mais ampla por imagens sexualizadas do Grok

Hydrow aposta em descontos no fitness conectado

Keep Reading