Anthropic apresenta iniciativa de cibersegurança com a IA Mythos

Um modelo de fronteira está sendo direcionado primeiro para a defesa

A Anthropic diz que está disponibilizando uma versão prévia de um novo modelo de IA para uma coalizão de organizações de tecnologia e segurança como parte de um esforço de cibersegurança voltado a encontrar fragilidades em infraestruturas de software críticas antes que os હુમantes o façam.

A iniciativa, chamada Project Glasswing, reúne empresas e organizações como Amazon, Apple, Broadcom, Cisco, CrowdStrike, a Linux Foundation, Microsoft e Palo Alto Networks. A Anthropic afirmou que o modelo será usado em trabalho de segurança defensiva e que as descobertas serão compartilhadas de forma mais ampla em todo o setor.

A medida reflete uma tensão crescente no centro do desenvolvimento de IA. Modelos mais capazes podem aumentar o risco de uso indevido ofensivo no ciberespaço, mas também podem dar aos defensores novas ferramentas para descobrir vulnerabilidades em uma escala e profundidade que os testes convencionais têm dificuldade para igualar.

O que a Anthropic diz que o modelo pode fazer

Segundo o relatório, a Anthropic descobriu fortes aplicações de segurança ao treinar o que chamou de “Claude Mythos Preview” para tarefas de programação e raciocínio. A empresa disse que o modelo já identificou milhares de vulnerabilidades de dia zero nas últimas semanas, muitas delas críticas.

Entre os exemplos citados pela Anthropic estavam um bug de 27 anos no OpenBSD e uma falha de 16 anos em um software de vídeo amplamente usado que ferramentas de teste automatizado não haviam encontrado. A empresa também descreveu testes internos contra 1.000 repositórios de código aberto nos quais o Mythos Preview produziu resultados de falha substancialmente mais graves do que modelos anteriores.

Na descrição da Anthropic, a geração anterior produziu muitos crashes de nível inferior e apenas um crash de nível 3, enquanto o Mythos Preview gerou 595 crashes nos níveis 1 e 2, algumas ocorrências nos níveis 3 e 4, e sequestros completos do fluxo de controle em 10 alvos totalmente corrigidos. A Anthropic afirmou que o modelo não foi treinado especificamente para executar esses exploits e que a capacidade surgiu de ganhos mais amplos em programação, raciocínio e comportamento autônomo.

Wind turbines off the coast of Shanghai, China

China liga centro de dados subaquático movido a energia eólica offshore

Um centro de dados submerso perto de Xangai entrou em operação usando energia eólica offshore e resfriamento baseado na água do mar, uma combinação que, segundo seus apoiadores, reduz o uso de terra e a necessidade de energia para refrigeração.

Read article

Por que o foco está em software crítico

O Project Glasswing está centrado em infraestrutura de software crítica porque falhas em bases amplamente usadas podem se espalhar por governos, empresas e ecossistemas de código aberto. A Anthropic disse que está ampliando o acesso além do grupo inicial de parceiros para cerca de 40 organizações adicionais que constroem ou mantêm software crítico.

A empresa também se compromete a destinar até US$ 100 milhões em créditos de uso do modelo e US$ 4 milhões em doações diretas para organizações de segurança de código aberto. Essa combinação sugere um esforço não apenas para provar a capacidade do modelo, mas para semear um fluxo de trabalho defensivo em torno do software que sustenta grande parte da economia digital.

Se o modelo puder identificar de forma confiável vulnerabilidades que sobreviveram por anos dentro de bases de código maduras, seu valor pode ser maior justamente onde o software é mais antigo, mais confiável e mais difícil de auditar de forma abrangente com as ferramentas existentes.

A natureza de dois gumes da IA mais forte

O anúncio chega em meio à crescente preocupação de que modelos avançados possam tornar os ataques cibernéticos mais sofisticados. A Anthropic reconheceu essa tensão de forma direta, argumentando que as capacidades de fronteira podem avançar substancialmente nos próximos meses e que os defensores precisam agir rapidamente para acompanhar o ritmo.

Esse enquadramento é importante. A Anthropic não está apresentando o modelo apenas como uma ferramenta de produtividade para pesquisadores de segurança. Está apresentando-o como parte de uma corrida entre capacidade ofensiva e defensiva, uma em que a demora pode favorecer os atacantes.

Há também um argumento político implícito na estrutura do lançamento. A prévia é limitada, não está disponível de forma geral e está vinculada a uma missão de segurança definida. Isso sugere que a Anthropic está tentando demonstrar um caminho de implantação controlada para sistemas de alta capacidade em domínios onde o lado positivo é real, mas o potencial de uso indevido também é incomumente alto.

Indonesia’s Vanishing Glaciers Get First 3D Mapping Before Complete Disappearance - EnviroLink Network (via envirolink.org)

Mapeamento em 3D registra uma geleira tropical da Indonésia antes que ela desapareça

Um modelo 3D detalhado e de código aberto está documentando uma das últimas geleiras tropicais do mundo na Indonésia, enquanto cientistas alertam que o gelo restante pode sumir até 2030.

Read article

Um modelo emergente para a implantação de IA em segurança

A iniciativa pode se mostrar significativa até além do próprio sistema da Anthropic. Se o Project Glasswing for bem-sucedido, ele poderá se tornar um modelo de como laboratórios de fronteira introduzem capacidades sensíveis: acesso limitado, parceiros verificados, uso delimitado por missão e a expectativa de que os resultados sejam compartilhados para fora, em vez de acumulados.

A Anthropic também disse que esteve em discussões contínuas com autoridades do governo dos Estados Unidos sobre as capacidades cibernéticas ofensivas e defensivas do modelo. Esse detalhe aponta para outra realidade que agora molda o setor: a cibersegurança já não é uma aplicação secundária para laboratórios de IA avançada. Ela está rapidamente se tornando um dos testes centrais de como esses sistemas serão governados, avaliados e integrados à infraestrutura crítica.

Por enquanto, a posição da empresa é clara. Ela acredita que a capacidade da classe Mythos pode fortalecer materialmente a defesa de software e está tentando provar essa tese em parceria com algumas das maiores instituições de tecnologia.

O que observar a seguir

A próxima fase importará mais do que a manchete. As questões centrais são se as organizações parceiras validarão as alegações da Anthropic em fluxos de trabalho reais, se as vulnerabilidades encontradas serão corrigidas e divulgadas de forma eficaz, e se a mesma classe de modelo poderá permanecer alinhada ao uso defensivo à medida que as capacidades continuarem a melhorar.

As empresas de IA passaram os últimos dois anos argumentando que seus sistemas vão transformar a programação. O Project Glasswing testa uma proposta mais estreita e mais difícil: se eles podem transformar a segurança de software de maneiras que reduzam significativamente o risco antes que os adversários alcancem o mesmo nível.

Este artigo é baseado em uma reportagem da Fast Company. Leia o artigo original.

These tiny fish have a clever strategy to hide in plain sight – thanks to their food

Peixe-varredor-dourado rouba sua bioluminescência das presas

Pesquisadores dizem que o peixe-varredor-dourado do Pacífico não consegue produzir sua própria luciferase e, em vez disso, adquire a proteína produtora de luz de pequenos crustáceos que come.

Read article

Originally published on fastcompany.com

Anthropic lança iniciativa de cibersegurança em torno de um modelo de IA em prévia

Um modelo de fronteira está sendo direcionado primeiro para a defesa

O que a Anthropic diz que o modelo pode fazer

China liga centro de dados subaquático movido a energia eólica offshore

Por que o foco está em software crítico

A natureza de dois gumes da IA mais forte

Mapeamento em 3D registra uma geleira tropical da Indonésia antes que ela desapareça

Um modelo emergente para a implantação de IA em segurança

O que observar a seguir

Peixe-varredor-dourado rouba sua bioluminescência das presas

Comments (0)

Related Articles

A SpaceX se aproxima de um marco histórico de carga útil orbital

Hub flutuante de hidrogênio quer abastecer navios fora da rede

Oxigênio na Lua vira pré-requisito para planos espaciais mais profundos

Keep Reading