Outro suposto avanço de IA em matemática chega rapidamente

O ciclo competitivo da matemática de fronteira com IA está se acelerando. Logo depois de a OpenAI supostamente ter refutado a conjectura da distância unitária de Erdős, funcionários da Anthropic agora dizem que o Claude Mythos também consegue resolver o mesmo problema, segundo o The Decoder.

A alegação continua sendo exatamente isso: um resultado relatado, descrito por pessoas da Anthropic e discutido publicamente no X. Isso importa porque coloca a história em uma categoria cada vez mais comum na pesquisa avançada em IA: progresso técnico significativo circulando primeiro entre laboratórios, engenheiros e matemáticos em atividade, antes que um artigo institucional completo ou uma verificação independente mais ampla feche a questão.

Mesmo com essa ressalva, o desenvolvimento relatado é importante. A conjectura da distância unitária de Erdős está em aberto desde 1946. Se vários sistemas de fronteira agora conseguem encontrar caminhos viáveis de solução para um problema antigo de geometria combinatória, a história relevante já não é apenas uma prova que chama atenção. É a possibilidade de que modelos avançados estejam começando a mostrar valor repetível em problemas de pesquisa difíceis.

O que a Anthropic teria feito

Segundo o texto de origem, a Anthropic usou uma configuração de teste construída depois que a IA resolveu outro problema de Erdős. O sistema envolvia instâncias isoladas do Claude Code com acesso ao Mythos, recebendo o problema, explorando caminhos de solução e depois passando achados resumidos para outras instâncias trabalhando de forma independente. Esse detalhe é importante porque desloca a conversa de um único prompt para um fluxo de trabalho agêntico.

Em outras palavras, o feito relatado não é apresentado como uma resposta pura e única de um modelo de linguagem. Ele se aproxima mais de um ambiente de pesquisa coordenado: múltiplas instâncias do modelo, decomposição do problema, resumo e comparação iterativa de abordagens. Isso torna o resultado menos uma demonstração elegante e mais uma prévia de como o trabalho matemático assistido por IA pode realmente acontecer na prática.

A fonte também diz que o Mythos frequentemente seguiu um caminho diferente do modelo da OpenAI. Se isso for correto, sugere algo ainda mais interessante do que mera duplicação. Estratégias independentes de solução chegam mais perto de valor real de pesquisa do que simplesmente reproduzir uma linha de raciocínio já conhecida.

Por que a comparação importa

O artigo observa que o matemático Daniel Litt teria chamado o resultado da Anthropic de “um pouco pior” do que o da OpenAI, ao mesmo tempo em que disse que o Mythos também encontrou a solução da OpenAI. É um lembrete útil de que nem todas as provas são iguais. Em matemática, elegância, concisão e novidade conceitual importam junto com a correção.

Ainda assim, o ponto estratégico não é que a prova de um laboratório foi mais bonita do que a de outro. É que vários laboratórios agora parecem acreditar que seus sistemas podem lidar com problemas matemáticos abertos em um nível muito mais alto do que gerações anteriores conseguiam. Quando isso se torna repetível, a fronteira deixa de ser “a IA consegue fazer isso?” e passa a ser “com que frequência, com quanta independência e com que nível de supervisão humana?”

O The Decoder também menciona o recente anúncio do Google DeepMind de que um sistema assistido por IA resolveu nove problemas de Erdős usando Lean, uma linguagem formal de prova. Essa comparação deixa clara uma distinção importante no trabalho atual de matemática com IA. Alguns sistemas dependem fortemente de ambientes de verificação formal; outros são avaliados mais pelo raciocínio em linguagem natural e pela exploração agêntica. O campo ainda não decidiu qual estilo revela melhor a capacidade bruta.

A mudança maior

O que torna essa história durável não é apenas a conjectura específica. É a velocidade das alegações seguintes. Problemas abertos em matemática costumavam servir como marcadores claros do limite entre o raciocínio humano e o das máquinas. Esse limite agora parece mais poroso, especialmente quando laboratórios combinam modelos de fronteira com ferramentas de orquestração que permitem ramificar, comparar, resumir e tentar novamente.

Ainda existe uma grande diferença entre um sucesso relatado em laboratório e um sistema de pesquisa estável e amplamente confiável. Verificação, revisão por pares e reprodutibilidade continuam essenciais. Mas o padrão é difícil de ignorar: os laboratórios de IA já não apresentam apenas ganhos em benchmarks ou assistentes de consumo polidos. Eles estão cada vez mais apresentando seus sistemas como contribuintes para trabalho avançado de conhecimento.

Se essas alegações continuarem de pé, as manchetes sobre matemática com IA deixarão de ser anomalias raras e passarão a parecer uma categoria de pesquisa emergente por si só.

  • Funcionários da Anthropic dizem que o Claude Mythos consegue resolver a conjectura da distância unitária de Erdős.
  • A configuração relatada usou várias instâncias coordenadas do Claude Code, em vez de um único prompt.
  • A grande mudança é sair de vitórias isoladas em benchmarks para usar sistemas de IA em exploração matemática em estilo de pesquisa.

Este artigo é baseado na cobertura do The Decoder. Leia o artigo original.

Originally published on the-decoder.com