O Problema Com Como os Matemáticos Trabalham
A pesquisa matemática é um dos esforços intelectuais mais exigentes da atividade humana — e, de muitas maneiras, um dos menos automatizados. Enquanto os sistemas de IA transformaram codificação, escrita e análise de dados, as estruturas formais da matemática superior permaneceram amplamente fora do seu alcance. Provas devem ser verificadas através de lógica rigorosa; padrões em estruturas abstratas não cedem ao reconhecimento de padrões estatísticos que tornam modelos de linguagem grande úteis para texto. Uma startup chamada Axiom Math acha que encontrou uma maneira de mudar isso, e esta semana lançou uma ferramenta gratuita para matemáticos que coloca capacidade significativa de descoberta de padrões em um único laptop.
A ferramenta, chamada Axplorer, é uma versão democratizada de PatternBoost — um algoritmo desenvolvido por Francois Charton, um cientista pesquisador agora na Axiom que trabalhou anteriormente na Meta. Em 2024, Charton usou PatternBoost rodando em milhares de nós de supercomputador por três semanas para resolver um problema secular em teoria dos grafos chamado problema das quatro ciclos de Turan. Axplorer pode alcançar esse resultado em duas horas e meia em um Mac Pro.
O Que Axplorer Faz
O algoritmo subjacente do Axplorer funciona através de um ciclo iterativo de busca clássica e aprendizado de rede neural. Começa gerando um grande número de soluções candidatas aleatórias para um problema matemático e retendo as de melhor desempenho. Uma rede neural transformer é então treinada nesses exemplos bem-sucedidos para aprender que propriedades caracterizam uma boa solução. Na próxima rodada, a rede treinada gera candidatos melhorados que servem como sementes para outra fase de busca clássica. As duas fases se alternam, com cada rodada produzindo soluções progressivamente melhores.
A visão chave é que a rede neural não precisa entender a matemática em qualquer sentido profundo. Ela só precisa reconhecer padrões estruturais nas soluções encontradas até agora e usar esses padrões para guiar a geração de melhores candidatos. Ao longo de muitas iterações, isso produz soluções que a busca clássica sozinha seria improvável encontrar — particularmente em problemas com espaços de busca enormes onde exploração aleatória é intratável computacionalmente.





