Claude Mythos aurait résolu un problème historique d’Erdős

Une autre percée mathématique supposée de l’IA arrive rapidement

Le cycle concurrentiel de la mathématique de pointe assistée par IA s’accélère. Peu après qu’OpenAI aurait réfuté la conjecture de distance unitaire d’Erdős, des employés d’Anthropic disent désormais que Claude Mythos peut résoudre le même problème, selon The Decoder.

À ce stade, il s’agit bien de cela : un résultat rapporté, décrit par du personnel d’Anthropic et discuté publiquement sur X. C’est important, car cela inscrit cette histoire dans une catégorie de plus en plus courante dans la recherche avancée en IA : des progrès techniques significatifs d’abord relayés dans les laboratoires, chez les ingénieurs et parmi les mathématiciens en exercice, avant qu’un article institutionnel complet ou une vérification indépendante plus large ne tranche la question.

Même avec cette réserve, le développement rapporté est important. La conjecture de distance unitaire d’Erdős est ouverte depuis 1946. Si plusieurs systèmes de pointe peuvent désormais trouver des voies de solution viables à un problème ancien de géométrie combinatoire, l’enjeu n’est plus seulement un proof spectaculaire. C’est la possibilité que les modèles avancés commencent à montrer une valeur reproductible sur des problèmes de recherche difficiles.

Ce qu’Anthropic aurait fait

Selon le texte source, Anthropic a utilisé une configuration de test mise en place après qu’une autre difficulté d’Erdős a été résolue par l’IA. Le système impliquait des instances isolées de Claude Code disposant d’un accès à Mythos, recevant le problème, explorant des pistes de solution, puis transmettant des synthèses à d’autres instances travaillant indépendamment. Ce détail est important, car il déplace la discussion d’un simple prompt vers un flux de travail agentique.

Autrement dit, la réussite rapportée n’est pas présentée comme une réponse purement instantanée d’un modèle de langage. Elle ressemble davantage à un banc de recherche coordonné : plusieurs instances du modèle, décomposition du problème, synthèse, et comparaison itérative des approches. Cela rend le résultat moins semblable à une démo élégante et davantage à un aperçu de la manière dont le travail mathématique assisté par IA pourrait réellement se dérouler.

La source indique aussi que Mythos empruntait souvent une voie différente de celle du modèle d’OpenAI. Si cela est exact, cela suggère quelque chose d’encore plus intéressant qu’une simple duplication. Des stratégies de résolution indépendantes se rapprochent davantage d’une vraie valeur de recherche que la simple reproduction d’un raisonnement déjà connu.

Google et OpenAI révèlent des opérations distinctes d’abus de l’IA liées à la Chine

Google a engagé une action en justice au sujet d’un réseau de fraude présumé assisté par l’IA, tandis qu’OpenAI a déclaré avoir perturbé deux groupes d’influence liés à la Chine visant les débats américains et les récits sur les infrastructures.

Read article

Pourquoi la comparaison compte

L’article note que le mathématicien Daniel Litt aurait qualifié le résultat d’Anthropic de « un peu moins bon » que celui d’OpenAI, tout en disant que Mythos avait aussi trouvé la solution d’OpenAI. C’est un rappel utile : toutes les preuves ne se valent pas. En mathématiques, l’élégance, la concision et la nouveauté conceptuelle comptent autant que la correction.

Le point stratégique n’est toutefois pas qu’une preuve de laboratoire était plus jolie qu’une autre. C’est que plusieurs laboratoires semblent désormais penser que leurs systèmes peuvent aborder des problèmes mathématiques ouverts à un niveau bien supérieur à celui des générations précédentes. Une fois cela reproductible, la frontière passe de « une IA peut-elle faire cela ? » à « à quelle fréquence, de manière indépendante, et avec quel niveau de supervision humaine ? »

The Decoder mentionne aussi la récente annonce de Google DeepMind selon laquelle un système assisté par IA aurait résolu neuf problèmes d’Erdős en utilisant Lean, un langage de preuve formel. Cette comparaison met en lumière une distinction importante dans le travail mathématique actuel avec l’IA. Certains systèmes s’appuient fortement sur des environnements de vérification formelle ; d’autres sont davantage jugés sur le raisonnement en langage naturel et l’exploration agentique. Le domaine n’a pas encore tranché quel style révèle le mieux la capacité brute.

Le changement plus large

Ce qui rend cette histoire durable, ce n’est pas seulement la conjecture elle-même. C’est la vitesse des affirmations qui suivent. Les problèmes ouverts en mathématiques servaient autrefois d’indicateurs nets de la frontière entre le raisonnement humain et celui des machines. Cette frontière paraît aujourd’hui plus poreuse, surtout lorsque les laboratoires combinent des modèles de pointe avec des outils d’orchestration qui leur permettent de bifurquer, comparer, résumer et réessayer.

Il reste toutefois une grande différence entre un succès de laboratoire rapporté et un système de recherche stable et largement digne de confiance. La vérification, l’évaluation par les pairs et la reproductibilité restent essentielles. Mais le schéma est difficile à ignorer : les laboratoires d’IA ne présentent plus seulement des gains de benchmarks ou des assistants grand public polis. Ils présentent de plus en plus leurs systèmes comme des contributeurs au travail intellectuel avancé.

Si ces affirmations continuent de tenir, les titres sur les mathématiques et l’IA cesseront d’être de rares anomalies et commenceront à ressembler à une catégorie de recherche émergente à part entière.

Des employés d’Anthropic affirment que Claude Mythos peut résoudre la conjecture de distance unitaire d’Erdős.
La configuration rapportée utilisait plusieurs instances coordonnées de Claude Code plutôt qu’un simple prompt unique.
Le véritable changement est le passage des victoires isolées sur des benchmarks à l’usage de systèmes d’IA pour une exploration mathématique de type recherche.

Cet article s’appuie sur le reportage de The Decoder. Lire l’article original.

front and side images of a researcher equipped with AI training devices, part of the XRZero-G0 system.

XRZero-G0 ouvre un jeu de données robotique de 2 000 heures

X Square Robot a publié XRZero-G0 et un jeu de données multimodal de 2 000 heures afin de réduire la quantité de données réelles de robots nécessaire aux systèmes d’IA incarnée.

Read article

Originally published on the-decoder.com

Claude Mythos d’Anthropic serait la dernière IA à s’attaquer à un problème historique d’Erdős