Ein weiterer angeblicher KI-Durchbruch in der Mathematik folgt schnell

Der Wettbewerbszyklus in der Mathematik an der KI-Grenze beschleunigt sich. Kurz nachdem OpenAI Berichten zufolge die Erdős-Vermutung über Einheitsabstände widerlegt hatte, sagen Mitarbeitende von Anthropic nun, Claude Mythos könne dasselbe Problem ebenfalls lösen, berichtet The Decoder.

Bei dieser Behauptung bleibt es genau das: ein gemeldetes Ergebnis, das von Anthropic-Mitarbeitenden beschrieben und öffentlich auf X diskutiert wurde. Das ist wichtig, weil die Geschichte damit in eine Kategorie fällt, die in der fortgeschrittenen KI-Forschung immer häufiger wird: Bedeutende technische Fortschritte zirkulieren zunächst in Laboren, unter Ingenieurinnen und Ingenieuren sowie praktizierenden Mathematikerinnen und Mathematikern, bevor ein vollständiges institutionelles Paper oder eine breitere unabhängige Verifikation die Frage endgültig klärt.

Selbst mit dieser Einschränkung ist die gemeldete Entwicklung bedeutsam. Die Erdős-Vermutung über Einheitsabstände ist seit 1946 offen. Wenn mehrere Frontier-Systeme nun tragfähige Lösungswege für ein lang bestehendes Problem der kombinatorischen Geometrie finden können, dann ist die relevante Geschichte nicht mehr nur ein einzelner Schlagzeilen-Beweis. Es ist die Möglichkeit, dass fortgeschrittene Modelle beginnen, auf schwierigen Forschungsproblemen wiederholt echten Wert zu liefern.

Was Anthropic Berichten zufolge getan hat

Laut dem Ausgangstext nutzte Anthropic ein Testszenario, das nach einem anderen von KI gelösten Erdős-Problem aufgebaut wurde. Das System bestand aus isolierten Claude-Code-Instanzen mit Mythos-Zugang, die das Problem erhielten, Lösungswege erkundeten und ihre zusammengefassten Erkenntnisse dann an andere, unabhängig arbeitende Instanzen weitergaben. Dieses Detail ist wichtig, weil es die Debatte weg von einem einzelnen Prompt und hin zu einem agentischen Workflow verschiebt.

Mit anderen Worten: Die gemeldete Leistung wird nicht als reine Einmal-Antwort eines Sprachmodells dargestellt. Sie ähnelt eher einem koordinierten Forschungsharnisch: mehrere Modellinstanzen, Problemzerlegung, Zusammenfassung und iterativer Vergleich von Ansätzen. Dadurch wirkt das Ergebnis weniger wie eine saubere Demo und mehr wie ein Ausblick darauf, wie KI-gestützte mathematische Arbeit in der Praxis tatsächlich ablaufen könnte.

Die Quelle sagt außerdem, dass Mythos oft einen anderen Weg als das OpenAI-Modell einschlug. Falls das zutrifft, deutet das auf etwas Interessanteres als bloße Duplizierung hin. Unabhängige Lösungsstrategien kommen echtem Forschungswert näher als das bloße Reproduzieren einer bekannten Argumentationslinie.

Warum der Vergleich wichtig ist

Der Artikel merkt an, der Mathematiker Daniel Litt habe das Ergebnis von Anthropic angeblich als „ein bisschen schlechter“ als das von OpenAI bezeichnet, zugleich aber gesagt, Mythos habe auch OpenAIs Lösung gefunden. Das ist eine nützliche Erinnerung daran, dass nicht alle Beweise gleich sind. In der Mathematik zählen Eleganz, Kürze und konzeptionelle Neuheit neben der Korrektheit.

Der strategische Kern ist aber nicht, dass der Beweis eines Labors hübscher war als der eines anderen. Entscheidend ist, dass mehrere Labore inzwischen offenbar glauben, ihre Systeme könnten offene mathematische Probleme auf einem deutlich höheren Niveau bearbeiten als frühere Generationen. Sobald das reproduzierbar wird, verschiebt sich die Frage von „Kann KI das überhaupt?“ zu „Wie oft, wie unabhängig und mit wie viel menschlicher Aufsicht?“

The Decoder erwähnt außerdem die jüngste Ankündigung von Google DeepMind, wonach ein KI-gestütztes System neun Erdős-Probleme mithilfe von Lean, einer formalen Beweissprache, gelöst habe. Dieser Vergleich schärft einen wichtigen Unterschied in der aktuellen KI-Mathematik. Manche Systeme stützen sich stark auf formale Verifizierungsumgebungen; andere werden stärker an natürlicher Sprachverarbeitung und agentischer Exploration gemessen. Das Feld hat noch nicht entschieden, welcher Stil mehr über rohe Leistungsfähigkeit verrät.

Die größere Verschiebung

Was diese Geschichte tragfähig macht, ist nicht nur die konkrete Vermutung. Es ist das Tempo der Folgebehauptungen. Offene Probleme in der Mathematik dienten früher als klare Marker für die Grenze zwischen menschlichem und maschinellem Denken. Diese Grenze wirkt inzwischen durchlässiger, besonders wenn Labore Frontier-Modelle mit Orchestrierungswerkzeugen kombinieren, die es ihnen erlauben, zu verzweigen, zu vergleichen, zusammenzufassen und erneut zu versuchen.

Zwischen einem gemeldeten Laborerfolg und einem stabilen, breit vertrauenswürdigen Forschungssystem bleibt dennoch ein großer Unterschied. Verifikation, Peer Review und Reproduzierbarkeit sind weiterhin unverzichtbar. Aber das Muster ist schwer zu übersehen: KI-Labore präsentieren nicht mehr nur Benchmark-Gewinne oder ausgefeilte Verbraucher-Assistenten. Sie präsentieren ihre Systeme zunehmend als Beitragende zu anspruchsvoller Wissensarbeit.

Wenn sich diese Behauptungen weiter bestätigen, werden KI-Mathematik-Schlagzeilen aufhören, seltene Ausreißer zu sein, und als eigenständige neue Forschungskategorie erscheinen.

  • Anthropic-Mitarbeitende sagen, Claude Mythos könne die Erdős-Vermutung über Einheitsabstände lösen.
  • Das gemeldete Setup nutzte mehrere koordinierte Claude-Code-Instanzen statt eines einfachen Einmal-Prompts.
  • Die größere Geschichte ist das schnelle Tempo KI-gestützter Arbeit an seit Langem offenen mathematischen Problemen.

Dieser Artikel basiert auf der Berichterstattung von The Decoder. Den Originalartikel lesen.

Originally published on the-decoder.com