数学家工作方式的问题

数学研究是人类活动中最具挑战性的智力工作之一,在许多方面也最少实现自动化。虽然 AI 系统已经改变了编码、写作和数据分析,但高等数学的形式结构在很大程度上仍超出其能力范围。证明必须通过严格逻辑来验证;抽象结构中的模式也不会像文本那样轻易接受大型语言模型擅长的统计式模式匹配。名为 Axiom Math 的初创公司认为自己找到了一种改变这一点的方法,本周它发布了一款面向数学家的免费工具,将强大的模式发现能力带到了一台普通笔记本电脑上。

这款工具名为 Axplorer,是 PatternBoost 的民主化版本。PatternBoost 是由现任 Axiom 研究科学家 Francois Charton 开发的算法,他此前曾在 Meta 工作。2024 年,Charton 使用在数千个超级计算机节点上运行三周的 PatternBoost,破解了图论中一个有百年历史的问题,即 Turan 四环问题。Axplorer 只需在一台 Mac Pro 上运行两个半小时,就能达到同样的结果。

Axplorer 的作用

Axplorer 背后的算法通过经典搜索与神经网络学习的迭代循环运作。它首先为某个数学问题生成大量随机候选解,并保留表现最好的方案。随后,一个 Transformer 神经网络会基于这些成功样本进行训练,以学习什么样的属性构成一个好解。下一轮中,训练后的网络会生成改进后的候选解,作为另一轮经典搜索的起点。两个阶段交替进行,每一轮都产出更优的解。

关键洞见在于,神经网络并不需要在深层意义上真正理解数学。它只需要识别迄今已找到的解中的结构模式,并利用这些模式来引导更优候选解的生成。经过多次迭代,这种方法会产生仅靠经典搜索很难找到的解,尤其是在搜索空间极其庞大的问题中,随机探索在计算上根本不可行。

Turan 问题及其揭示的意义

Turan 四环问题要问的是:给定一组点,在不形成任何四点回路的前提下,你最多可以在它们之间画出多少条边?这个问题触及组合数学和图论中的深层结构,而这些结构与现实网络的分析密切相关,例如社交媒体图、供应链和搜索引擎链接结构。该问题在被 PatternBoost 于 2024 年破解之前,已大约一个世纪未能解决。

PatternBoost 需要巨大的超级计算机,这对 Meta 来说并不是障碍,因为它日常就运行这种规模的基础设施。但对于世界上几乎每一位可能想用类似方法解决自己开放问题的数学家来说,这却是一个障碍。Axiom 将 Axplorer 设计为可在消费级工作站上运行,从而改变了这类数学 AI 的可及性分布。

Axiom Math 背后的人

这家公司由 Carina Hong 创立,她今年 24 岁,曾在 MIT 和牛津大学学习,后来从斯坦福退学。Axiom 于 2024 年结束隐身,获得了 6400 万美元种子轮融资,估值达 3 亿美元,由 B Capital 领投。除 Charton 外,研究团队还包括 AI 安全与公平专家 Aram Markosyan。

Hong 对公司的愿景远不止于 Axplorer。她表示,寻找解答并不是数学家的全部工作,数学本身具有探索性和实验性。有时,洞见来自于发现此前未曾被注意到的模式,而这样的发现可以开启数学的全新分支。Axiom 所宣称的长期目标是它所称的数学超级智能,也就是一种不仅能解决已知问题,还能参与发现新数学结构的 AI。

Axplorer 目前免费开放

Axiom 已将 Axplorer 作为免费工具发布,任何能够安装它的数学家都可以使用。这个决定体现了一种有意为之的策略:通过在学术界广泛分发该工具,Axiom 可以收集反馈,识别算法擅长处理哪些类型的问题,并在通常对商业 AI 计划持怀疑态度的群体中建立信誉。

该公司的另一款产品 AxiomProver 侧重于形式化证明生成与验证,已经找到四个此前未解的数学问题的解。模式发现工具与证明验证器的组合,构成了一对互补能力,分别对应数学研究的两个阶段:提出猜想,然后对其进行严格证明。

数学 AI 的走向

Axiom 正进入一个已经获得大量投资并取得若干里程碑式成果的领域。DeepMind 的 AlphaProof 和 AlphaGeometry 已展示出 AI 能够解决国际数学奥林匹克竞赛水平的问题。但竞赛型问题无论多难,都只是数学的一个狭窄切面。更宏大的目标,例如在数论、代数拓扑或组合数学等领域参与开放研究,目前仍基本未被探索。

Axiom 的方法强调模式发现和迭代搜索,而不是端到端定理证明,因此它可能比验证阶段更适合数学研究的探索阶段。它是否能够真正产生全新的数学洞见,仍是一个悬而未决的问题。但它如今可以在笔记本电脑上运行,而不必依赖超级计算机,仅这一点本身就已经是朝着回答这个问题迈出的重要一步。

本文根据 MIT Technology Review 的报道改编。阅读原文