断网解题，Claude Mythos推翻Erdős 80年猜想！比OpenAI更短更漂亮

2026-05-27 发布浏览273次点赞0次收藏0次

【导读】OpenAI用125页思维链踹开Erdős 80年猜想的门，Mythos如今找到了一条更短更优雅的路。最离谱的是，它拿到第一个可行解就停手了——面对名满天下的开放问题，AI也会紧张。

AI做数学这件事，速度已经彻底「失控」了！

OpenAI前脚刚推翻了一个悬了80年的数学猜想，Anthropic后脚就亮出证明。同一周，DeepMind还一口气啃下了9道同类难题。

就在刚刚，Anthropic研究员Levent Alpoge在上甩出十条推文：

OpenAI花了125页才解开，他周末拿Mythos随手一试。

不仅分分钟搞定，而且路径还更短更简洁！

断网隔离，Mythos开测

这位Levent Alpoge来头可不小。

1992年出生，哈佛本科4.0满分、剑桥Part III、普林斯顿博士（导师是菲尔兹奖得主Manjul Bhargava），2015年拿了Morgan Prize（美国本科生数学研究最高奖），哈佛Junior Fellow，并且解决了希尔伯特第十问题在所有数域上的推广。

2023年GPT-4发布，他立刻被击中了。

对我来说，它瞬间成了人类有史以来创造的最有趣的东西。回到CS！

紧接着，他便加入了Anthropic。

这周OpenAI破解Erdős难题之后，Levent做了一件「显而易见的事」——让Mythos也试试。

为了确保公平，测试条件很严格。

多个Claude Code实例各自独立工作，全程断网，杜绝从OpenAI公开解法里「抄作业」的可能。

结果，模型不止一次找到了和OpenAI类似的解法，但它更偏爱另一条完全不同但更加简洁的路。

更有意思的是，模型明明已经找到了一个能推翻猜想的方案，却在第一个可行答案上就停了下来。

明明往前再走一步，就能拿到更强的结果。但Mythos太紧张了！

面对这道名满天下的开放问题，它不敢相信自己的结论，保守地停在了第一个可行方案上。

看到这，Levent直接乐了：「这种感觉，所有数学家都懂！」

目前，Opus 4.7已完成了证明全文的整理排版：

https://www-cdn.anthropic.com/files/4zrzovbb/website/ca35f196125c899a5ad11f011080202a652aef02.pdf

80年没人赢过的赌注

时间拨回1946年。

匈牙利数学家Paul Erdős提了一个听起来极简单的问题，在平面上撒n个点，最多能有多少对点之间的距离恰好是1？

举个例子，你在桌上摆100枚硬币，每两枚硬币圆心之间如果刚好隔一个硬币直径，就算一对「单位距离」。100枚硬币最多能凑出多少对？

Erdős自己给了一个答案：把点排成方格网格，经过适当缩放后，单位距离对的数量大约是n^(1+c/log log n)。

也就是，100枚硬币大概能凑出100多一丢丢对。

然后他下了赌注，这就是极限了，没人能做得更好。

之所以这么自信，因为这里有个关键瓶颈——高斯整数Z[i]。

Erdős的方格网格依赖这个数系，而一个固定范数在Z[i]里能分解出多少种方式，取决于除数函数，上限大约是 exp(O(log n / log log n))。

这就是那个「多出一丁点」的天花板。

80年来，所有人都在这个框架里打转。

数论重武器，降维打击几何学

对于人类数学家来说，代代相传的直觉是「答案要在高斯整数Z[i]里找」。

Mythos没读过这个传统，一上来就把Z[i]换成了次数远比2大的数域K的整数环O_K。

听起来像「用大炮打蚊子」，但就是这种跨学科的暴力，撬开了80年的僵局。

方法是，先利用Golod-Shafarevich判则，在一个二次域上面搭一座无限高的「数域塔」K₀ ⊂ K₁ ⊂ K₂ ⊂……

然后对每一层K_n取一个四次根扩张F_n = K_n(D^{1/4})，次数为d_n。

这座塔之所以管用，靠的是一个关键性质：

不管塔造多高，数域的「复杂度密度」始终有界，结构始终可控。一旦参数够大，几何计数就能启动。

接下来是整个证明的核心。

在Erdős的Z[i]里，单位群只有{±1, ±i}四个元素。能往外伸的「单位距离方向」就这么几个，直接被除数函数死死卡住。

但在高维数域里，单位群的秩随维度增长，van der Corput定理直接把秩转化成方向数。

如此一来，4个方向就变成随维度爆炸式增长。

这段看不懂没关系，记住一件事就行——

Erdős被困在一个只有4个出口的房间里，Mythos把墙拆了。

接下来是具体的构造。

首先，选一个实嵌入把这些数投射到平面上，就得到了点集P。

然后，取一个单位向量平移这些点，新旧两点之间的距离恰好是1。

因为方向数增长极快，满足条件的点对数量远超Erdős的上限。

两者相乘，就得到了多项式增益。

更直觉地说：

单位距离方向数增长为exp(Ω(d log log d))，而所有其他损耗全是exp(O(d))量级。d log log d碾压d。

Erdős的猜想，就这样被推翻了。

整个论证没有任何解析上的复杂性。和OpenAI那条125页路径相比，简洁得多。

用Levent自己的话说：

高层来看，这本质上还是Erdős原始构造加上一座类域塔。

只不过这里做的是字面意义上最蠢的事——把大小不超过半径一半的点加到大小不超过半径一半的单位上。

而它之所以管用，是因为类域塔的几何计数增长实在太快了。

一周三连，各自破城

过去这一周的时间线，信息密度高到离谱。

5月20日OpenAI官宣，一个未公开名称的通用推理模型，自主反驳了Erdős单位距离猜想。

同一天，普林斯顿教授Will Sawin在arXiv贴出手工改进版，把指数从6×10⁻³⁸干到了0.014。10³⁵倍的差距。

Georgia Tech数学家Tom Trotter，Erdős本人的合作者感慨道：「如果Erdős还活着，他一定会激动到发疯。」

5月21日DeepMind上场，AlphaProof Nexus一口气啃下9道Erdős题，每道推理成本最多只需几百美元。

5月26日，Anthropic也宣布实现独立证明，路径比OpenAI的125页短得多。

三家路线完全不同，但结果都收敛到了同一个点。

从笑话到《数学年刊》

要知道，在七个月前AI做数学还是个笑话。

2025年10月，OpenAI时任VP Kevin Weil在上宣称GPT-5解决了10个Erdős问题。

看到推文后，负责维护erdosproblems.com的数学家Thomas Bloom当场回怼「严重歪曲事实」，模型只是检索到了已知解法。Yann LeCun和Demis Hassabis都跟着嘲讽了一波。

很快，Weil就删了帖，并在四个月后离开了OpenAI。

当时所有人的判断都一样：模型会做题，但不会做研究。

转眼到了今天。

Bloom签了验证报告。Gowers写下了「提交到《数学年刊》我会毫不犹豫推荐接受」的盛赞。Litt说这是「AI自主产出的第一个让我觉得本身就有意思的结果」。

甚至，Litt还在Nature的采访中表示：「没有人类能像LLM那样吸收全部数学文献。AI正在打破学科之间的壁垒。」

三年前GPT-4还做不了本科数学题。

如今，让最伟大的数学家都感到绝望的Erdős问题，却正在变成AI的入学考试！

打破80年僵局的，是一个不知道「这题应该怎么想」的模型。

没有包袱，反而能从代数数论里借来重武器去打一道几何题。

Erdős留下了超过1000道未解题。这周又解了1道。

参考资料：

https://x.com/__alpoge__/status/2059298565093196012?s=20

https://x.com/_sholtodouglas/status/2059303540150137244?s=20

https://www-cdn.anthropic.com/files/4zrzovbb/website/ca35f196125c899a5ad11f011080202a652aef02.pdf

编辑：摩西

测试 GPT Claude 4 OpenAI 框架 Go AI

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

断网解题，Claude Mythos推翻Erdős 80年猜想！比OpenAI更短更漂亮

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。