字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5

2025-12-24 发布浏览603次点赞0次收藏0次

感谢网友若怡的线索投递！

12 月 24 日消息，字节跳动 Seed 团队今日宣布推出新一代形式化数学推理专用模型 Seed Prover 1.5，通过大规模的 Agentic RL 训练，其推理能力和推理效率宣称取得显著进步。

相比上一代模型，Seed Prover 1.5 在 16.5 小时内，针对 IMO 2025 的前 5 道题目生成了完整可编译验证的 Lean 证明代码，换算成绩为 35/42，达到此前 IMO 评分标准的金牌分数线。

针对北美本科级别数学竞赛 Putnam，Seed Prover 1.5 用时 9 小时，对 12 道 Putnam 2025 赛题中的 11 道生成了可编译验证的 Lean 代码。

更系统的评估中，Seed Prover 1.5 在完整的 Putnam 历史评估集上解决了 88% 的问题，在代表硕士数学难度的 Fate-H 和代表博士生数学难度的 Fate-X 评估集上，分别解决了 80% 和 33% 的问题，刷新了形式化数学推理模型在这几个评测集上的 SOTA 表现。

Seed Prover 1.5 的技术报告已对外公开，官方后续将开放 API，附链接如下：

技术报告：

https://arxiv.org/abs/2512.17260

Lean 证明代码：

https://github.com/ByteDance-Seed/Seed-Prover/blob/main/SeedProver-1.5/Putnam2025.zip

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。