字节跳动AI数学家获得金牌级分数
字节跳动AI在国际数学奥赛中取得突破
字节跳动Seed AI团队开发的数学推理模型正引起学术界瞩目。其Seed Prover 1.5模型近期展现出媲美顶尖人类数学家的能力,在国际数学奥林匹克竞赛(IMO)中以金牌级别解答了难题。
成就解析
该模型仅用16.5小时就解决了IMO2025六道题目中的五道,获得35分的高分——这在人类选手中足以斩获金牌。
相比字节跳动前代模型需要三天解决四道题且仅达银牌水平,此次进步显著。
"最令人振奋的是",与该项目无关的AI研究员李伟博士表示,"这些模型在曾被视作人类专属领域的复杂推理任务上正以惊人速度进步"。
突破性技术揭秘
成功秘诀?大规模强化学习使Seed Prover 1.5的正确率从练习题的50%跃升至近90%。该模型不仅征服了IMO,还在北美大学生闻风丧胆的普特南竞赛中创下纪录。
两大创新铸就了这个数学奇才:
- 智能证明器:使用Lean等形式化数学语言生成可验证证明——相当于为AI数学家打造了可同行评审的工作成果。
- 草图模型:模拟人类解题思维,先创建非正式草稿再转化为正式证明。

草图模型的运作方式如同数学家先在草稿纸上推演思路再撰写最终解答。通过混合奖励信号强化学习,它同时提升了整体规划能力并降低了复杂度壁垒。
超越竞赛的实际应用
虽然竞赛表现抢眼,但真正价值在于潜在应用场景:
- 辅助数学家完成复杂证明
- 验证数学论证过程
- 展示解题思路的教育工具
团队已将研究成果发表在arXiv的技术论文中(https://arxiv.org/pdf/2512.17260),欢迎AI与数学界共同审视。
核心要点:
- 金牌表现:以IMO2025金牌级别(35/42分)解答问题
- 速度飞跃:16.5小时完成解题 vs 前代模型的三天耗时
- 技术创新:智能证明器与草图模型复现人类推理流程
- 深远影响:可能变革数学研究与教学方法论



