跳转到主要内容

AI以全新方法破解著名数学难题

AI以新颖解法取得数学突破

在人工智能和纯数学领域的重大进展中,OpenAI的GPT-5.2Pro模型成功攻克了数论中的第281号问题——著名的埃尔德什问题。这一成就的非凡之处不仅在于AI解决了它,更在于它的解决方式。

菲尔兹奖得主陶哲轩,世界上最受尊敬的数学家之一,将这个解决方案描述为AI破解数学问题"最明确的案例之一"。该证明之所以突出,是因为它遵循了一条与以往尝试完全不同的路径,表明该模型并非简单地复制现有方法。

机器背后的人类

这一突破源于AI与人类研究员Neel Somani的合作。虽然早期的证明可能提供了一些背景参考点,但陶哲轩确认该模型的方法是真正新颖的。这也不是GPT-5.2Pro第一次尝试解决这个问题——记录显示它曾在2026年1月4日就产生过一个自主解决方案。

对AI能力的现实审视

随着对这一成就的兴奋情绪高涨,数学家们呼吁不要高估AI的能力。陶哲轩指出,我们大多看到的是AI的成功而其许多失败并未发表。由Paata Ivanisvili和Mehmet Mars Seven维护的跟踪数据库揭示了令人清醒的事实:AI解决此类问题的成功率仅为1-2%,且大多数胜利来自较简单的问题。

"这些工具非常有价值,"一位不愿透露姓名的研究人员解释说,"但它们更像是强大的计算器而非独立思考者。令人兴奋的是它找到了一条我们未曾考虑过的路径."

这对数学意味着什么

数学界将这一发展视为开启新的可能性而非威胁人类研究人员:

  • 原创思维:GPT-5.2Pro的证明遵循了不同于传统方法的逻辑
  • 有限但宝贵:虽然总体成功率仍然很低,但这些工具可以提供新的视角
  • 协作未来:最佳结果来自人类与AI的合作而非竞争

埃尔德什问题的解决方案展示了AI如何充当数学家所称的"直觉泵"——激发思考顽固问题的新方法。随着这些工具的改进,它们很可能像几十年前的计算机一样成为数学研究的标准装备。

关键点:

  • 突破性解决方案:GPT-5.2Pro为埃尔德什问题开发了一个令专家印象深刻的原创证明
  • 真实成功率:跟踪数据显示AI解决此类问题的成功率仅为1-2%,且多为较简单的问题
  • 研究演变:数学家将AI视为有价值的新工具而非替代品

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

AI模型在简单日历问题上栽跟头

令人意外的是,包括Google AI概览、ChatGPT和Claude在内的主流AI模型在被问及'2027年是明年吗'时,竟在基础日历逻辑上出错。虽然部分模型在对话中途自我纠正,但初始错误暴露出这些系统对时间和序列认知存在意料之外的缺陷。唯有Google的Gemini 3给出了正确答案,凸显出AI推理能力仍面临持续挑战。

January 19, 2026
AI局限性机器学习科技故障
游戏规则改变者:巨人网络的AI角色超越人类玩家
News

游戏规则改变者:巨人网络的AI角色超越人类玩家

巨人网络旗下热门游戏《超自然行动组》引入了突破性AI对手,这些数字敌人能像真实玩家一样思考和行动。依托先进的大语言模型技术,它们可以制定策略、语音交流并发起突袭——仅一周内就完成了2500万场对战。这一进展标志着中国首次成功将AI模型集成到高流量游戏环境中。

January 19, 2026
AI游戏机器学习游戏开发
Zoom以智取胜震撼AI界:巧妙策略击败科技巨头
News

Zoom以智取胜震撼AI界:巧妙策略击败科技巨头

出人意料的是,视频会议巨头Zoom在一项权威基准测试中超越了谷歌和OpenAI等AI重量级选手。Zoom并未构建庞大模型,其秘密武器是一种巧妙的'联邦式AI'方法,智能整合现有技术。尽管有批评者认为这只是重新包装,但其他人则在这种资本高效的战略中看到了可能重塑企业AI应用方式的智慧。

January 16, 2026
人工智能创新企业技术机器学习
中国AI重大突破:文心ERNIE 5.0跻身全球前十,数学能力逼近GPT
News

中国AI重大突破:文心ERNIE 5.0跻身全球前十,数学能力逼近GPT

百度最新AI模型文心ERNIE 5.0以1460分的成绩历史性位列LMArena全球排行榜第八位。更令人瞩目的是,其数学推理能力现已排名世界第二,仅次于OpenAI尚未发布的GPT-5.2。这一成就标志着中国AI技术已从单纯的'功能性'发展为真正具备国际竞争力。

January 15, 2026
人工智能文心ERNIEAI排行榜
百度文心ERNIE-5.0以全球第二数学能力登上国际舞台
News

百度文心ERNIE-5.0以全球第二数学能力登上国际舞台

百度发布了其最新AI力作——ERNIE-5.0-0110,展现出令全球瞩目的卓越能力。该模型目前在文本处理领域排名全球第八,数学能力更是高居第二,仅次于GPT-5.2-High。除了数字运算外,它还在编程、专业知识和创意写作方面取得重大进展。已在科学、金融和医疗领域证明价值的百度,邀请用户亲身体验这一技术飞跃。

January 15, 2026
AI发展中国科技机器学习
DeepSeek的记忆增强:AI模型如何变得更智能
News

DeepSeek的记忆增强:AI模型如何变得更智能

DeepSeek的研究人员开发了一种巧妙的解决方案,使大型语言模型更加高效。他们新的Engram模块就像一个心智捷径手册,帮助AI快速回忆常用短语,同时节省脑力处理更复杂的任务。早期测试显示出令人印象深刻的提升——使用Engram的模型在推理、数学和编程挑战中表现优于标准版本,同时能轻松处理更长的文本。

January 15, 2026
AI效率语言模型机器学习