跳转到主要内容

谷歌Gemini 3 Deep Think智商碾压除七人外的全人类

谷歌新AI模型接近人类水平推理能力

Image

随着谷歌公布其Gemini 3 Deep Think模型的重大升级,人工智能领域今日发生巨变。这个专注于跨领域复杂问题解决的系统展现出媲美——有时甚至超越——人类专家的能力。

令人瞩目的编程实力

在算法竞赛平台Codeforces上,Gemini获得了3455的Elo评分。全球目前仅有七人保持更高分数。就在十二个月前,最强竞争AI模型的得分还停留在2727分,低了近700分。

"这不仅是渐进式改进",审阅结果的MIT计算机科学教授Elena Vasquez博士解释道,"它代表着AI系统处理复杂问题分解方式的质的飞跃"。

超预期的科学突破

该模型的分析能力远不止编程竞赛:

  • 审稿超能力:在一篇已通过人工同行评审的高水平物理论文中发现了微妙的逻辑缺陷
  • 数学造诣:成功证明了与著名Erdős猜想相关的多个难题
  • 工程直觉:能将手绘草图转化为生产级3D模型文件(如笔记本支架),效率提升十倍

跨学科基准测试制霸

数据充分证明了Gemini的广泛能力:

  • 在严苛的"终极人类考试"(HLE)中获得48.4%分数
  • ARC-AGI-2基准测试准确率达84.6%
  • 在STEM领域保持强劲表现的同时展现更强的创造性推理能力

目前该升级仅限AI Ultra订阅用户和通过API访问的特定研究人员使用,使谷歌在与竞争对手的推理模型对抗中占据强势地位。

关键要点:

  • 编程:可与全球顶尖0.001%程序员比肩
  • 科学分析:能发现连专家评审都忽略的错误
  • 工程应用:彻底改变原型设计速度
  • 可用性:目前仅限高级订阅用户和研究合作伙伴

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

蚂蚁集团发布突破性万亿参数AI模型
News

蚂蚁集团发布突破性万亿参数AI模型

蚂蚁集团推出全球首个采用混合线性架构的开源万亿参数AI模型Ring-2.5-1T。这款性能怪兽在数学推理和长文本生成等复杂任务中表现卓越,同时显著提升了效率。该模型在基准测试中超越竞争对手,有望彻底改变计算密集型AI应用的处理方式。

February 13, 2026
AI创新开源技术机器学习
News

京东Joyinside通过AI玩具社交网络连接儿童

京东Joyinside推出创新的儿童AI玩具社交网络,实现跨品牌设备互联。'快乐星球社交玩法'通过私密码让孩子安全交友,同时支持八种中国方言。春节期间这些互动玩具销量增长两倍,显示出市场对促进家庭成员情感连接的科技产品的强烈需求。

February 13, 2026
AI玩具智慧育儿科技创新
News

谷歌Gemini 3将AI推理能力推向科学新高度

谷歌发布Gemini 3 Deep Think,标志着AI能力在日常对话之外的重大飞跃。这款专业模型以奥林匹克竞赛级别的推理能力解决复杂科学问题,在数学和编程挑战中表现惊人。现已面向精选研究人员和Google AI Ultra订阅用户开放,有望从基准测试冠军转型为真正的实验室伙伴。

February 13, 2026
AI研究机器学习科学计算
中国GLM-5 AI模型跻身全球前四强
News

中国GLM-5 AI模型跻身全球前四强

中国人工智能行业迎来重大突破,智谱AI的GLM-5模型在全球排名中攀升至第四位,与Anthropic的Claude Opus4.5并驾齐驱。这款新开源模型实现了参数规模翻倍和尖端架构升级等显著改进,开发者现可通过Silicon Flow AI云平台获取其高速版本。

February 13, 2026
AI发展中国科技大语言模型
OpenAI与Cerebras联合推出闪电级编码助手
News

OpenAI与Cerebras联合推出闪电级编码助手

OpenAI与Cerebras合作推出GPT-5.3-Codex-Spark,这是一款专为实时编程辅助设计的革命性AI模型。此次合作结合了OpenAI的语言专业能力与Cerebras强大的晶圆级计算技术,实现了每秒超过1000个token的前所未有的处理速度。新模型着重保持开发者的控制权,同时大幅减少编码过程中的等待时间。

February 13, 2026
AI编程OpenAICerebras
News

MiniMAX筹备全球首秀:M2.5模型开启海外秘密测试

中国AI企业MiniMAX正悄然在海外测试其新一代M2.5模型,此举预示着雄心勃勃的全球扩张计划。该模型专注于智能代理能力,承诺提升任务执行效率和用户体验。这一战略举措将使MiniMAX具备国际竞争力,同时强化其技术优势。

February 12, 2026
AI发展MiniMAX智能代理