跳转到主要内容

谷歌Gemini 3将AI推理能力推向科学新高度

谷歌Gemini 3 Deep Think:当AI遇上尖端科学

人工智能正从聊天机器人领域迈向实验室。2月13日,谷歌推出Gemini 3 Deep Think——一个专门为解决连人类专家都束手无策的复杂科学问题而设计的大型语言模型。

超越标准答案

新模型是谷歌工程师与顶尖科学家合作的成果。与传统AI助手不同,Deep Think专精于以下场景:

  • 问题边界模糊不清
  • 存在多个有效解决方案
  • 数据呈现混乱或不完整状态

"我们正在超越只有单一正确答案的问题领域,"项目首席研究员Elena Rodriguez博士解释道,"现实世界的研究往往需要驾驭不确定性——这正是Deep Think的闪光点。"

基准测试霸主

通过严格测试,该模型的能力得以彰显:

数学造诣:在国际数学奥林匹克竞赛(2025年版)题目中获得金牌级表现

科学天赋:在物理和化学奥赛模拟测试中斩获最高分

编程实力:在Codeforces竞技编程测试中获得3455的惊人Elo评分

最引人注目的成果来自"人类终极考试"基准测试——该测试旨在将推理能力推向极限——Deep Think获得了近半数分数(48.4%)。

从测试到应用

自2月12日起,精选研究人员通过谷歌API项目获得早期访问权限,同时Google AI Ultra订阅用户可亲身体验其功能。

团队更强调实际应用而非基准分数:

  • 协助工程师进行复杂系统建模
  • 帮助科学家分析海量非结构化数据集
  • 支持需要高级逻辑框架的理论研究

"这不是要取代研究人员,"Rodriguez澄清道,"而是要创造一个理解科学研究混乱现实的AI伙伴。"

此次发布标志着AI作为生产力工具向基础研究潜在合作者的重大转型。

核心要点:

  • 专业推理:专为解决没有明确解决方案的模糊科学问题而设计
  • 顶尖表现:在数学和科学基准测试中媲美人类顶级水平
  • 实用导向:优先考虑现实研究应用而非理论基准
  • 受限访问:目前仅通过精选项目开放,随后将扩大发布范围

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

OpenAI与Cerebras联合推出闪电级编程助手
News

OpenAI与Cerebras联合推出闪电级编程助手

OpenAI与Cerebras合作推出革命性AI模型GPT-5.3-Codex-Spark,专为实时编程辅助设计。此次合作结合了OpenAI的语言模型优势与Cerebras的强大计算硬件,为开发者提供前所未有的速度和精准度。该模型承诺消除AI辅助编程中的等待时间,同时确保程序员对工作流程的完全掌控。

February 13, 2026
AI编程OpenAI开发者工具
中国AI竞赛升温:智谱与MiniMax同日发布重磅新模型
News

中国AI竞赛升温:智谱与MiniMax同日发布重磅新模型

中国人工智能领域竞争加剧,两大头部企业同日发布新品。智谱AI的GLM-5参数规模较前代近乎翻倍,而MiniMax在2.2版本发布仅数周后便闪电推出2.5版本。两款模型均强化编程能力与智能体功能,彰显中国追赶全球AI领导者的决心。

February 12, 2026
AI发展中国科技机器学习
News

百度千帆推出全新编程计划:为开发者提供免费AI助力

百度千帆正式推出编程计划,这是一项无需订阅的AI编程服务,集成了GLM-4.7和DeepSeek-V3.2等顶尖模型。该创新平台提供从编写到优化的全生命周期代码支持,并支持无缝切换模型。旨在让企业和个人开发者都能更便捷地使用AI编程,将AI从偶尔使用的工具转变为日常编码伙伴。

February 12, 2026
AI开发编程工具百度千帆
News

Flapping Airplanes获1.8亿美元融资,致力于让AI像人类一样学习

AI初创公司Flapping Airplanes刚刚获得红杉资本等顶级投资机构1.8亿美元的种子轮融资。与依赖海量数据抓取的传统AI实验室不同,该团队希望通过模仿人脑效率,让机器更智能而非更费力地学习。他们的宏伟目标?将AI训练的数据效率提升1000倍。

February 11, 2026
AI初创企业机器学习风险投资
News

智谱AI的GLM-5模型泄露引发市场狂热

春节期间,中国人工智能领域因智谱AI强大的GLM-5模型细节在网上泄露而震动。这一消息使公司股价飙升200%,投资者显然对其受DeepSeek启发的架构和强大功能感到兴奋。该模型的特别之处在于它能高效处理海量数据,同时新增视频理解能力——这解决了先前模型的一个关键弱点。

February 11, 2026
AI发展中国科技机器学习
Cursor的Composer1.5:AI编程助手的量子飞跃
News

Cursor的Composer1.5:AI编程助手的量子飞跃

Cursor发布了其迄今为止最先进的编程助手Composer1.5。新模型的强化学习能力提升了20倍,能提供更智能的响应并以前所未有的效率处理复杂任务。其独特之处在于巧妙的'自我总结'功能,可保持长时间编码会话的连贯性,以及智能调节响应深度的能力——知道何时深入思考,何时快速响应。

February 10, 2026
AI编程开发者工具机器学习