跳转到主要内容

DeepMind的SIMA 2人工智能学会像人类一样游戏

DeepMind游戏人工智能实现重大飞跃

Image

谷歌DeepMind发布了迄今为止最强大的虚拟游戏代理SIMA 2。这不是你常见的游戏机器人——它被设计成能像人类玩家一样理解、推理和改进。

从键盘命令到真正理解

最初的SIMA能遵循约600条语言指令,但任务成功率仅为31%(人类为71%)。SIMA 2彻底改变了这一局面。借助Gemini2.5Flash Lite技术,它不仅执行命令——还能把握目标、解释计划并从经验中学习。

Image

SIMA 2如何像玩家一样思考

秘密在于SIMA 2的架构。当你给出指令时——无论是文字、语音还是表情符号——Gemini都会处理你的话语和它在游戏中看到的内容。然后它会确定高层次目标并决定如何实现它们。

在一个令人印象深刻的演示中,研究人员告诉SIMA 2寻找"一座熟番茄颜色的房子"。AI推理出番茄成熟时会变红,并成功找到了一座红房子。

无需人类帮助就能从错误中学习

也许最令人兴奋的是SIMA 2如何随时间进步。在用人类游戏示例进行初步训练后,它进入新游戏时已准备好独立学习。Gemini模型为自己创造新挑战并评估表现——让后续版本能掌握早期迭代失败的任务。

DeepMind将SIMA 2与Genie3技术结合展示了非凡的能力:从单张图像或文本提示生成交互式3D世界。在这些全新环境中,代理能够识别物体并完成指定任务。

这对游戏之外的领域意味着什么

虽然目前游戏提供了完美的测试平台,但这些能力暗示了未来的应用:

  • 真正理解请求的更直观虚拟助手
  • AI队友能真实适应的训练模拟
  • 最终能在陌生现实空间中导航的机器人

人工智能与人类智能之间的差距正在缩小——一次一个虚拟世界地缩小着差距。

关键点:

  • 🧠 使用Gemini模型对目标和环境进行高级推理
  • 🎮 任务完成率从31%(SIMA1)跃升至接近人类的水平(62%)
  • 🔄 自我改进系统无需持续人工监督即可学习
  • 🌍 结合Genie3技术展现出惊人的适应性

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

微软MAI-Image-2跻身全球AI图像生成三强
News

微软MAI-Image-2跻身全球AI图像生成三强

微软发布全新强力MAI-Image-2模型,现位列全球文本转图像AI系统前三甲。这项突破性技术解决了AI生成图像中文字乱码的长期问题,同时提供惊艳的视觉质量。用户已可免费测试该模型,微软计划很快将其整合至生产力工具中。

March 20, 2026
AIMicrosoftimage-generation
Manus AI以20分钟应用创建功能让'我的电脑'焕发生机
News

Manus AI以20分钟应用创建功能让'我的电脑'焕发生机

Meta旗下AI平台Manus实现了从云端到桌面的革命性跨越。其全新'我的电脑'功能允许AI代理直接管理文件、自动化任务,甚至能在几分钟内构建应用程序——所有这些操作都在严格的人工监督下确保数据安全。这或将彻底改变我们与设备的交互方式,使AI从助手转变为真正的数字同事。

March 18, 2026
AI生产力工具Meta
NVIDIA推出NemoClaw:为OpenClaw生态系统带来一键式AI体验
News

NVIDIA推出NemoClaw:为OpenClaw生态系统带来一键式AI体验

NVIDIA发布了革命性工具包NemoClaw,极大简化了OpenClaw平台上AI代理的部署流程。用户现在仅需一条命令即可安装Nemotron等强大AI模型和OpenShell运行时环境。该解决方案通过隔离沙箱和混合模型策略解决了关键隐私问题,同时支持从消费级设备到企业超级计算机的全场景应用。NVIDIA首席执行官黄仁勋称其为当代的'AI操作系统'。

March 17, 2026
AINVIDIAOpenClaw
智谱的GLM-5-Turbo:永不言弃的AI助手
News

智谱的GLM-5-Turbo:永不言弃的AI助手

智谱AI发布了GLM-5-Turbo,这是一款强大的新模型,旨在处理复杂任务而不中途停滞。与可能在长时间处理过程中出现问题的标准AI工具不同,此次升级专注于四个关键改进:可靠的工具使用、分解复杂请求、理解时间敏感任务以及高效处理繁重工作负载。早期测试显示,在实际商业场景中它的表现优于竞争对手,多家大型科技公司已对其准确性和可靠性表示赞赏。

March 17, 2026
AIZhipu生产力
ChatGPT现可像Shazam一样识别歌曲——工作原理揭秘
News

ChatGPT现可像Shazam一样识别歌曲——工作原理揭秘

OpenAI与Shazam合作,将音乐识别功能直接整合进ChatGPT。当听到动听旋律时,无需再切换应用——只需询问ChatGPT正在播放的歌曲,即可获得即时结果。该集成允许用户通过简单的语音或文本命令识别歌曲,并提供艺人信息和预览片段。就像聊天框里有个懂音乐的朋友。

March 10, 2026
OpenAIChatGPTShazam
GPT-5.4震撼登场:具备读心AI与百万级token记忆能力
News

GPT-5.4震撼登场:具备读心AI与百万级token记忆能力

OpenAI最新模型GPT-5.4带来了革命性功能,让我们离真正智能的数字助手更近一步。全新的'思维模式'让用户可以窥见AI的推理过程,而百万级token记忆能力使其能够处理海量文档。最令人惊叹的是其原生计算机操作能力——这款AI不仅能对话,还能实际跨应用程序工作。

March 6, 2026
AIOpenAIGPT