DeepMind的SIMA 2人工智能学会像人类一样游戏

DeepMind游戏人工智能实现重大飞跃

谷歌DeepMind发布了迄今为止最强大的虚拟游戏代理SIMA 2。这不是你常见的游戏机器人——它被设计成能像人类玩家一样理解、推理和改进。

从键盘命令到真正理解

最初的SIMA能遵循约600条语言指令，但任务成功率仅为31%（人类为71%）。SIMA 2彻底改变了这一局面。借助Gemini2.5Flash Lite技术，它不仅执行命令——还能把握目标、解释计划并从经验中学习。

秘密在于SIMA 2的架构。当你给出指令时——无论是文字、语音还是表情符号——Gemini都会处理你的话语和它在游戏中看到的内容。然后它会确定高层次目标并决定如何实现它们。

在一个令人印象深刻的演示中，研究人员告诉SIMA 2寻找"一座熟番茄颜色的房子"。AI推理出番茄成熟时会变红，并成功找到了一座红房子。

也许最令人兴奋的是SIMA 2如何随时间进步。在用人类游戏示例进行初步训练后，它进入新游戏时已准备好独立学习。Gemini模型为自己创造新挑战并评估表现——让后续版本能掌握早期迭代失败的任务。

DeepMind将SIMA 2与Genie3技术结合展示了非凡的能力：从单张图像或文本提示生成交互式3D世界。在这些全新环境中，代理能够识别物体并完成指定任务。

虽然目前游戏提供了完美的测试平台，但这些能力暗示了未来的应用：

人工智能与人类智能之间的差距正在缩小——一次一个虚拟世界地缩小着差距。

关键点: