跳转到主要内容

NVIDIA发布Cosmos3,一款颠覆性的开源机器人AI模型

NVIDIA突破性进展:Cosmos3重新定义物理AI

在全球范围内可能加速机器人技术发展的举措中,NVIDIA发布了Cosmos3,这是首个完全开源的多模态AI模型,专为物理智能应用设计。这一创新系统于6月1日推出,有望彻底改变机器理解和与物理世界交互的方式。

Cosmos3的独特之处

Cosmos3的核心代表了AI开发的量子飞跃。该模型将推理Transformer与生成Transformer相结合,创造了工程师们所称的"物理任务的统一大脑"。想象一下,一个AI可以同时分析物体互动、预测运动并生成逼真模拟——所有这些都在一个系统中完成。

Image

"我们正在解决AI最严峻的挑战之一,"NVIDIA发言人解释道。"现实世界的应用常常失败,因为当前模型难以应对有限的数据和碎片化的模拟。Cosmos3改变了这一局面。"

令人瞩目的性能表现

基于数十亿数据点(包括文本、图像、视频和运动模式)训练的Cosmos3,在Artificial Analysis和Physics-IQ等基准测试中展示了行业领先的准确性。早期采用者报告称,该系统可以将典型的训练周期从数月缩短至几天,这对机器人初创企业和研究机构来说可能是一个改变游戏规则的技术。

NVIDIA为不同需求提供了定制版本:

  • Cosmos3Super:专注于机器人和自动驾驶车辆的精度
  • Cosmos3Nano:闪电般的视频分析和动作预测
  • Cosmos3Edge(即将推出):面向边缘设备的实时推理

Cosmos联盟的形成

认识到该技术的潜力,NVIDIA已与Agile Robots和Runway等行业领导者合作成立Cosmos联盟。这一协作努力旨在标准化物理AI开发并加速现实世界中的应用。

"我们正在进入一个新时代,"NVIDIA CEO黄仁勋表示。"Cosmos3不仅仅是另一个AI模型——它是真正能够理解和与我们世界互动的智能系统的基础。"

关键点:

  • 首个完全开源的多模态物理AI模型
  • 结合推理与生成的混合Transformer架构
  • 相比现有方法训练速度提升80%
  • 提供三种针对不同应用的专用版本
  • 成立Cosmos联盟以推动行业广泛采用