跳转到主要内容

Google DeepMind的D4RT赋予AI穿越时间的视觉能力

Google DeepMind突破性实现四维AI视觉

Image

多年来,计算机科学家一直致力于让机器获得真正的视觉理解能力——那种不仅能让人类看到当下,还能直观把握场景随时间演变的能力。如今,Google DeepMind的新模型D4RT或许终于能弥合这一差距。

从平面图像到鲜活世界

这一突破源于将时间视为与长、宽、高同等重要的维度。"我们不再要求AI从碎片中拼凑理解,"首席研究员Elena Petrov博士解释道,"D4RT学习整体地观察世界——过去、现在和可能的未来。"

Image

传统系统需要单独的模型进行深度计算、运动追踪和透视分析——就像蒙着眼睛拼拼图。D4RT的优雅解决方案是什么?将所有问题都框定为一个核心问题:"这个像素在时空中的确切位置是哪里?"

闪电般的空间推理能力

数据说明一切:

  • 处理一分钟视频仅需5秒,而之前系统需要10分钟
  • 即使在遮挡或镜头移动时也能保持物体追踪
  • 无需迭代优化即可即时重建3D环境

"这不仅仅是更快,"机器人专家Jamal Chen指出,"这可能让自主系统真正实现预测而非被动反应。"

Image

实用的魔法

应用场景读起来像是科幻成真:

  • 机器人技术:机械臂能在碰撞发生前调整轨迹
  • AR/VR:眼镜可在移动表面上投射稳定的全息影像
  • 智慧城市:交通系统可预测行人流动
  • 科学研究:逐帧重建微观过程

正如Petrov所说:"我们不再教算法看静态快照了。我们在帮助它们感知动态流。"

Image

关键要点:

  • 统一架构:将空间和时间处理结合在一个模型中
  • 实时处理:视频分析速度比前代快达300倍
  • 持续追踪:即使遇到障碍也能保持物体感知
  • 广泛应用:从机器人技术到增强现实界面

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

李飞飞的World Labs凭借前瞻性AI方法估值飙升至50亿美元

AI先驱李飞飞的初创公司World Labs取得惊人成功,其估值在短短一年内飙升500%至50亿美元。该公司创新的'大型世界模型'技术专注于理解物理世界结构而非仅生成内容,吸引了主要投资者并使其站在空间智能发展的前沿。

January 26, 2026
人工智能科技创业计算机视觉
News

DeepMind首席执行官称中国AI与西方差距仅剩6个月

在2026年达沃斯论坛上,DeepMind首席执行官Demis Hassabis透露中国AI技术目前仅落后西方同行六个月——较此前预估大幅缩小。尽管他盛赞DeepSeek R1等中国成果,但也指出该国在突破性创新方面仍有不足。讨论还涉及美国放宽芯片出口政策及谷歌对具身智能研究的投入。

January 21, 2026
人工智能DeepMind中国科技
阿里巴巴FantasyWorld登顶全球AI模型排行榜
News

阿里巴巴FantasyWorld登顶全球AI模型排行榜

阿里巴巴旗下高德地图发布突破性'FantasyWorld'模型,迅速登上斯坦福大学WorldScore基准测试榜首。这项创新的3D世界建模技术将视频处理与几何精度相结合,为自动驾驶到虚拟导览等应用提供了前所未有的真实感。该模型已集成至高德'飞街景'功能,展现了中国在空间智能技术领域日益增长的领导地位。

January 9, 2026
AI创新空间计算阿里巴巴科技
Kargo获4200万美元融资,AI摄像头正变革仓储行业
News

Kargo获4200万美元融资,AI摄像头正变革仓储行业

旧金山初创公司Kargo近日完成4200万美元B轮融资,用于扩展其AI驱动的仓储视觉系统。其智能摄像头塔正通过自动检测受损货物和追踪货运彻底改造装卸区——用实时数字监控取代人工检查。随着财富500强客户使收入增长两倍,Kargo计划通过新平台'Kargo Intelligence'实现后台物流流程自动化。

December 24, 2025
仓储自动化AI视觉物流科技
DeepMind先驱认为到2028年实现人类水平AI的几率为50%
News

DeepMind先驱认为到2028年实现人类水平AI的几率为50%

DeepMind联合创始人Shane Legg对通用人工智能的大胆预测引发轰动。他认为距离创造出能胜任大多数人类认知任务的AI仅剩两年时间——成功概率如抛硬币般各占一半。接下来发生的事或将永远重新定义我们与技术的关系。

December 15, 2025
人工智能DeepMind通用人工智能
News

DeepMind掌门人揭示AI领域的下一重大飞跃

Google DeepMind首席执行官Demis Hassabis在Axios AI峰会上描绘了AI近未来的激动人心图景。他透露了预计2026年前实现的三大突破性发展:真正'理解'复杂内容的更智能多模态模型、能够独立处理艰巨任务的AI助手,以及可供探索的沉浸式虚拟世界。这些进展或将从根本上改变我们与技术的互动方式。

December 8, 2025
人工智能未来科技DeepMind