跳转到主要内容

蚂蚁集团灵图Bot-Map实现普通摄像头实时3D建图

蚂蚁集团颠覆性3D建图技术开源

在可能普及空间计算的重大举措中,蚂蚁集团灵波科技将灵图Bot-Map作为开源软件发布。这项创新方案仅使用标准RGB摄像头(多数智能手机配备的常规摄像头)就能实现实时3D重建。

技术原理

关键在于灵图Bot-Map的流式架构。与传统3D建图系统需要处理完整视频序列才能生成结果不同,该模型在视频流输入时持续工作。想象用手机环绕建筑物时,屏幕上实时呈现3D建筑模型——这正是灵图Bot-Map实现的实时交互体验。

Image

惊艳的性能表现

独立测试显示系统具有卓越精度。在极具挑战性的Oxford Spires数据集上,灵图Bot-Map将轨迹误差降至先前实时方法的三分之一。令人惊讶的是,它甚至优于某些可以处理完整数据集的离线处理算法。

  • 速度: 每秒处理约20帧
  • 稳定性: 在数万帧中保持精度
  • 效率: 在标准硬件上运行,无需专用处理器

技术意义

"这不仅是又一次渐进式改进,"一位熟悉该技术的机器人工程师指出,"在保持实时性能的同时消除对昂贵深度传感器的需求,灵图Bot-Map移除了空间计算应用的主要障碍。"

应用场景覆盖多个行业:

  • 机器人: 为服务机器人提供更经济的导航系统
  • 自动驾驶: 无需额外传感器即可增强空间感知
  • AR/VR: 有望实现基于智能手机的真实深度AR体验

更广阔的蓝图

灵图Bot-Map是蚂蚁灵波日益壮大的空间智能技术组合的最新成果。继深度估计和大语言动作模型之后,此次发布强化了他们在具身AI(与物理世界交互的系统)领域的地位。

通过开源该技术,蚂蚁集团似乎更关注加速全行业创新而非保持专有优势。这种做法可能催生更多受益于实时3D理解的实用应用。

核心亮点:

  • 现可通过消费级硬件实现单摄像头3D建图
  • 以20FPS实时处理视频流
  • 在精度基准测试中超越先前方法
  • 开源发布可能激发机器人和AR领域新应用
  • 属于蚂蚁集团空间计算技术的整体布局

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

腾讯突破性视频AI技术现提速11.8倍
News

腾讯突破性视频AI技术现提速11.8倍

腾讯混元团队通过新型DisCa技术攻克了视频生成速度瓶颈。该技术结合神经网络预测器与对抗学习,在保持画质的同时实现了显著加速。这项被CVPR 2026收录的研究或将彻底改变AI视频生成方式。团队还改进了MIT的MeanFlow方法,其实际应用成果已集成至最新HunyuanVideo-1.5模型中。

April 16, 2026
AI视频生成腾讯混元计算机视觉
京东发布颠覆性AI相机,助力下一代机器人技术
News

京东发布颠覆性AI相机,助力下一代机器人技术

中国电商巨头京东凭借其新款JoyEgoCam系统在人工智能领域迈出了重要一步。这款前沿的双摄像头设备能以每秒60帧的速度捕捉超高清视频,专为训练机器人观察和与世界互动而设计。随着京东启动一项雄心勃勃的计划——收集超过1000万小时的真实世界视频数据,这项发布或将彻底改变机器在仓储、物流等领域学习物理任务的方式。

April 16, 2026
AI硬件机器人技术计算机视觉
谷歌新AI突破:让计算机像人类一样观察
News

谷歌新AI突破:让计算机像人类一样观察

谷歌DeepMind发布了TIPSv2,这种开创性方法帮助AI模型以前所未有的细节理解图像——甚至能识别熊猫的单个腿部。与现有系统只能把握整体内容却在细节上出错不同,这项新技术结合了三种巧妙方法,在提高精度的同时降低了计算成本。这一开源方案可能彻底改变从医学影像到自动驾驶汽车的多个领域。

April 16, 2026
计算机视觉AI研究机器学习
News

AI实验室否认代码抄袭指控,开发者争议持续升温

硅谷Nous Research公司因Hermes Agent项目面临中国AI团队EvoMap的剽窃指控。EvoMap称该项目架构与其Evolver引擎存在惊人相似性,引发激烈交锋。这场在社交媒体获得近19万次浏览的争议,凸显了竞争激烈的AI开发领域日益紧张的态势。

April 16, 2026
AI伦理开源技术纠纷
GitHub 新宠 Hermes Agent 挑战 AI 现状
News

GitHub 新宠 Hermes Agent 挑战 AI 现状

AI 领域迎来新星。由 Nous Research 开发的 Hermes Agent 以超过 90,000 星的成绩席卷 GitHub,直接挑战 OpenClaw 的霸主地位。其独特之处在于开创性的自我进化系统,能自动提升技能。开发者们正蜂拥而至,追捧这款承诺以极低成本实现高效自动化的 AI 代理「独狼」。

April 16, 2026
AI 开发GitHub 趋势自动化工具
News

小红书震撼AI界:开源其Relax训练引擎

出人意料的是,生活方式平台小红书开源了其名为Relax的AI训练引擎,该引擎专为多模态场景设计。这一复杂工具通过创新的并行处理技术,能够处理文本、图像、音频和视频。这家非传统AI玩家的意外之举,显示了该公司在人工智能开发上的雄心壮志,以及其希望在科技社区中建立影响力的愿望。

April 15, 2026
AI开源机器学习