蚂蚁集团灵图Bot-Map实现普通摄像头实时3D建图
蚂蚁集团颠覆性3D建图技术开源
在可能普及空间计算的重大举措中,蚂蚁集团灵波科技将灵图Bot-Map作为开源软件发布。这项创新方案仅使用标准RGB摄像头(多数智能手机配备的常规摄像头)就能实现实时3D重建。
技术原理
关键在于灵图Bot-Map的流式架构。与传统3D建图系统需要处理完整视频序列才能生成结果不同,该模型在视频流输入时持续工作。想象用手机环绕建筑物时,屏幕上实时呈现3D建筑模型——这正是灵图Bot-Map实现的实时交互体验。

惊艳的性能表现
独立测试显示系统具有卓越精度。在极具挑战性的Oxford Spires数据集上,灵图Bot-Map将轨迹误差降至先前实时方法的三分之一。令人惊讶的是,它甚至优于某些可以处理完整数据集的离线处理算法。
- 速度: 每秒处理约20帧
- 稳定性: 在数万帧中保持精度
- 效率: 在标准硬件上运行,无需专用处理器
技术意义
"这不仅是又一次渐进式改进,"一位熟悉该技术的机器人工程师指出,"在保持实时性能的同时消除对昂贵深度传感器的需求,灵图Bot-Map移除了空间计算应用的主要障碍。"
应用场景覆盖多个行业:
- 机器人: 为服务机器人提供更经济的导航系统
- 自动驾驶: 无需额外传感器即可增强空间感知
- AR/VR: 有望实现基于智能手机的真实深度AR体验
更广阔的蓝图
灵图Bot-Map是蚂蚁灵波日益壮大的空间智能技术组合的最新成果。继深度估计和大语言动作模型之后,此次发布强化了他们在具身AI(与物理世界交互的系统)领域的地位。
通过开源该技术,蚂蚁集团似乎更关注加速全行业创新而非保持专有优势。这种做法可能催生更多受益于实时3D理解的实用应用。
核心亮点:
- 现可通过消费级硬件实现单摄像头3D建图
- 以20FPS实时处理视频流
- 在精度基准测试中超越先前方法
- 开源发布可能激发机器人和AR领域新应用
- 属于蚂蚁集团空间计算技术的整体布局



