智能手机变身AI之眼:蚂蚁数字科技在低成本机器人训练领域的突破
将日常科技转化为AI超能力
蚂蚁数字科技天矶实验室发布的Always-On Egocentric(AoE)框架可能彻底改变机器人开发的普及门槛——该技术将智能手机转变为用于具身智能系统的精密数据采集设备。
20美元方案替代专业设备
这项突破的精妙之处在于其惊人的简洁性:一个标准智能手机搭配成本不足二十美元的颈挂支架。这套简易装置替代了通常价值数万美元的专业设备,同时保持了毫米级的轨迹精度和超过90%的手部关键点识别准确率。
"我们本质上是在将人类转化为可持续的数据节点",技术团队解释道。颈挂支架将手机自然固定在胸部高度,持续捕捉符合人类交互视角的第一人称画面。
从客厅到实验室:真实场景成效
在与Unitree G1机器人的实地测试中,实际效果得到验证。当仅使用50个传统远程操作数据点训练计算机关机任务时,成功率仅为45%。但引入200个AoE采集数据点后?成功率惊人地跃升至95%。

不仅是廉价摄像头
这项创新超越了简单的视频捕捉功能。蚂蚁数字科技解决了将数小时原始影像转化为可用训练材料的关键难题:
- 轻量级边缘模型识别关键的手-物交互动作
- 大型语言视觉模型将连续视频分割为有意义的行动片段
- 云端系统自动标注并清洗最终数据
这种终端-云协作构建了从采集到课堂可用训练集的无缝管道。
当下意义所在
随着AI日益深入物理空间——从家用机器人到工业自动化——对真实世界交互数据的渴求呈指数级增长。传统采集方法根本无法实现经济规模化。
AoE框架问世之际,蚂蚁数字科技正加码企业级AI解决方案,近期刚成立大模型技术创新部。其业务聚焦金融、安全及具身智能领域——推动尖端研究走出实验室进入实际应用场景。
核心要点:
- 成本革命: 20美元智能手机方案替代万元级专业设备
- 惊人精度: 低成本下仍保持毫米级精确度
- 学习提升: 显著提高机器人任务成功率的实证能力
- 自动化管道: 以最少人工干预将原始视频转为训练数据
- 可扩展方案: 支持数千台设备并发数据采集

