跳转到主要内容

蚂蚁集团LingBot-VLA为机械臂赋予类人精准度

蚂蚁集团为机械臂升级"AI大脑"

在机器人灵巧性领域的重大突破中,蚂蚁集团推出LingBot-VLA人工智能系统,为机械臂带来类人的精确控制能力。这不仅是一次渐进式改进,更可能彻底改变工厂、仓库等需要精细操作机器人的场景。

Image

教会机器人"触觉艺术"

成功秘诀?海量真实世界训练。研究人员采集了约2万小时九种不同双臂机器人的远程操作数据——相当于人类不间断练习两年多。这些并非简单动作,数据集捕捉了复杂任务所需的精妙操作序列。

"想象通过YouTube视频教人跳芭蕾舞",项目首席研究员李伟博士解释道,"这就是我们对机器人做的事——只不过我们教的是双臂如何完美协同,而非舞蹈步伐"。

工作原理:观察·理解·执行

LingBot-VLA融合三大核心能力:

  1. 视觉感知:通过Qwen2.5-VL同时处理多角度摄像头数据
  2. 语言理解:准确解析"将立方体轻放在顶部"等指令
  3. 动作预测:采用条件流匹配实现流畅连续的运动控制

得益于内置空间推理模块,系统甚至能补偿深度传感器缺失数据——相当于赋予机器人无需持续测量就能感知物体距离的先天能力。

Image

超出预期的实际表现

在包含100项挑战任务的基准测试中:

  • 达成17.3%成功率(显著高于竞品)
  • 仅需80次演示即可适配新机型
  • 在插桩、布料折叠等精细操作中表现突出

这对依赖精密自动化的行业意义重大。在当前系统常受困于现实环境不可预测性的情况下,LingBot-VLA展现出非凡的适应能力。

开启机器人研究新纪元

这项可能加速全领域创新的意外举措包括:

  • 完整训练工具包现已开源
  • GPU集群优化(训练速度达替代方案的1.5-2.8倍)
  • 向全球研究者开放完整模型权重

这种先进机器人AI技术的民主化或将大幅降低应用门槛——从辅助生活设施到灾难救援机器人都有望迎来爆发式应用。

核心亮点:

  • 双臂协同:实现单臂无法完成的复杂操控任务
  • 快速适应:通过少量演示数据即可学习新机型
  • 深度感知:即使没有传感器也能保持空间意识
  • 开放生态:公开释放可能推动广泛采用与创新

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

Meta按下暂停键:Llama4 AI模型推迟至五月发布

Meta雄心勃勃的Llama4 AI模型最终未能如期在春季亮相。内部人士透露,由于在完善系统核心能力时遇到技术障碍,发布时间被迫推迟至至少五月。虽然这让翘首以盼的开发者感到失望,但额外的开发时间可能意味着这款开源挑战者在最终与ChatGPT和Gemini等对手竞争时,将具备更出色的性能和安全性。

March 13, 2026
MetaAILlama4
蚂蚁集团AI人才大举招聘:2026校招技术岗位占主导
News

蚂蚁集团AI人才大举招聘:2026校招技术岗位占主导

蚂蚁集团启动2026春季校园招聘,重点聚焦AI人才。技术类岗位占比高达85%,其中超70%直接关联大模型算法、AI安全等人工智能领域。招聘覆盖杭州、旧金山、伦敦等全球多地。这已是蚂蚁连续第六年将技术岗占比维持在80%以上,彰显其发力通用人工智能发展的雄心,同时通过专项计划培养未来科技领军者。

March 10, 2026
AntGroupAI招聘技术人才
ChatGPT现可像Shazam一样识别歌曲——工作原理揭秘
News

ChatGPT现可像Shazam一样识别歌曲——工作原理揭秘

OpenAI与Shazam合作,将音乐识别功能直接整合进ChatGPT。当听到动听旋律时,无需再切换应用——只需询问ChatGPT正在播放的歌曲,即可获得即时结果。该集成允许用户通过简单的语音或文本命令识别歌曲,并提供艺人信息和预览片段。就像聊天框里有个懂音乐的朋友。

March 10, 2026
OpenAIChatGPTShazam
GPT-5.4震撼登场:具备读心AI与百万级token记忆能力
News

GPT-5.4震撼登场:具备读心AI与百万级token记忆能力

OpenAI最新模型GPT-5.4带来了革命性功能,让我们离真正智能的数字助手更近一步。全新的'思维模式'让用户可以窥见AI的推理过程,而百万级token记忆能力使其能够处理海量文档。最令人惊叹的是其原生计算机操作能力——这款AI不仅能对话,还能实际跨应用程序工作。

March 6, 2026
AIOpenAIGPT
AI智能体通过新型训练框架实现实时进化
News

AI智能体通过新型训练框架实现实时进化

蚂蚁集团与清华大学联合发布AReaL v1.0强化学习框架,这项突破性技术让AI智能体在实际使用中持续自我提升。与传统需要大量编码的系统不同,该创新方案能让现有智能体无缝连接——想象你的数字助手每次使用时都在变得更聪明。系统的秘密武器?一个AI驱动的开发助手在创纪录时间内帮助构建了其复杂架构。

March 4, 2026
AI机器学习科技创新
StepZen开源AI模型挑战行业巨头
News

StepZen开源AI模型挑战行业巨头

StepZenith已将其Step3.5Flash AI模型完全开源,该模型采用庞大的1960亿参数MoE架构。这款高能效模型在使用时仅激活110亿参数,在编码任务中实现了惊人的350 TPS速度。其使用量仅次于OpenClaw位居第二,凭借速度和稳定性迅速成为开源社区的新宠。

March 4, 2026
AIOpenSourceMachineLearning