腾讯发布新型AI模型,赋予机器人人类般的视觉与思维能力
腾讯机器人技术突破:当AI遇见物理世界
在机器人技术的重大飞跃中,腾讯研究团队开发了HY-Embodied-0.5——这个人工智能系统可能最终弥合数字智能与物理敏捷性之间的鸿沟。
为何重要 传统AI视觉系统虽然擅长图像识别,却难以应对我们生活的三维世界的细微差别。它们或许能识别照片中的咖啡杯,但无法理解如何拿起它而不洒出。腾讯的新方法改变了这一根本局限。
"我们不只是教AI看东西,"腾讯机器人X实验室的李伟博士解释道,"而是让它像人类那样理解空间——包括深度、纹理和物理后果。"
双脑胜单脑
团队推出了两个专用模型:
- MoT-2B:紧凑高效的系统,专为实时响应设计(适合工厂机器人)
- MoE-32B:处理复杂推理任务的强力模型
它们的独特之处?传统AI训练常导致"灾难性遗忘"——学习新技能会抹去旧知识。腾讯的混合Transformer架构规避了这个缺陷,实现持续学习且性能不降。
实际成果 在仓库模拟测试中,搭载HY-Embodied-0.5的机器人表现出:
- 装箱速度比现有系统快40%
- 精细堆叠操作错误率更低
- 对意外碰撞或滑动的恢复能力更强
"这些机器人不再只是执行预设动作,"机器人工程师Sarah Chen指出,"它们能即时调整,就像人类工人遇到包裹意外移位时的反应。"
未来之路
尽管技术前景广阔,挑战依然存在。实现系统的大规模生产,并确保在不可预测环境中的安全性将是下一道难关。但随着这些模型在基准测试中已能比肩谷歌Gemini等巨头,打造真正实用的服务型机器人之争变得更有看头。
关键要点
- 腾讯新AI模型为机器人认知添加3D空间意识
- 两个专用版本分别针对速度与复杂推理需求
- 在22项评估类别中全面超越竞争对手
- 在装箱和堆叠任务中展现实际改进
- 标志着从虚拟AI向实体化智能的转变

