跳转到主要内容

腾讯新AI模型赋予机器人类人空间感知能力

腾讯突破性进展让机器人更接近人类理解能力

在机器人技术的重大飞跃中,腾讯研究团队开发出一个AI模型,终于让机器获得了我们习以为常的能力——对物理空间的直觉理解。他们的新HY-Embodied-0.5系统不仅仅是一次算法更新,更是对人工智能如何与三维世界互动的基础性重新思考。

为何重要

当今大多数AI视觉系统就像游客阅读外国城市地图——他们能识别地标但难以理解深度和空间关系。腾讯的解决方案更像本地居民,本能地知道物体在空间中的关系以及如何操控它们。这种能力差距长期阻碍了AI从屏幕走向实际机器人应用。

"典型的视觉语言模型擅长识别照片中的物体,"腾讯研究员解释道,"但让它们引导机器人手臂拾取并整理这些物体时,它们就会力不从心。我们的新架构改变了这一局面。"

技术原理

团队不仅调整了现有模型——他们还从零开始构建了两个专用版本:

  • MoT-2B:精简高效模型(总共40亿参数),专为边缘设备实时响应设计
  • MoE-32B:强大变体(4070亿参数),为复杂任务提供卓越推理能力

关键创新包括新颖的混合Transformer架构,可防止多模态训练中常见的"灾难性遗忘"问题,以及先进的视觉编码技术,保持对物理交互至关重要的精细细节。

卓越性能

独立测试显示出显著成果:

  • 在22项基准测试中,有16项超越同类规模模型
  • 匹配或超越Gemini3.0Pro等行业领导者的能力
  • 在实际机器人控制场景中展现出优越性能

在仓库模拟中,使用HY-Embodied-0.5的机器人在堆叠不规则物体时比标准系统错误减少30%。其影响远不止实验室环境——想象一下能够真正整理厨房的家庭助手,或适应不可预测物品摆放的制造机器人。

未来展望

虽然仍处于早期阶段(0.5版本号暗示还有更多改进),这项技术代表着迈向真正具身AI的关键一步。随着腾讯不断完善系统,我们可能很快会看到不仅能"看见"世界,还能以接近人类流畅性的方式理解和互动世界的机器人。

关键要点

  • 专用架构克服通用视觉模型的局限
  • 两种配置平衡不同应用的速度与性能
  • 实际表现超越当前基准
  • 应用场景从物流到家用机器人
  • 未来版本有望进一步缩小与人类空间推理的差距

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Claude 全新顾问工具:以智能AI助力,无需高昂成本
News

Claude 全新顾问工具:以智能AI助力,无需高昂成本

Anthropic为其Claude AI平台推出了一项巧妙的新功能,将高效与智能完美结合。这款顾问工具让更快速、更经济的模型处理日常任务,同时在遇到复杂决策时自动咨询更强大的Claude Opus。想象一下拥有一位敏捷的初级助手,能在需要时谨慎地寻求资深专家的帮助。早期测试显示,该工具在显著提升性能的同时意外节省了成本——某些情况下甚至以低廉的代价实现了双倍能力。

April 10, 2026
AI创新Claude AI成本优化
深度求索V4下月登场:万亿参数巨擘,为中国AI未来而生
News

深度求索V4下月登场:万亿参数巨擘,为中国AI未来而生

中国人工智能领域即将迎来重大升级。深度求索创始人梁文峰确认,其下一代V4模型将于2026年4月下旬发布,具备万亿级参数规模,并与华为昇腾等国产芯片实现突破性兼容。这不仅是一次模型迭代,更是撼动中国计算市场的战略行动——科技巨头已开始囤积AI芯片。目前测试中的'快速'与'专家'双模式,从即时搜索到复杂问题求解,展现了该模型的多维能力。

April 10, 2026
AI创新中国科技深度求索
AI实体化:到2035年智能设备出货量将达1.45亿台
News

AI实体化:到2035年智能设备出货量将达1.45亿台

未来十年,人工智能将大规模从屏幕跃入物理世界。据Counterpoint Research数据显示,无人机、机器人和自动驾驶车辆将主导出货量,其中人形机器人呈现爆发式增长。这些不仅是数字——它们代表着即将递送包裹、巡逻仓库甚至为你冲泡咖啡的现实机器。

April 10, 2026
AI硬件机器人技术新兴科技
小米AI模型加入领先开源框架,提供免费试用
News

小米AI模型加入领先开源框架,提供免费试用

小米已将其MiMo-V2 AI模型系列集成至Hermes Agent框架,为开发者提供14天免费试用。此举将小米硬件优化的模型与Hermes著名的自我进化能力相结合,或将重塑AI代理学习和执行任务的方式。目前通过Nous Portal可获取三款专用模型,为开发者提供从复杂工作流到轻量级应用的全套工具。

April 10, 2026
人工智能小米AI开发
News

蚂蚁集团在AI检测挑战赛中双项夺冠,展现卓越实力

蚂蚁集团在备受瞩目的CVPR 2026 NTIRE图像检测挑战赛上包揽双赛道冠军,引发AI安全领域震动。其突破性检测技术通过创新的双流分析与真实场景测试相结合,有效应对日益复杂的AI生成深度伪造威胁。此次胜利标志着在保护数字支付和身份验证系统免受日益逼真的合成媒体侵害方面迈出重要一步。

April 10, 2026
AI安全计算机视觉深度伪造检测
阿里巴巴微型AI模型凭借智能升级回收技术大放异彩
News

阿里巴巴微型AI模型凭借智能升级回收技术大放异彩

阿里巴巴研究团队取得了一项令人瞩目的成就——将参数规模仅为6亿的AI模型提升为能在标准CPU上高效运行的173亿参数系统。其秘诀在于创新的'升级回收'技术,运行时仅激活5%的参数。这一突破性进展使得复杂AI变得前所未有的触手可及,无需昂贵硬件即可实现每秒30个token的处理速度。这不仅是规模的胜利——精妙的训练方法让这个小模型表现超越许多大型竞争对手。

April 10, 2026
AI效率机器学习MoE架构