跳转到主要内容

腾讯新AI模型赋予机器人类人空间智能

腾讯机器人突破性进展连接AI与物理世界

想象一个不仅能看见物体,还能像人类仓库工人一样理解如何抓取、堆叠和操作它们的机器人。这正是腾讯新发布的HY-Embodied-0.5模型所承诺的,该模型由其机器人X实验室与幻方AI团队合作开发。

为何重要 传统AI视觉系统难以应对现实世界的物理规律。它们或许能识别箱子,但无法计算如何抓取而不压坏内容物。HY-Embodied-0.5通过赋予机器研究者所称的"具身智能"改变了这一现状——这种空间感知能力将视觉与物理行动联系起来。

"我们不仅是在调整现有模型,"一位熟悉该项目的腾讯工程师解释道,"这需要从根本上重新思考AI如何处理3D空间和物理交互。"

技术创新

该系统有两个版本:

  • MoT-2B:精简的40亿参数模型,专为实时响应优化(适用于仓储机器人)
  • MoE-32B:强大的4070亿参数版本,用于复杂推理任务

它们的独特之处在于混合Transformer架构和专有的HY-ViT2.0视觉编码器——这些技术可防止AI在训练过程中"遗忘"关键的物理关系。团队向系统输入了超过1亿个现实世界交互示例,然后借鉴人类学习心理学技术来精炼其理解。

令人瞩目的表现 在与Qwen3-VL-4B和RoboBrain2.5等系统的对比测试中,腾讯的创造独占鳌头。它在感知、推理和规划任务的22项标准基准测试中,拿下了16项。更令人印象深刻的是,旗舰模型在整体能力上比肩谷歌的Gemini3.0Pro——对于第一代具身AI来说,这是惊人的成就。

现实影响

在使用HY-Embodied-0.5的机器人现场演示中:

  • 堆叠不规则形状包裹的速度比现有模型快30%
  • 动态调整抓取力度以适应易碎物品
  • 从意外碰撞和干扰中优雅恢复

"这不仅关乎超越基准测试,"一位未参与该项目的机器人研究者指出,"腾讯破解了让AI理解物理世界具有重量、摩擦力和后果的密码。这将改变从制造业到老年护理机器人的一切。"

关键要点

  • 物理智能:HY-Embodied-0.5赋予AI超越平面图像识别的真实3D空间理解
  • 双版本:紧凑型MoT-2B适用于响应式应用,巨型MoE-32B用于复杂推理
  • 称霸基准测试:在16/22测试中超越对手,媲美谷歌顶级Gemini系统
  • 实际应用:已在物流领域展现潜力,并有望应用于医疗保健、建筑和家庭辅助
  • 训练突破:采用新技术防止AI学习过程中对物理关系的"灾难性遗忘"

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Claude 全新顾问工具:以智能AI助力,无需高昂成本
News

Claude 全新顾问工具:以智能AI助力,无需高昂成本

Anthropic为其Claude AI平台推出了一项巧妙的新功能,将高效与智能完美结合。这款顾问工具让更快速、更经济的模型处理日常任务,同时在遇到复杂决策时自动咨询更强大的Claude Opus。想象一下拥有一位敏捷的初级助手,能在需要时谨慎地寻求资深专家的帮助。早期测试显示,该工具在显著提升性能的同时意外节省了成本——某些情况下甚至以低廉的代价实现了双倍能力。

April 10, 2026
AI创新Claude AI成本优化
深度求索V4下月登场:万亿参数巨擘,为中国AI未来而生
News

深度求索V4下月登场:万亿参数巨擘,为中国AI未来而生

中国人工智能领域即将迎来重大升级。深度求索创始人梁文峰确认,其下一代V4模型将于2026年4月下旬发布,具备万亿级参数规模,并与华为昇腾等国产芯片实现突破性兼容。这不仅是一次模型迭代,更是撼动中国计算市场的战略行动——科技巨头已开始囤积AI芯片。目前测试中的'快速'与'专家'双模式,从即时搜索到复杂问题求解,展现了该模型的多维能力。

April 10, 2026
AI创新中国科技深度求索
AI实体化:预计到2035年智能设备将达1.45亿台
News

AI实体化:预计到2035年智能设备将达1.45亿台

实体AI革命势头正劲,无人机、机器人和自动驾驶汽车引领潮流。市场分析师预测,未来十年这些智能设备的全球出货量将达到1.45亿台。人形机器人呈现爆炸性增长,无人机在各行业的快速应用持续扩大。这不仅关乎技术——这些设备将从根本上改变我们的日常生活和工作环境。

April 10, 2026
AI硬件机器人技术新兴科技
小米AI飞跃:MiMo-V2加入顶尖开源框架并提供免费试用
News

小米AI飞跃:MiMo-V2加入顶尖开源框架并提供免费试用

小米在AI领域迈出重要一步,将其MiMo-V2系列整合至领先的AI开源开发平台Hermes Agent框架。这家科技巨头为开发者提供为期两周的免费试用,可探索三种专用模型——从高性能计算到闪电般快速处理。这一战略合作可能重塑AI助手的学习与进化方式,使其有望在每次交互中变得更智能。

April 10, 2026
小米AIHermes AgentAI开发
阿里巴巴微型AI模型凭借智能升级回收技术大放异彩
News

阿里巴巴微型AI模型凭借智能升级回收技术大放异彩

阿里巴巴研究团队取得了一项令人瞩目的成就——将参数规模仅为6亿的AI模型提升为能在标准CPU上高效运行的173亿参数系统。其秘诀在于创新的'升级回收'技术,运行时仅激活5%的参数。这一突破性进展使得复杂AI变得前所未有的触手可及,无需昂贵硬件即可实现每秒30个token的处理速度。这不仅是规模的胜利——精妙的训练方法让这个小模型表现超越许多大型竞争对手。

April 10, 2026
AI效率机器学习MoE架构
字节跳动Seeduplex让AI实现人类般听说同步
News

字节跳动Seeduplex让AI实现人类般听说同步

字节跳动推出突破性语音AI系统Seeduplex,实现语音同步处理而非轮流应答。这项全双工技术现已登陆抖音,将打断率降低40%,即使在嘈杂环境中也能准确理解用户。就像与一个永远不会错过节奏的人交谈。

April 9, 2026
语音AI字节跳动AI创新