腾讯新型机器人脑在关键测试中超越竞争对手
腾讯机器人突破:当AI具备物理交互能力
科技巨头腾讯刚刚为机器人完成了一次重大脑力升级。其新型HY-Embodied-0.5模型不是理论性的AI实验——而是专门为帮助机器理解并驾驭混乱不可预测的现实世界而构建。
为何重要 当前大多数AI擅长数字任务,却在物理环境中表现不佳。是否见过机器人笨拙地试图拿起玻璃杯而不洒水?这正是腾讯团队致力解决的痛点。"现有模型看待世界就像2D照片",首席研究员张伟博士解释,"我们赋予它们真正的3D理解能力和从物理交互中学习的能力"。
技术优势
该系统的独特之处在于其双重架构设计:
- MoT-2B(40亿参数):专为实时响应优化的"快速思考者"
- MoE-32B(4070亿参数):处理复杂推理任务的重量级模块
工程师们没有改造现有AI,而是从零重建整个系统。其秘诀?采用超过1亿个现实交互场景的新型训练方法——从堆叠箱子到处理精细物件无所不包。
令人印象深刻的性能 在对比测试中,小型MoT-2B模型在22个类别中的16项超越Qwen3-VL-4B等竞争对手。旗舰版本则与谷歌Gemini 3.0 Pro整体能力不相上下。实际演示显示,机器人完成仓储类任务的错误率比现有系统低30%。
未来展望
初期应用聚焦工业场景,但影响范围更广。"这不仅是打造更好的工厂机器人",机器人分析师Lisa Chen指出,"同样的空间智能可驱动从真正能整理房间的家用助手到灾难现场搜救机器人的一切应用"。
腾讯计划在持续开发的同时对外授权该技术。正在测试的下一版本目标是将响应时间再缩短40%。
关键要点:
- 首个专为物理世界交互设计的AI模型
- 在72%的基准测试中超越竞争对手
- 双重专用架构处理不同类型任务
- 训练采用海量现实交互数据集
- 可能推动服务和工业机器人领域重大进步




