跳转到主要内容

腾讯WorldCompass为AI模型提供更精准的方向指引

腾讯WorldCompass将AI导航能力推向新高度

想象一下让虚拟助手"预订中央公园附近的晚餐,然后安排晚上7:30的出租车"——结果它却先订了出租车或选错了餐厅区域。得益于腾讯的最新创新,这种令人沮丧的场景可能很快成为历史。

这家科技巨头的混元3D团队发布了WorldCompass,这是首个专门用于微调世界模型的开源强化学习框架。这些复杂的AI系统模拟环境和交互,但此前一直难以处理复杂的多步骤命令。

Image

解决"迷失在翻译中"的问题

当前的世界模型严重依赖初始训练数据,就像一个人只记住了旅游指南中的短语却不理解语法一样。当面对不熟悉的命令组合时,它们常常忽略细微差别或步骤执行顺序错误。

WorldCompass充当这些模型的适应性导航系统。通过强化学习——AI从试错中学习——它帮助模型更好地解释指令并在多个动作间保持上下文关联。在使用开源WorldPlay模型的基准测试中,复杂场景下的准确率从约20%跃升至55%以上。

"这就像不仅教人词汇,还教他们如何进行连贯的对话,"腾讯研究团队的陈亮博士解释道,"模型会根据现实世界的逻辑学习为什么某些动作要跟随其他动作."

超越准确性:保持视觉一致性

该框架不仅改进了动作排序——还有助于在长时间模拟中保持视觉连贯性。衡量长时间虚拟探索期间视觉保真度的人类偏好评分(HPSv3)显示出显著提升。

这一进步正值虚拟世界在游戏、训练模拟和城市规划数字孪生等领域变得越来越复杂之际。能够通过精确控制可靠地导航这些环境开辟了新的可能性。

开源虚拟交互的未来

腾讯已向全球开发者全面开放WorldCompass,包括代码和技术文档。此举旨在加速开发响应更灵敏的虚拟助手、理解玩家细微命令的游戏NPC以及能真实适应的训练模拟系统。

此次发布标志着行业的重要转变:从单纯构建更大的模型转向改进它们如何解释和执行指令——从蛮力计算转向更复杂的理解能力发展。

关键优势:

  • 精准控制:解决复杂场景下执行不准确的持续挑战
  • 自适应学习:展示强化学习对长期交互改进的强大作用
  • 开发者友好:完整的开源套件降低了创建沉浸式体验的门槛
  • 范式转变:将重点从纯粹的数据扩展转移到更智能的交互优化

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

谢赛宁团队发布Solaris:多用户视频AI领域的重大突破
News

谢赛宁团队发布Solaris:多用户视频AI领域的重大突破

谢赛宁研究团队推出了全球首个多用户视频世界模型Solaris,该模型由昆仑万智的Matrix-Game2.0提供支持。这项创新技术提升了玩家在《我的世界》等环境中的互动体验,表现优于以往解决方案。此次发布恰逢谢赛宁的AI公司AMI获得重大融资里程碑,凸显了世界模型在推动通用人工智能发展中的日益重要性。

March 11, 2026
人工智能机器学习虚拟世界
SkillHub携13,000多款专为中国开发者定制的AI工具震撼登场
News

SkillHub携13,000多款专为中国开发者定制的AI工具震撼登场

SkillHub的发布为中国AI生态系统注入强劲动力,提供超过13,000项优化AI技能。该平台通过本地服务器大幅缩短配置时间,并推出智能CLI工具——小红书自动化与GitHub集成仅需简单指令。最令人兴奋的是?具备自我改进能力的智能体预示着AI的下一次进化飞跃。

March 10, 2026
AI开发中国科技自动化工具
Anthropic推出新AI工具,为'氛围编码'狂欢善后
News

Anthropic推出新AI工具,为'氛围编码'狂欢善后

当AI驱动的'氛围编码'让代码库充斥快速但缺陷的代码时,Anthropic带来了解决方案。其新推出的Code Review工具如同数字取证团队,能发现人工审查可能遗漏的逻辑错误与安全风险。已被Uber和Salesforce采用的这项服务(每次扫描15-25美元),或将成为抵御AI辅助开发意外后果的重要护甲。

March 10, 2026
AI开发代码质量Anthropic
OpenClaw颠覆性更新:支持GPT-5.4并带来更智能的AI代理
News

OpenClaw颠覆性更新:支持GPT-5.4并带来更智能的AI代理

开源AI项目OpenClaw刚刚发布了其迄今为止最大的更新,带来了原生GPT-5.4支持,性能超越Claude Code等竞争对手。2026.3.7版本引入了革命性的'内存热交换'技术,解决了智能代理中长期存在的碎片化问题。从编码到股票分析,此次更新将OpenClaw从开发者的玩具转变为真正永不停止工作的虚拟员工。

March 9, 2026
AI开发OpenClawGPT-5
谷歌Gemini 3.1 Flash-Lite:更快、更智能,但价格更高
News

谷歌Gemini 3.1 Flash-Lite:更快、更智能,但价格更高

Google DeepMind发布Gemini 3.1 Flash-Lite,与前代相比在速度和智能上均有显著提升。该模型每秒可处理超过360个token且响应迅速,尤其在科学推理等复杂任务中表现突出。但这些改进伴随着成本上升——定价近乎翻了三倍,标志着AI市场正转向高性能溢价路线。

March 4, 2026
AI开发Google DeepMind机器学习
OpenAI的GPT-5.4泄露揭示颠覆性记忆能力
News

OpenAI的GPT-5.4泄露揭示颠覆性记忆能力

近期意外泄露的代码显示,OpenAI即将推出的GPT-5.4模型将具备前所未有的记忆能力,包括200万token的上下文窗口和真正的有状态AI功能。泄露细节表明这可能将AI从临时助手转变为持久的数字同事,能够记住跨会话的工作流程。尽管OpenAI迅速试图通过将其重新命名为GPT-5.3-codex来掩盖泄露,但技术分析师认为这揭示了他们针对Claude和Gemini等竞争对手的战略举措。

March 3, 2026
AI开发OpenAIGPT模型