跳转到主要内容

NavFoM:全球首个跨实体导航AI模型正式发布

NavFoM:统一机器人导航技术的重大突破

在机器人技术与人工智能领域的重要进展中,银河通用联合北京大学阿德莱德大学浙江大学的研究团队发布了全球首个跨本体全场景全景导航基础模型——NavFoM(Navigation Foundation Model)

Image

多样化导航任务的统一框架

这一创新模型通过将各类机器人导航任务整合至单一框架,实现了范式转变。其涵盖范围包括:

  • 视觉与语言导航
  • 目标导向导航
  • 视觉追踪
  • 自动驾驶应用

银河通用首席研究员陈伟博士解释道:"NavFoM消除了为每个导航任务开发专用模型的需求。我们的方法模拟了人类使用相同认知框架应对不同环境的机制。"

跨环境零样本操作能力

NavFoM最显著的特性是其全场景支持能力。该模型无需预先了解环境或建立地图,即可在室内外场景中运行。这意味着:

  • 新环境无需额外数据采集
  • 可即时部署于未知区域
  • 显著降低实施所需的准备时间和成本

系统通过先进的机器学习技术实现这一特性,使其能够从训练数据泛化到全新场景。

Image

基于自然语言的多任务支持

模型的多任务支持能力通过自然语言指令实现多样化功能,包括:

  • 目标跟随
  • 自主导航
  • 复杂路径规划 这种灵活性使得从机器狗到无人机、自动驾驶车辆等各类机器人平台都能在同一框架下高效运作。

技术创新:TVI Tokens与BATS策略

研究团队引入了两项突破性技术组件:

  1. TVI Tokens(时序-视角索引令牌):使模型能理解对导航任务至关重要的时间序列与方向信息。
  2. BATS策略(预算感知令牌采样):确保在有限计算资源下仍能实现最优性能,提升模型的实用价值。

团队构建了前所未有的训练数据集,包含:

  • 800万条跨任务、跨本体的导航数据
  • 400万组开放式问答对 其训练规模达到该领域先前模型的2倍。

未来应用与发展前景

NavFoM的发布为机器人发展开辟了新可能。北京大学李明教授表示:"开发者现在可以通过迁移学习在此基础模型上构建专业应用,在显著缩短开发周期的同时提升性能。" 潜在应用领域包括:

  • 智慧城市基础设施
  • 搜救行动
  • 工业自动化
  • 个人辅助机器人

研究团队计划今年晚些时候发布NavFoM开源版本,以加速该领域创新进程。

核心亮点:

🌟 首个统一导航模型——将多种机器人任务整合至单一框架 🏞️ 零样本操作能力——无需预先建图即可适应室内外环境 💬 自然语言控制——实现直观的人机交互体验 💡 TVI Tokens & BATS策略——在环境理解与资源管理方面提供技术优势 📊 1200万条数据点构成的前所未有训练集——确保稳健性能表现

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

DeepSeek-V4将于今年二月彻底革新代码生成领域
News

DeepSeek-V4将于今年二月彻底革新代码生成领域

DeepSeek正筹备在农历新年期间推出其强大的新型AI模型DeepSeek-V4。此次更新将在代码生成和处理复杂编程任务方面实现重大突破,有望超越Claude和GPT系列等竞争对手。开发者可以期待这款创新工具提供更有条理的响应和更强的推理能力。

January 12, 2026
AI发展编程工具机器学习
中国研究人员教会AI在图像生成中自我纠错
News

中国研究人员教会AI在图像生成中自我纠错

中国高校取得突破性进展,解决了AI的'视觉读写障碍'——图像系统能理解概念却难以正确呈现的问题。他们的UniCorn框架如同内部质检团队,能在创作过程中捕捉并修正错误。早期测试显示其在空间准确性和细节处理方面有显著提升。

January 12, 2026
AI创新计算机视觉机器学习
波士顿动力Atlas机器人走出演示舞台,进入现代汽车工厂
News

波士顿动力Atlas机器人走出演示舞台,进入现代汽车工厂

波士顿动力标志性的Atlas机器人正脱离研究实验室的起源,走向现代汽车的生产线。这款人形机器现配备谷歌DeepMind的人工智能技术和360度视觉系统,有望在安全地与人类协作的同时改变制造车间。这标志着机器人技术从花哨的原型转向现实世界实用工具的关键时刻。

January 7, 2026
机器人技术工业自动化人工智能
News

波士顿动力与谷歌DeepMind联手为新一代Atlas机器人注入智能

在一项突破性合作中,波士顿动力正与谷歌DeepMind携手,将Gemini Robotics人工智能模型集成到其新一代Atlas人形机器人中。这一合作结合了波士顿动力无与伦比的机器人机动性和谷歌先进的AI推理能力,有望将Atlas从体操高手转变为真正能理解复杂指令、适应新环境的自主助手。

January 6, 2026
机器人技术人工智能科技创新
Falcon H1R7B:小巧AI模型性能超越大型竞争对手
News

Falcon H1R7B:小巧AI模型性能超越大型竞争对手

阿布扎比创新研究院发布了Falcon H1R7B,这款拥有70亿参数的开源语言模型出人意料地强大,正在改写AI性能的规则。通过将创新训练技术与混合架构相结合,这个灵活的竞争者提供的推理能力可与两倍于其大小的模型相媲美。现已在Hugging Face上提供,对于需要高效AI解决方案的开发者来说可能是一个改变游戏规则的产品。

January 6, 2026
AI创新语言模型机器学习
Atlas机器人迎来首个工厂岗位,人工智能部署迈入里程碑
News

Atlas机器人迎来首个工厂岗位,人工智能部署迈入里程碑

波士顿动力公司著名的跳舞机器人已长大成人。全电动Atlas人形机器人正走下生产线,现代汽车和谷歌DeepMind成为首批用户。这些工业级机器人可举起50公斤重物,耐受极端温度,或许很快就能组装您的下一辆汽车。这个曾被认为还需数十年的转折点已然到来。

January 6, 2026
机器人技术人工智能工业自动化