跳转到主要内容

NavFoM:全球首个跨实体导航AI模型正式发布

NavFoM:统一机器人导航技术的重大突破

在机器人技术与人工智能领域的重要进展中,银河通用联合北京大学阿德莱德大学浙江大学的研究团队发布了全球首个跨本体全场景全景导航基础模型——NavFoM(Navigation Foundation Model)

Image

多样化导航任务的统一框架

这一创新模型通过将各类机器人导航任务整合至单一框架,实现了范式转变。其涵盖范围包括:

  • 视觉与语言导航
  • 目标导向导航
  • 视觉追踪
  • 自动驾驶应用

银河通用首席研究员陈伟博士解释道:"NavFoM消除了为每个导航任务开发专用模型的需求。我们的方法模拟了人类使用相同认知框架应对不同环境的机制。"

跨环境零样本操作能力

NavFoM最显著的特性是其全场景支持能力。该模型无需预先了解环境或建立地图,即可在室内外场景中运行。这意味着:

  • 新环境无需额外数据采集
  • 可即时部署于未知区域
  • 显著降低实施所需的准备时间和成本

系统通过先进的机器学习技术实现这一特性,使其能够从训练数据泛化到全新场景。

Image

基于自然语言的多任务支持

模型的多任务支持能力通过自然语言指令实现多样化功能,包括:

  • 目标跟随
  • 自主导航
  • 复杂路径规划 这种灵活性使得从机器狗到无人机、自动驾驶车辆等各类机器人平台都能在同一框架下高效运作。

技术创新:TVI Tokens与BATS策略

研究团队引入了两项突破性技术组件:

  1. TVI Tokens(时序-视角索引令牌):使模型能理解对导航任务至关重要的时间序列与方向信息。
  2. BATS策略(预算感知令牌采样):确保在有限计算资源下仍能实现最优性能,提升模型的实用价值。

团队构建了前所未有的训练数据集,包含:

  • 800万条跨任务、跨本体的导航数据
  • 400万组开放式问答对 其训练规模达到该领域先前模型的2倍。

未来应用与发展前景

NavFoM的发布为机器人发展开辟了新可能。北京大学李明教授表示:"开发者现在可以通过迁移学习在此基础模型上构建专业应用,在显著缩短开发周期的同时提升性能。" 潜在应用领域包括:

  • 智慧城市基础设施
  • 搜救行动
  • 工业自动化
  • 个人辅助机器人

研究团队计划今年晚些时候发布NavFoM开源版本,以加速该领域创新进程。

核心亮点:

🌟 首个统一导航模型——将多种机器人任务整合至单一框架 🏞️ 零样本操作能力——无需预先建图即可适应室内外环境 💬 自然语言控制——实现直观的人机交互体验 💡 TVI Tokens & BATS策略——在环境理解与资源管理方面提供技术优势 📊 1200万条数据点构成的前所未有训练集——确保稳健性能表现

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

OpenClaw颠覆性更新:支持GPT-5.4与记忆魔法
News

OpenClaw颠覆性更新:支持GPT-5.4与记忆魔法

OpenClaw的最新更新正在AI界引发轰动。这个开源项目现已无缝集成GPT-5.4,在基准测试中超越竞争对手。但真正的亮点是什么?一项革命性的'记忆热切换'功能,解决了长期存在的上下文窗口问题。从编程到股票分析,这个'虚拟员工'正在各行业证明其价值,使人机协作比以往更加顺畅。

March 9, 2026
AI开发OpenClawGPT-5
News

马斯克豪赌特斯拉将率先突破人形AI技术

埃隆·马斯克重申了他对特斯拉引领人形通用人工智能(AGI)发展的愿景。这位科技亿万富翁暗示,特斯拉在Optimus机器人上的工作可能使其成为首家成功将AGI实体化的公司。随着马斯克旗下公司展现出越来越多的技术整合迹象,特斯拉机器人、xAI的Grok项目与SpaceX的太空雄心之间可能产生协同效应。

March 9, 2026
人工智能特斯拉机器人技术
News

阿里巴巴微型AI模型挑战GPT-4o——并取得胜利

令人惊讶的是,阿里巴巴仅含40亿参数的紧凑型Qwen 3.5模型在独立测试中超越了OpenAI庞大的GPT-4o。这一突破挑战了行业对超大模型的执着追求,证明更智能的架构可以战胜单纯规模。该成就为在日常设备本地运行强大AI开启了新可能。

March 9, 2026
AI创新机器学习中国科技
Unitree开源突破让人形机器人动作流畅自如
News

Unitree开源突破让人形机器人动作流畅自如

宇树科技发布了创新性开源架构OmniXtreme,解决了人形机器人运动控制的关键难题。其两阶段训练系统将基于流的预训练与现实世界电机感知相结合,在后空翻等复杂动作上实现了96%的成功率。这一突破或将加速整个机器人行业的发展。

March 5, 2026
机器人技术运动控制开源科技
谷歌Gemini 3.1 Flash-Lite:更快、更智能,但价格更高
News

谷歌Gemini 3.1 Flash-Lite:更快、更智能,但价格更高

Google DeepMind发布Gemini 3.1 Flash-Lite,与前代相比在速度和智能上均有显著提升。该模型每秒可处理超过360个token且响应迅速,尤其在科学推理等复杂任务中表现突出。但这些改进伴随着成本上升——定价近乎翻了三倍,标志着AI市场正转向高性能溢价路线。

March 4, 2026
AI开发Google DeepMind机器学习
AI智能体通过新型训练框架实现实时进化
News

AI智能体通过新型训练框架实现实时进化

蚂蚁集团与清华大学联合发布AReaL v1.0强化学习框架,这项突破性技术让AI智能体在实际使用中持续自我提升。与传统需要大量编码的系统不同,该创新方案能让现有智能体无缝连接——想象你的数字助手每次使用时都在变得更聪明。系统的秘密武器?一个AI驱动的开发助手在创纪录时间内帮助构建了其复杂架构。

March 4, 2026
AI机器学习科技创新