跳转到主要内容

美团新AI模型以智能参数技巧展现强劲实力

美团重新定义高效AI模型的规则

Image

在AI领域,更大并不总是意味着更好。当大多数团队还在不断堆叠模型中的'专家'时,美团的LongCat团队另辟蹊径。他们最新发布的LongCat-Flash-Lite证明:智能化的参数运用可以胜过暴力缩放。

嵌入层的突破

传统MoE(专家混合)架构随着规模扩大会遭遇收益递减。但美团的方案独树一帜:通过战略性强化嵌入层而非单纯增加专家数量,他们打造的模型每个任务仅激活29至45亿参数——尽管总参数量高达685亿

秘诀何在?采用N-gram嵌入系统精准捕捉局部模式。需要理解编程指令或技术术语?该模型识别这些模式就像资深程序员熟悉语法一样游刃有余。

Image

幕后工程魔法

将理论优势转化为实际速度依赖三项精妙优化:

  • 智能参数分配: 近半数模型容量集中于嵌入层,采用高效的O(1)查询替代昂贵计算
  • 定制硬件技巧: 团队开发了专用缓存(可视为超级N-gram内存)并融合关键操作以削减处理延迟
  • 预测协同: 通过将推测解码与独特架构结合,在处理超大256K上下文窗口时仍能达到每秒500-700token的惊人速度

令人瞩目的性能表现

数据说明一切:

  • 编码能力: SWE-Bench得分54.4%,终端命令测试表现优异(TerminalBench得分33.75)
  • 智能体优势: 在电信、零售和航空场景的专业基准测试中拔得头筹
  • 通用智能: MMLU测试与Gemini2.5Flash-Lite持平(85.52分),同时在高阶数学领域毫不逊色

最精彩的部分?美团公开了所有资源——模型权重、技术深度解析甚至定制推理引擎(SGLang-FluentLLM)。开发者可通过LongCat API平台每日获取5000万免费token来体验这一创新方案。

核心要点:

  • 突破传统MoE扩展模式,通过优化嵌入层而非单纯增加专家数量
  • 每个任务仅激活45亿参数即可实现大模型性能
  • 专用缓存与内核融合带来超凡速度(500+token/秒)
  • 开源版本包含权重、技术报告和推理引擎

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

AI实验室Fundamental获2.55亿美元融资,推出颠覆性数据模型Nexus

AI研究实验室Fundamental结束隐匿模式,以12亿美元估值完成2.55亿美元A轮融资。其秘密武器是革命性的'大型表格模型'Nexus——它能处理传统AI难以应对的结构化数据。这家初创企业已获得多家财富100强客户并与AWS达成合作,旨在重塑企业数据分析领域。

February 6, 2026
AI初创企业企业技术机器学习
News

苹果的制胜秘诀:专家反馈如何助力小模型超越GPT-5

苹果最新研究表明,针对性的专家反馈能帮助小型AI模型在特定任务上超越GPT-5等巨头。通过与21位设计专家密切合作——他们提供了详细的设计草图与代码修改方案——苹果团队打造的模型在用户界面设计上超越了更大的竞争对手。该研究还揭示了关于主观审美判断的惊人发现。

February 6, 2026
AI研究UI设计机器学习
News

中国推出由3万张加速卡组成的巨型AI超级计算集群

中国在郑州国家超算互联网枢纽启用了首个3万张加速卡的超级计算集群,标志着人工智能计算能力的巨大飞跃。这个由申威团队创纪录快速开发的大型计算资源池支持万亿参数模型,有望推动各科学领域的革命性突破。该系统采用开放架构设计,在提供前所未有的可扩展性同时,还具有惊人的易用性。

February 6, 2026
AI基础设施高性能计算中国科技
News

初创公司大胆宣称:新型AI芯片性能或超NVIDIA五倍

可能撼动AI硬件市场的举措中,初创公司Positron公布了其Asimov芯片架构,承诺带来显著的能效提升。该公司宣称其专有设计在每瓦性能上比NVIDIA即将推出的Rubin平台高出五倍,瞄准了大型语言模型推理的蓬勃需求。尽管纸面数据令人印象深刻,行业观察人士质疑在没有成熟开发者工具的情况下,Positron能否挑战NVIDIA的霸主地位。

February 5, 2026
AI芯片半导体机器学习
Mistral AI全新语音模型实现近乎即时中文转录
News

Mistral AI全新语音模型实现近乎即时中文转录

法国AI初创公司Mistral AI发布了具备突破性实时转录能力的Voxtral Transcribe 2系列。其新型号将处理延迟缩短至0.2秒以内,并支持包括中文在内的多种语言,以极具竞争力的价格为开发者提供强大的语音应用工具。

February 5, 2026
语音识别AI创新实时技术
智谱AI的GLM-4.7-Flash模型两周内下载量突破百万
News

智谱AI的GLM-4.7-Flash模型两周内下载量突破百万

智谱AI推出的轻量级模型GLM-4.7-Flash在开源社区引发轰动,发布仅14天便在Hugging Face平台实现超百万次下载。这款混合思维模型在基准测试中表现优于竞品,为开发者提供了高效且经济实惠的AI应用解决方案。其快速采用标志着市场对智谱AI平衡性能与实际部署需求策略的高度认可。

February 4, 2026
AI发展开源机器学习