美团新AI模型以智能参数技巧展现强劲实力欢迎来到AI DAMN！发现最震撼的最新AI新闻、最酷的AI产品和最前沿的AI项目。从ChatGPT到最新模型，我们精选让你惊呼'太牛了！'的AI发展动态。涵盖机器学习、深度学习等前沿技术，每日更新最精彩的人工智能世界。

发现

语言

账户

美团新AI模型以智能参数技巧展现强劲实力

美团重新定义高效AI模型的规则

在AI领域，更大并不总是意味着更好。当大多数团队还在不断堆叠模型中的'专家'时，美团的LongCat团队另辟蹊径。他们最新发布的LongCat-Flash-Lite证明：智能化的参数运用可以胜过暴力缩放。

嵌入层的突破

传统MoE（专家混合）架构随着规模扩大会遭遇收益递减。但美团的方案独树一帜：通过战略性强化嵌入层而非单纯增加专家数量，他们打造的模型每个任务仅激活29至45亿参数——尽管总参数量高达685亿。

秘诀何在？采用N-gram嵌入系统精准捕捉局部模式。需要理解编程指令或技术术语？该模型识别这些模式就像资深程序员熟悉语法一样游刃有余。

幕后工程魔法

将理论优势转化为实际速度依赖三项精妙优化：

智能参数分配: 近半数模型容量集中于嵌入层，采用高效的O(1)查询替代昂贵计算
定制硬件技巧: 团队开发了专用缓存（可视为超级N-gram内存）并融合关键操作以削减处理延迟
预测协同: 通过将推测解码与独特架构结合，在处理超大256K上下文窗口时仍能达到每秒500-700token的惊人速度

令人瞩目的性能表现

数据说明一切：

编码能力: SWE-Bench得分54.4%，终端命令测试表现优异（TerminalBench得分33.75）
智能体优势: 在电信、零售和航空场景的专业基准测试中拔得头筹
通用智能: MMLU测试与Gemini2.5Flash-Lite持平（85.52分），同时在高阶数学领域毫不逊色

最精彩的部分？美团公开了所有资源——模型权重、技术深度解析甚至定制推理引擎(SGLang-FluentLLM)。开发者可通过LongCat API平台每日获取5000万免费token来体验这一创新方案。

核心要点：

突破传统MoE扩展模式，通过优化嵌入层而非单纯增加专家数量
每个任务仅激活45亿参数即可实现大模型性能
专用缓存与内核融合带来超凡速度（500+token/秒）
开源版本包含权重、技术报告和推理引擎

喜欢这篇文章？

订阅我们的 Newsletter，获取最新 AI 资讯、产品评测和项目推荐，每周精选直达邮箱。

每周精选完全免费随时退订

News

AI实验室Fundamental获2.55亿美元融资，推出颠覆性数据模型Nexus

AI研究实验室Fundamental结束隐匿模式，以12亿美元估值完成2.55亿美元A轮融资。其秘密武器是革命性的'大型表格模型'Nexus——它能处理传统AI难以应对的结构化数据。这家初创企业已获得多家财富100强客户并与AWS达成合作，旨在重塑企业数据分析领域。

February 6, 2026

AI初创企业企业技术机器学习

News

苹果的制胜秘诀：专家反馈如何助力小模型超越GPT-5

苹果最新研究表明，针对性的专家反馈能帮助小型AI模型在特定任务上超越GPT-5等巨头。通过与21位设计专家密切合作——他们提供了详细的设计草图与代码修改方案——苹果团队打造的模型在用户界面设计上超越了更大的竞争对手。该研究还揭示了关于主观审美判断的惊人发现。

February 6, 2026

AI研究UI设计机器学习

News

中国推出由3万张加速卡组成的巨型AI超级计算集群

中国在郑州国家超算互联网枢纽启用了首个3万张加速卡的超级计算集群，标志着人工智能计算能力的巨大飞跃。这个由申威团队创纪录快速开发的大型计算资源池支持万亿参数模型，有望推动各科学领域的革命性突破。该系统采用开放架构设计，在提供前所未有的可扩展性同时，还具有惊人的易用性。

February 6, 2026

AI基础设施高性能计算中国科技

News

初创公司大胆宣称：新型AI芯片性能或超NVIDIA五倍

可能撼动AI硬件市场的举措中，初创公司Positron公布了其Asimov芯片架构，承诺带来显著的能效提升。该公司宣称其专有设计在每瓦性能上比NVIDIA即将推出的Rubin平台高出五倍，瞄准了大型语言模型推理的蓬勃需求。尽管纸面数据令人印象深刻，行业观察人士质疑在没有成熟开发者工具的情况下，Positron能否挑战NVIDIA的霸主地位。

February 5, 2026

AI芯片半导体机器学习