跳转到主要内容

美团新AI模型以智能参数技巧展现强劲实力

重新思考AI模型的成长方式

大多数AI模型试图通过增加更多“专家”——处理不同任务的专用子模型——来变得更聪明。但美团LongCat团队发现这种方法很快会遇到收益递减的问题。他们的解决方案?一种他们称之为“嵌入扩展”的巧妙变通方法,让每个参数都能发挥更大作用。

Image

魔法背后的数字

乍看之下,LongCat-Flash-Lite似乎非常庞大——总计685亿个参数。但有趣的是:在实际使用时,每次仅激活29亿到45亿个参数。这就像拥有一辆跑车,它只根据每段道路的需要使用相应的马力。

秘诀是什么?超过300亿个参数专门用于N-gram嵌入层,该层在捕捉上下文线索方面表现异常出色。需要理解编程命令或技术术语吗?这个模型能以手术般的精准度搞定它。

Image

为现实世界速度而设计的工程

如果模型运行缓慢,所有这些巧妙的架构就意义不大了。美团工程师通过三项关键优化确保这种情况不会发生:

  • 智能参数管理:近一半的模型“脑力”位于其嵌入层中,该层的运作更像快速的字典查找而非繁重的计算。
  • 定制硬件技巧:他们构建了专门的缓存(可视为短期记忆)并融合操作以减少处理延迟。
  • 预测性处理:模型预测接下来可能出现的内容以提高效率,就像棋手提前思考几步一样。

回报是什么?惊人的每秒500-700个token的处理速度(眨眼间就能生成多个段落),以及能够处理长达256,000词的文档——非常适合分析长篇报告或代码库。

基准测试的颠覆者

经过严格测试后,LongCat-Flash-Lite甚至让它的创造者感到惊讶:

  • 专业任务:在行业标准测试中,于电信、零售和航空场景中超越竞争对手。
  • 编程能力:解决了SWE-Bench(一项艰难的编码挑战)中超过一半的问题,并以接近某些竞争对手两倍的分数碾压终端命令测试。
  • 通用智能:在广泛知识测试中与Google的Gemini2.5Flash-Lite不相上下,并能轻松应对高级数学问题。

最棒的部分是什么?美团已经开源了所有内容——包括模型本身、详细的技术论文甚至他们的定制推理引擎。开发者今天就可以尝试它,每天有5000万token的慷慨免费额度可用。

关键点:

  • 美团通过创新的“嵌入扩展”挑战传统AI扩展方式
  • 每个任务仅激活685亿参数中的45亿以实现高效运行
  • 在编程等技术领域表现出色同时保持广泛能力
  • 开源发布包括权重、研究论文和优化的推理工具

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

苹果的制胜秘诀:专家反馈如何助力Qwen3-Coder超越GPT-5

苹果最新研究揭示了定向专家意见如何将开源模型转变为UI设计利器。通过收集21位设计专业人士的详细反馈(包括草图与代码修改),其微调后的Qwen3-Coder在界面生成领域超越了GPT-5。该研究既凸显了审美判断惊人的主观性,也为真正理解视觉语言的AI工具指明了方向。

February 6, 2026
AI研究UI设计机器学习
AI行业动态:Claude重大飞跃、Qwen红包热潮与腾讯漫画布局
News

AI行业动态:Claude重大飞跃、Qwen红包热潮与腾讯漫画布局

AI世界永不停歇,今日动态便是明证。Anthropic通过Claude Opus 4.6的超大上下文窗口突破界限,而阿里巴巴的Qwen应用则因春节活动引发服务器崩溃。与此同时,腾讯携火龙漫画进军动漫领域,监管机构则严厉打击不正当AI行为。从百万token模型到数字茶饮大战,这些变革正重塑科技格局。

February 6, 2026
AI创新科技监管数字竞争
News

中国推出由3万张加速卡组成的巨型AI超级计算集群

中国在郑州国家超算互联网枢纽启用了首个3万张加速卡的超级计算集群,标志着人工智能计算能力的巨大飞跃。这个由申威团队创纪录快速开发的大型计算资源池支持万亿参数模型,有望推动各科学领域的革命性突破。该系统采用开放架构设计,在提供前所未有的可扩展性同时,还具有惊人的易用性。

February 6, 2026
AI基础设施高性能计算中国科技
News

初创公司大胆宣称:新型AI芯片性能或超NVIDIA五倍

可能撼动AI硬件市场的举措中,初创公司Positron公布了其Asimov芯片架构,承诺带来显著的能效提升。该公司宣称其专有设计在每瓦性能上比NVIDIA即将推出的Rubin平台高出五倍,瞄准了大型语言模型推理的蓬勃需求。尽管纸面数据令人印象深刻,行业观察人士质疑在没有成熟开发者工具的情况下,Positron能否挑战NVIDIA的霸主地位。

February 5, 2026
AI芯片半导体机器学习
Mistral AI全新语音模型实现近乎即时中文转录
News

Mistral AI全新语音模型实现近乎即时中文转录

法国AI初创公司Mistral AI发布了具备突破性实时转录能力的Voxtral Transcribe 2系列。其新型号将处理延迟缩短至0.2秒以内,并支持包括中文在内的多种语言,以极具竞争力的价格为开发者提供强大的语音应用工具。

February 5, 2026
语音识别AI创新实时技术
智谱AI的GLM-4.7-Flash模型两周内下载量突破百万
News

智谱AI的GLM-4.7-Flash模型两周内下载量突破百万

智谱AI推出的轻量级模型GLM-4.7-Flash在开源社区引发轰动,发布仅14天便在Hugging Face平台实现超百万次下载。这款混合思维模型在基准测试中表现优于竞品,为开发者提供了高效且经济实惠的AI应用解决方案。其快速采用标志着市场对智谱AI平衡性能与实际部署需求策略的高度认可。

February 4, 2026
AI发展开源机器学习