跳转到主要内容

美团LongCat-Flash-Lite:小而精悍的AI强者

美团重新定义高效AI规则

Image

在这个痴迷于庞大模型的行业中,美团LongCat团队另辟蹊径。他们最新发布的LongCat-Flash-Lite证明:更智能的架构能胜过蛮力扩展。"传统MoE方法带来的边际效益不断递减",团队技术负责人解释道,"于是我们思考——如果换个方式分配这些参数会怎样?"

嵌入层突破

秘诀何在?他们称之为"嵌入扩展"的技术。当多数混合专家模型不断新增专家(好比雇佣更多顾问)时,LongCat-Flash-Lite选择强化词汇理解能力(如同为现有顾问配备更好的参考手册)。

其优势在于:

  • 总计685亿参数,但每次查询仅激活29-45亿
  • 300亿参数专用于N元嵌入,轻松掌握技术术语
  • 针对编程命令等领域的专项理解(试试用冷门终端指令难倒它)

Image

速度背后的工程魔法

没有实际性能支撑的理论效率毫无意义。美团工程师实现了三项精妙优化:

  1. 参数瘦身计划:近半数模型采用轻量级嵌入查找(O(1)复杂度——计算机科学术语中的"极速")
  2. 内存技巧:定制N元缓存系统与融合CUDA内核减少计算文书工作
  3. 预测游戏:推测解码技术让模型预判可能输出,如同棋手预判多步走法

成果如何?达到每秒500-700个token——快到能在约90秒内生成莎士比亚《哈姆雷特》,同时处理长达256K token的上下文。

跨领域基准测试霸主地位

数据不说谎:

  • 代码专家:SWE-Bench(软件工程任务)得分54.4%,终端命令测试表现碾压级优势
  • 数学健将:MMLU测试85.52分与Gemini2.5Flash-Lite持平,竞赛级数学问题应对自如
  • 专业代理:τ²-Benchmark电信、零售和航空场景排名榜首

最惊喜的是?美团已开源全部资源——权重、技术论文乃至优化后的推理引擎。开发者现可通过LongCat API开放平台申请体验,每日提供慷慨的5000万token免费额度。毕竟有时候,最好的AI未必体型最大。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Yuchu新型AI模型赋予机器人常识
News

Yuchu新型AI模型赋予机器人常识

中国科技公司Yuchu开源了突破性AI模型UnifoLM-VLA-0,该模型能帮助人形机器人像人类一样理解物理交互。不同于仅处理文本和图像的普通AI,该模型能掌握空间关系和现实世界动态——使机器人能够执行从抓取物体到抵抗干扰等复杂任务。基于现有技术构建但仅用340小时机器人数据训练,它已在空间推理测试中超越竞争对手。

January 30, 2026
AI机器人开源AI人形机器人
昆仑万维开源视频AI将创意推向新高度
News

昆仑万维开源视频AI将创意推向新高度

中国科技公司昆仑万维近日发布了开源视频生成模型SkyReels-V3,在AI界引起轰动。这款多功能工具集图像转视频、电影风格延伸和逼真虚拟形象于一体。早期测试显示其在视觉质量和一致性上优于商业竞品。最惊喜的是?目前完全免费使用。

January 29, 2026
AI视频生成开源AI多模态模型
DeepSeek的记忆增强:AI模型如何变得更智能
News

DeepSeek的记忆增强:AI模型如何变得更智能

DeepSeek的研究人员开发了一种巧妙的解决方案,使大型语言模型更加高效。他们新的Engram模块就像一个心智捷径手册,帮助AI快速回忆常用短语,同时节省脑力处理更复杂的任务。早期测试显示出令人印象深刻的提升——使用Engram的模型在推理、数学和编程挑战中表现优于标准版本,同时能轻松处理更长的文本。

January 15, 2026
AI效率语言模型机器学习
News

智谱与华为联手推出基于国产芯片的开源图像模型

智谱AI与华为联合发布GLM-Image,这一突破性多模态模型完全运行在中国昇腾芯片上。这标志着国产AI发展的重大进展,将尖端图像生成技术与完全自主的硬件体系相结合。混合架构融合了语言建模与扩散技术,有望为中国开发者提供更智能的内容创作工具。

January 14, 2026
AI自主化中国科技多模态模型
News

斯坦福研究揭示:中国在开源AI发展中领先

斯坦福大学一项突破性分析显示,中国已在开源权重AI开发领域超越美国,其中阿里巴巴的通义千问模型系列领跑全球下载量。尽管中国科技巨头和初创企业推动创新,但随着这些模型获得国际采用,安全问题依然存在。

January 12, 2026
人工智能中国科技开源AI
Lightricks推出开源AI,数秒内生成带声音的视频
News

Lightricks推出开源AI,数秒内生成带声音的视频

以色列科技公司Lightricks发布了LTX-2,这是一款创新的AI系统,能够根据文本提示生成20秒高清视频并完美同步音频。与传统方法不同,它采用独特的双流架构同时处理视觉和声音。这款开源模型以惊人的速度超越竞争对手——每步仅需一秒多即可生成720p内容。

January 12, 2026
AI视频生成开源AILightricks