美团新AI模型以智能参数技巧展现强劲实力
重新思考AI模型的成长方式
大多数AI模型试图通过增加更多“专家”——处理不同任务的专用子模型——来变得更聪明。但美团LongCat团队发现这种方法很快会遇到收益递减的问题。他们的解决方案?一种他们称之为“嵌入扩展”的巧妙变通方法,让每个参数都能发挥更大作用。

魔法背后的数字
乍看之下,LongCat-Flash-Lite似乎非常庞大——总计685亿个参数。但有趣的是:在实际使用时,每次仅激活29亿到45亿个参数。这就像拥有一辆跑车,它只根据每段道路的需要使用相应的马力。
秘诀是什么?超过300亿个参数专门用于N-gram嵌入层,该层在捕捉上下文线索方面表现异常出色。需要理解编程命令或技术术语吗?这个模型能以手术般的精准度搞定它。

为现实世界速度而设计的工程
如果模型运行缓慢,所有这些巧妙的架构就意义不大了。美团工程师通过三项关键优化确保这种情况不会发生:
- 智能参数管理:近一半的模型“脑力”位于其嵌入层中,该层的运作更像快速的字典查找而非繁重的计算。
- 定制硬件技巧:他们构建了专门的缓存(可视为短期记忆)并融合操作以减少处理延迟。
- 预测性处理:模型预测接下来可能出现的内容以提高效率,就像棋手提前思考几步一样。
回报是什么?惊人的每秒500-700个token的处理速度(眨眼间就能生成多个段落),以及能够处理长达256,000词的文档——非常适合分析长篇报告或代码库。
基准测试的颠覆者
经过严格测试后,LongCat-Flash-Lite甚至让它的创造者感到惊讶:
- 专业任务:在行业标准测试中,于电信、零售和航空场景中超越竞争对手。
- 编程能力:解决了SWE-Bench(一项艰难的编码挑战)中超过一半的问题,并以接近某些竞争对手两倍的分数碾压终端命令测试。
- 通用智能:在广泛知识测试中与Google的Gemini2.5Flash-Lite不相上下,并能轻松应对高级数学问题。
最棒的部分是什么?美团已经开源了所有内容——包括模型本身、详细的技术论文甚至他们的定制推理引擎。开发者今天就可以尝试它,每天有5000万token的慷慨免费额度可用。
关键点:
- 美团通过创新的“嵌入扩展”挑战传统AI扩展方式
- 每个任务仅激活685亿参数中的45亿以实现高效运行
- 在编程等技术领域表现出色同时保持广泛能力
- 开源发布包括权重、研究论文和优化的推理工具


