跳转到主要内容

美团新AI模型:小巧身材蕴藏强大性能

美团紧凑型AI模型展现超预期性能

Image

在AI模型领域,庞大未必总是优势。传统混合专家(MoE)架构随着专家数量增加常面临收益递减问题。美团LongCat团队通过创新的"嵌入扩展"技术颠覆了这一现状,其LongCat-Flash-Lite模型取得了突破性成果。

重新思考模型扩展方式

研究人员发现了一个反直觉的突破点:扩展嵌入层的效果竟优于单纯增加专家数量。数据说明一切——虽然完整模型包含685亿参数,但得益于巧妙的N元嵌入层设计,每次推理仅激活29至45亿参数。

技术报告指出:"我们专门为嵌入层分配了超过300亿参数,这使我们能精准捕捉局部语义特征——对识别编程命令等专业语境至关重要。"

Image

全方位工程优化实现高效能

理论优势未必能转化为实际性能。美团通过三大关键优化攻克了这一难题:

  1. 智能参数分配:近半数(46%)参数用于嵌入层,确保计算量可控增长
  2. 定制硬件技巧:采用类似KV Cache的专用缓存与融合CUDA内核,大幅降低I/O延迟
  3. 预测性处理:三步推测性解码方法高效扩展批量处理规模

成效如何?在处理大量输入(4K token)并生成长达1K token输出时,仍能保持每秒500-700token的惊人速度——且支持长达256Ktoken的上下文窗口。

突破基准测试的表现

实测数据证明LongCat-Flash-Lite具备越级挑战能力:

  • 在τ²-Bench上擅长电信支持、零售场景等实际应用
  • 编程能力突出(SWE-Bench得分54.4%)且命令执行强劲(TerminalBench得分33.75)
  • 通用表现不遑多让(MMLU得分85.52),可与Gemini2.5Flash-Lite等更大模型比肩

整套方案——包括权重文件、技术文档及SGLang-FluentLLM推理引擎——现已通过美团LongCat API开放平台开源,并为开发者提供慷慨的每日测试额度。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

DeepSeek V4 崭露头角:揭秘中国新一代AI强者的风采

随着 DeepSeek V4 进入密集测试阶段,科技界一片沸腾。这款国产AI针对不同需求推出了三个版本,从闪电般的响应速度到先进的视觉分析能力,展现了中国追求技术自主的决心。此次发布尤为引人注目的是其与国产芯片的深度融合,标志着摆脱对外依赖的战略举措。随着AI军备竞赛的升温,这款模型能否重新定义中国自主研发人工智能的成就?

April 8, 2026
AI发展中国科技机器学习
News

阿里巴巴全新AI算法突破推理极限,超越OpenAI迷你模型

阿里巴巴通义实验室发布突破性算法FIPO,显著提升AI推理能力。这项创新使模型能处理超过1万个标记的复杂问题,在某些基准测试中甚至超越了OpenAI的o1-mini。该技术引入了Future-KL等智能机制,帮助AI实现'前瞻性思考',标志着机器智能的重大飞跃。

April 8, 2026
AI研究机器学习阿里巴巴
News

阿里巴巴AI模型突破万亿令牌里程碑,登顶全球排行榜

阿里巴巴的通义千问3.6 Plus创下历史,成为首个在OpenRouter平台上日处理量突破10万亿令牌的AI模型,稳居全球排名榜首。这一成就标志着中国在AI领域日益增长的影响力,国内模型通过有竞争力的价格和快速创新赢得市场青睐。与此同时,资本市场对AI技术表现出浓厚兴趣,中国交易所交易量达到1万亿元人民币。

April 7, 2026
人工智能阿里巴巴OpenRouter
News

贝索斯AI实验室重磅出击:聘请OpenAI联合创始人

杰夫·贝索斯在人工智能军备竞赛中祭出大手笔,将OpenAI联合创始人凯尔·科西克招至其神秘的新实验室Project Prometheus。这个雄心勃勃的项目旨在创造真正理解物理世界的机器——随着科西克的深厚专业能力加入,这个登月计划突然变得严肃起来。科技界内部正热议这个梦之队下一步可能创造的突破。

April 7, 2026
人工智能科技行业杰夫·贝索斯
News

好莱坞明星米拉·乔沃维奇以开源AI记忆突破震撼科技界

以动作大片《生化危机》闻名的米拉·乔沃维奇转型科技革新者,她开源的MemPalace——一个刚在行业基准测试中取得优异成绩的AI记忆系统。这一借鉴古希腊记忆技术的本地优先解决方案在保持数据私密性的同时,性能超越商业产品。GitHub上的发布因其直观的'记忆宫殿'架构和令人印象深刻的压缩技术引发开发者热议。

April 7, 2026
AI创新开源技术数字隐私
阿里巴巴新算法助力AI更接近人类思维
News

阿里巴巴新算法助力AI更接近人类思维

阿里巴巴通义实验室研发出一项名为FIPO的突破性算法,帮助大语言模型识别并聚焦复杂推理任务中的关键部分。与传统方法不同,FIPO采用创新的'Future-KL'机制,对那些显著影响后续推理步骤的token给予奖励。初期测试显示该算法效果显著,模型不仅能处理超过10,000个token的推理链,还在数学问题求解准确率上有所提升。

April 7, 2026
AI研究机器学习阿里巴巴