美团新AI模型以智能参数技巧展现强劲实力欢迎来到AI DAMN！发现最震撼的最新AI新闻、最酷的AI产品和最前沿的AI项目。从ChatGPT到最新模型，我们精选让你惊呼'太牛了！'的AI发展动态。涵盖机器学习、深度学习等前沿技术，每日更新最精彩的人工智能世界。

发现

语言

账户

美团新AI模型以智能参数技巧展现强劲实力

重新思考AI模型的成长方式

大多数AI模型试图通过增加更多“专家”——处理不同任务的专用子模型——来变得更聪明。但美团LongCat团队发现这种方法很快会遇到收益递减的问题。他们的解决方案？一种他们称之为“嵌入扩展”的巧妙变通方法，让每个参数都能发挥更大作用。

魔法背后的数字

乍看之下，LongCat-Flash-Lite似乎非常庞大——总计685亿个参数。但有趣的是：在实际使用时，每次仅激活29亿到45亿个参数。这就像拥有一辆跑车，它只根据每段道路的需要使用相应的马力。

秘诀是什么？超过300亿个参数专门用于N-gram嵌入层，该层在捕捉上下文线索方面表现异常出色。需要理解编程命令或技术术语吗？这个模型能以手术般的精准度搞定它。

为现实世界速度而设计的工程

如果模型运行缓慢，所有这些巧妙的架构就意义不大了。美团工程师通过三项关键优化确保这种情况不会发生：

智能参数管理：近一半的模型“脑力”位于其嵌入层中，该层的运作更像快速的字典查找而非繁重的计算。
定制硬件技巧：他们构建了专门的缓存（可视为短期记忆）并融合操作以减少处理延迟。
预测性处理：模型预测接下来可能出现的内容以提高效率，就像棋手提前思考几步一样。

回报是什么？惊人的每秒500-700个token的处理速度（眨眼间就能生成多个段落），以及能够处理长达256,000词的文档——非常适合分析长篇报告或代码库。

基准测试的颠覆者

经过严格测试后，LongCat-Flash-Lite甚至让它的创造者感到惊讶：

专业任务：在行业标准测试中，于电信、零售和航空场景中超越竞争对手。
编程能力：解决了SWE-Bench（一项艰难的编码挑战）中超过一半的问题，并以接近某些竞争对手两倍的分数碾压终端命令测试。
通用智能：在广泛知识测试中与Google的Gemini2.5Flash-Lite不相上下，并能轻松应对高级数学问题。

最棒的部分是什么？美团已经开源了所有内容——包括模型本身、详细的技术论文甚至他们的定制推理引擎。开发者今天就可以尝试它，每天有5000万token的慷慨免费额度可用。

关键点：

美团通过创新的“嵌入扩展”挑战传统AI扩展方式
每个任务仅激活685亿参数中的45亿以实现高效运行
在编程等技术领域表现出色同时保持广泛能力
开源发布包括权重、研究论文和优化的推理工具

喜欢这篇文章？

订阅我们的 Newsletter，获取最新 AI 资讯、产品评测和项目推荐，每周精选直达邮箱。

每周精选完全免费随时退订

News

苹果的制胜秘诀：专家反馈如何助力Qwen3-Coder超越GPT-5

苹果最新研究揭示了定向专家意见如何将开源模型转变为UI设计利器。通过收集21位设计专业人士的详细反馈（包括草图与代码修改），其微调后的Qwen3-Coder在界面生成领域超越了GPT-5。该研究既凸显了审美判断惊人的主观性，也为真正理解视觉语言的AI工具指明了方向。

February 6, 2026

AI研究UI设计机器学习

News

AI行业动态：Claude重大飞跃、Qwen红包热潮与腾讯漫画布局

AI世界永不停歇，今日动态便是明证。Anthropic通过Claude Opus 4.6的超大上下文窗口突破界限，而阿里巴巴的Qwen应用则因春节活动引发服务器崩溃。与此同时，腾讯携火龙漫画进军动漫领域，监管机构则严厉打击不正当AI行为。从百万token模型到数字茶饮大战，这些变革正重塑科技格局。

February 6, 2026

AI创新科技监管数字竞争

News

中国推出由3万张加速卡组成的巨型AI超级计算集群

中国在郑州国家超算互联网枢纽启用了首个3万张加速卡的超级计算集群，标志着人工智能计算能力的巨大飞跃。这个由申威团队创纪录快速开发的大型计算资源池支持万亿参数模型，有望推动各科学领域的革命性突破。该系统采用开放架构设计，在提供前所未有的可扩展性同时，还具有惊人的易用性。

February 6, 2026

AI基础设施高性能计算中国科技

News

初创公司大胆宣称：新型AI芯片性能或超NVIDIA五倍

可能撼动AI硬件市场的举措中，初创公司Positron公布了其Asimov芯片架构，承诺带来显著的能效提升。该公司宣称其专有设计在每瓦性能上比NVIDIA即将推出的Rubin平台高出五倍，瞄准了大型语言模型推理的蓬勃需求。尽管纸面数据令人印象深刻，行业观察人士质疑在没有成熟开发者工具的情况下，Positron能否挑战NVIDIA的霸主地位。

February 5, 2026

AI芯片半导体机器学习