跳转到主要内容

蚂蚁集团推出高性价比的MoE语言模型

蚂蚁集团的Ling团队在人工智能领域取得了突破性进展,推出了两款新的混合专家(MoE)大语言模型:Ling-LiteLing-Plus。这些模型在预印本平台Arxiv上发表的技术论文中详细介绍了其设计,旨在显著降低训练成本,同时在低性能硬件上保持高性能。

模型:Ling-Lite与Ling-Plus

Ling-Lite拥有168亿参数(包括27.5亿激活参数),而其增强版Ling-Plus则拥有惊人的2900亿参数(包含288亿激活参数),代表了AI效率的重大飞跃。值得注意的是,Ling-Plus中的3000亿参数MoE模型在性能上可与使用高端Nvidia GPU训练的模型相媲美,尽管它是在国产低规格硬件上训练的。

Image 图片来源说明:由AI生成的图像,图像授权由Midjourney提供

打破资源壁垒

传统上,训练MoE模型需要昂贵的高性能GPU,如Nvidia的H100和H800。这不仅推高了成本,还因芯片短缺限制了可访问性。为了解决这些挑战,蚂蚁集团的Ling团队设定了一个雄心勃勃的目标:在不依赖高端GPU的情况下扩展模型规模。他们的创新方法包括:

  • 动态参数分配:优化训练期间的资源使用。
  • 混合精度调度:减少计算开销。
  • 升级的训练异常处理:将中断响应时间缩短50%以上并压缩验证周期。

成本效益与性能

在实验中,团队对Ling-Plus进行了9万亿个token的预训练。使用高性能硬件训练1万亿个token通常需要约635万元人民币的成本。然而,蚂蚁集团的优化方法将这一成本降至约508万元人民币,实现了近20%的成本节约。在性能方面,这些模型与阿里巴巴的通义Qwen2.5-72B-Instruct和DeepSeek-V2.5-1210-Chat等成熟系统不相上下。

对AI发展的影响

这些模型的成功可能通过为开发大语言模型提供更具成本效益的解决方案来彻底改变AI行业。通过减少对Nvidia芯片的依赖并实现在低规格硬件上的高效训练,蚂蚁集团正在为在资源受限的环境中更广泛地采用先进AI技术铺平道路。

关键点

  1. 蚂蚁集团推出了两款MoE大语言模型:Ling-Lite(168亿参数)和Ling-Plus(2900亿参数)。
  2. 这些模型在低性能硬件上实现了高性能,将训练成本降低了近20%。
  3. 创新包括动态参数分配、混合精度调度和改进的异常处理。
  4. 该技术减少了对Nvidia GPU的依赖,为AI开发提供了更具成本效益的替代方案。
  5. 模型的性能可与阿里巴巴的通义Qwen2.5和DeepSeek-V2.5等成熟系统相媲美。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

ChatGPT进军医疗领域,蚂蚁集团AI医生用户突破3000万
News

ChatGPT进军医疗领域,蚂蚁集团AI医生用户突破3000万

OpenAI携ChatGPT Health加入AI医疗竞赛,推出与蚂蚁集团热门应用「阿福健康」相似的功能。该中国平台月活用户已达3000万,仅一个月就实现用户基数翻倍。两款工具均提供健康问答和智能设备集成服务,但「阿福健康」凭借完整的医疗服务连接仍保持优势。

January 8, 2026
AI医疗数字健康ChatGPT
News

腾讯AI实验室震荡:战略重组下资深负责人离职

腾讯AI部门迎来关键时刻,其AI实验室副主任兼混元项目核心架构师汤道权博士在任职八年后卸任。这家科技巨头通过从竞争对手处招揽顶尖人才并整合分散的AI资源作出回应。随着大模型竞赛白热化,腾讯的重组或将决定其能否与竞争对手保持同步。

December 29, 2025
腾讯AI领导层变动大语言模型
中国牵头团队为可信AI智能体制定全球标准
News

中国牵头团队为可信AI智能体制定全球标准

由蚂蚁集团和中国电信等中国科技领军企业组成的联盟在国际电联(ITU)成功推动通过了具有开创性的可信多智能体AI系统国际标准。该框架解决了智能体交互中的关键安全挑战,标志着中国在塑造全球数字治理方面日益增长的影响力。专家称赞这是快速发展的AI生态系统中至关重要的'安全通行证'。

December 22, 2025
AI标准蚂蚁集团可信AI
News

字节跳动AI模型再攀高峰:豆包1.8与Seedance Pro重磅升级

字节跳动火山引擎在其FORCE原动力大会上宣布重大升级,推出豆包大模型1.8和视频生成模型Seedance 1.5 Pro。这些突破性进展展现出令人瞩目的性能指标——每日处理超50万亿tokens(中国第一、全球第三)。伴随技术飞跃,字节跳动同步启动'AI降本计划'降低企业使用门槛,彰显其推动AI产业规模化应用的决心。

December 18, 2025
人工智能字节跳动大语言模型
News

豆包AI模型实现爆发式增长,预示技术进入大规模应用阶段

火山引擎的豆包大语言模型取得惊人增长,自发布以来日使用量激增417倍。该平台目前每日处理超过50万亿token,逾100家企业重度依赖该技术。这一激增现象表明AI技术正从实验阶段转向广泛的商业应用。

December 18, 2025
AI应用大语言模型企业级技术
News

腾讯AI战略大调整:重组架构并任命OpenAI资深专家掌舵

腾讯在人工智能竞赛中采取大胆举措,全面重组其研究部门并引入OpenAI顶尖人才。这家中国科技巨头新成立了三个核心部门,分别专注于基础设施、数据系统和计算平台。领导这次转型的是前OpenAI研究员姚顺宇(Vince Yao),他曾参与Operator等关键项目。与此同时,腾讯的混元大模型持续快速发展,刚刚推出了新型'世界模型'。随着字节跳动和阿里巴巴等国内科技巨头也纷纷推进AI计划,中国人工智能领域的霸主之争正日趋激烈。

December 18, 2025
腾讯AI重组大语言模型