跳转到主要内容

蚂蚁集团与中国人民大学联合发布首个原生MoE架构扩散语言模型

蚂蚁集团与中国人民大学发布突破性LLaDA-MoE模型

2025外滩大会上,蚂蚁集团中国人民大学联合推出LLaDA-MoE——业界首个原生混合专家(MoE)架构扩散语言模型(dLLM)。这一突破性成果挑战了语言模型必须采用自回归架构的传统认知。

核心创新

LLaDA-MoE模型基于约20TB数据从头训练,在工业级规模训练中展现出卓越的可扩展性和稳定性。其性能超越此前稠密架构的扩散语言模型如LLaDA1.0/1.5Dream-7B,并与同等规模的自回归模型如Qwen2.5-3B-Instruct持平。值得注意的是,该模型仅激活总参数量70亿中的14亿参数即实现这一成就。

Image

配图:中国人民大学与蚂蚁集团联合发布首个MoE架构扩散模型LLaDA-MoE

性能亮点

在蚂蚁统一评估框架下,LLaDA-MoE在包含HumanEvalMBPPGSM8K在内的17个基准测试中平均提升达8.4%。其领先LLaDA-1.5达13.2%,并与Qwen2.5-3B-Instruct表现相当,验证了MoE架构在dLLM领域的"放大器效应"。

Image

配图:LLaDA-MoE与其他模型的性能指标对比

技术突破

蚂蚁集团通用人工智能研究中心主任兰震中强调,该模型标志着dLLM向更大规模扩展迈出重要一步。团队基于LLaDA-1.0重写训练代码,并采用蚂蚁分布式框架ATorch实现并行加速。

中国人民大学助理教授*李崇轩指出,传统自回归模型难以处理双向token依赖关系,而LLaDA-MoE的并行解码机制有效解决了这一局限。

开源承诺

蚂蚁集团计划开源包括模型权重在内的全套资源,同时提供专为dLLM并行优化的定制推理引擎——据称其性能超越NVIDIA的fast-dLLM解决方案。技术报告与代码将在 GitHub*和 Hugging Face*平台发布。

关键要点:

  • 首个原生MoE架构扩散语言模型(dLLM)
  • 基于20T数据训练,总参数量70亿(激活14亿)
  • 超越稠密扩散模型;媲美自回归同类产品
  • 即将开源模型权重及推理框架

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

印度Alpie AI模型引发热议——但它真的源自本土吗?
News

印度Alpie AI模型引发热议——但它真的源自本土吗?

印度新晋AI竞争者Alpie凭借在数学和编程测试中媲美GPT-4o和Claude3.5等巨头的表现引发关注。然而技术分析显示其实际基于中国开源模型构建,引发了关于创新与优化的讨论。Alpie的特殊之处在于能在消费级硬件上高效运行,有望为中小开发者降低AI使用门槛。

January 15, 2026
AI机器学习印度科技
Mugen3D将单张照片转化为惊艳的3D世界
News

Mugen3D将单张照片转化为惊艳的3D世界

一款名为Mugen3D的突破性AI工具正在改变我们创建3D内容的方式。它运用先进的3D高斯泼溅技术,仅需一张图像就能生成极其逼真的模型——以惊人的精确度捕捉纹理、光照和材质。这项创新有望在从游戏到电子商务的各行各业中普及3D创作。

January 12, 2026
AIComputerGraphicsDigitalCreation
News

高通与谷歌联手通过AI革新汽车技术

高通与谷歌正携手解决汽车行业最头疼的问题之一:分散的车载系统。他们新推出的'汽车AI代理'将高通的骁龙数字底盘与谷歌的Android Automotive OS相结合,承诺带来更流畅的开发体验和更智能的功能(如面部识别)。该合作还引入了基于云的开发工具,有望大幅缩短研发时间。这标志着向更统一、更智能的车辆系统迈出了重要一步。

January 9, 2026
automotive-techAIsmart-cars
News

博世豪掷25亿欧元押注智能汽车AI技术

在2026年国际消费电子展上,汽车巨头博世宣布计划到2027年投资超25亿欧元用于AI研发,重点开发智能座舱和更安全的自动驾驶系统。这家德国供应商正谋求从硬件专家转型为软件领导者,预计其技术部门销售额到2030年代中期可达100亿欧元。

January 7, 2026
BoschAI自动驾驶汽车
MiniMax IPO热潮:香港投资者热捧中国AI先锋
News

MiniMax IPO热潮:香港投资者热捧中国AI先锋

中国人工智能技术新锐MiniMax以惊人的投资者热情完成了香港首次公开募股。此次发行获得1209倍超额认购,筹集资金超过2530亿港元。在阿里巴巴和阿布扎比投资局等重量级投资者的支持下,MiniMax将于1月9日上市,有望成为有史以来增长最快的上市公司之一。

January 6, 2026
AIIPOHongKongMarkets
NVIDIA首席执行官在CES 2026盛赞开源AI突破
News

NVIDIA首席执行官在CES 2026盛赞开源AI突破

在CES 2026上,NVIDIA的黄仁勋力推开源AI发展,将DeepSeek-R1誉为杰出成功案例,引发轰动。这位科技领袖展示了全新Vera Rubin芯片的同时,宣布了开源训练数据的计划。黄仁勋阐述了AI正在变革产业的四大关键领域,并预测这些变化将定义未来的技术范式。

January 6, 2026
AIOpen SourceNVIDIA