跳转到主要内容

蚂蚁集团与中国人民大学联合发布首个原生MoE架构扩散语言模型

蚂蚁集团与中国人民大学发布突破性LLaDA-MoE模型

2025外滩大会上,蚂蚁集团中国人民大学联合推出LLaDA-MoE——业界首个原生混合专家(MoE)架构扩散语言模型(dLLM)。这一突破性成果挑战了语言模型必须采用自回归架构的传统认知。

核心创新

LLaDA-MoE模型基于约20TB数据从头训练,在工业级规模训练中展现出卓越的可扩展性和稳定性。其性能超越此前稠密架构的扩散语言模型如LLaDA1.0/1.5Dream-7B,并与同等规模的自回归模型如Qwen2.5-3B-Instruct持平。值得注意的是,该模型仅激活总参数量70亿中的14亿参数即实现这一成就。

Image

配图:中国人民大学与蚂蚁集团联合发布首个MoE架构扩散模型LLaDA-MoE

性能亮点

在蚂蚁统一评估框架下,LLaDA-MoE在包含HumanEvalMBPPGSM8K在内的17个基准测试中平均提升达8.4%。其领先LLaDA-1.5达13.2%,并与Qwen2.5-3B-Instruct表现相当,验证了MoE架构在dLLM领域的"放大器效应"。

Image

配图:LLaDA-MoE与其他模型的性能指标对比

技术突破

蚂蚁集团通用人工智能研究中心主任兰震中强调,该模型标志着dLLM向更大规模扩展迈出重要一步。团队基于LLaDA-1.0重写训练代码,并采用蚂蚁分布式框架ATorch实现并行加速。

中国人民大学助理教授*李崇轩指出,传统自回归模型难以处理双向token依赖关系,而LLaDA-MoE的并行解码机制有效解决了这一局限。

开源承诺

蚂蚁集团计划开源包括模型权重在内的全套资源,同时提供专为dLLM并行优化的定制推理引擎——据称其性能超越NVIDIA的fast-dLLM解决方案。技术报告与代码将在 GitHub*和 Hugging Face*平台发布。

关键要点:

  • 首个原生MoE架构扩散语言模型(dLLM)
  • 基于20T数据训练,总参数量70亿(激活14亿)
  • 超越稠密扩散模型;媲美自回归同类产品
  • 即将开源模型权重及推理框架

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

StepZen开源AI模型挑战行业巨头
News

StepZen开源AI模型挑战行业巨头

StepZenith已将其Step3.5Flash AI模型完全开源,该模型采用庞大的1960亿参数MoE架构。这款高能效模型在使用时仅激活110亿参数,在编码任务中实现了惊人的350 TPS速度。其使用量仅次于OpenClaw位居第二,凭借速度和稳定性迅速成为开源社区的新宠。

March 4, 2026
AIOpenSourceMachineLearning
GPT-5.4震撼登场:具备读心AI与百万级token记忆能力
News

GPT-5.4震撼登场:具备读心AI与百万级token记忆能力

OpenAI最新模型GPT-5.4带来了革命性功能,让我们离真正智能的数字助手更近一步。全新的'思维模式'让用户可以窥见AI的推理过程,而百万级token记忆能力使其能够处理海量文档。最令人惊叹的是其原生计算机操作能力——这款AI不仅能对话,还能实际跨应用程序工作。

March 6, 2026
AIOpenAIGPT
AI智能体通过新型训练框架实现实时进化
News

AI智能体通过新型训练框架实现实时进化

蚂蚁集团与清华大学联合发布AReaL v1.0强化学习框架,这项突破性技术让AI智能体在实际使用中持续自我提升。与传统需要大量编码的系统不同,该创新方案能让现有智能体无缝连接——想象你的数字助手每次使用时都在变得更聪明。系统的秘密武器?一个AI驱动的开发助手在创纪录时间内帮助构建了其复杂架构。

March 4, 2026
AI机器学习科技创新
Telegram机器人API迎来流式升级:聊天机器人现在能像人类一样实时响应
News

Telegram机器人API迎来流式升级:聊天机器人现在能像人类一样实时响应

Telegram最新的Bot API 9.5更新为所有聊天机器人带来了颠覆性的流式传输能力,消除了AI对话中尴尬的停顿。该更新允许机器人在生成回复时逐步显示内容,类似人类的打字过程。OpenClaw率先实现即时兼容性,在私聊和群组中提供更流畅的交互体验。

March 3, 2026
TelegramChatbotsAI
News

OpenAI挖角Meta明星研究员,硅谷AI人才争夺战白热化

本周,随着OpenAI成功从Meta挖来知名研究员Ruoming Pang,顶级AI人才的争夺战达到新高度。尽管Meta据称提供了2亿美元的薪酬方案,Pang在经过数月的接洽后仍选择加入Sam Altman的团队。这一高调跳槽凸显了科技巨头们在推动通用人工智能突破的专家争夺上的激烈竞争。

February 26, 2026
AISiliconValleyTechTalent
News

AI行业呈惊人增长态势,OpenAI估值飙升至8500亿美元

人工智能领域正经历前所未有的增长,OpenAI估值在短短六个月内飙升至8500亿美元。与此同时,印度企业巨头正对AI基础设施开发进行1.45万亿美元的巨额押注。尽管这些数字描绘出爆炸式扩张的景象,但如何将这些投资转化为可持续的技术领先地位仍面临挑战。

February 24, 2026
AIOpenAITechInvestment