跳转到主要内容

蚂蚁集团开源高性能扩散模型框架dInfer

蚂蚁集团开源AI框架取得重大突破

10月13日,蚂蚁集团在AI社区引起轰动,开源了dInfer——一个专为扩散语言模型设计的突破性高性能推理框架。此次发布标志着扩散模型在工业应用中实现实际可行性的重要里程碑。

性能突破

基准测试揭示了dInfer的卓越能力:

  • 相比NVIDIA的Fast-dLLM框架,推理速度快10.7倍
  • 在HumanEval代码生成任务的单批次推理中达到1011 Tokens/秒
  • 平均推理速度比同类自回归模型快2.5倍

该框架证明,通过系统性工程创新,扩散语言模型可以在保持与顶级自回归模型相当的精度的同时,实现其理论上的效率潜力。

克服扩散模型的挑战

扩散语言模型将文本生成视为从随机噪声逐步"去噪"的过程,具有三个关键优势:

  1. 高并行性
  2. 全局视角
  3. 灵活结构

然而实际实施面临三大瓶颈:

  • 高计算成本
  • KV缓存失效问题
  • 并行解码限制

dInfer的架构通过模块化设计专门解决了这些挑战。

Image 图:dInfer架构

技术架构

该框架包含四个核心模块:

  1. 模型模块 - 支持多种扩散语言模型变体
  2. KV缓存管理器 - 优化内存使用
  3. 迭代管理器 - 协调去噪过程
  4. 解码器 - 处理输出生成

这种即插即用的设计使开发者能够在保持标准化评估指标的同时,尝试不同的优化策略。

行业影响

此次发布将尖端AI研究与实际应用连接起来,是使扩散语言模型真正成为自回归方法可行替代方案的关键一步。

蚂蚁集团将dInfer定位为对全球开发者社区的开放邀请,共同探索扩散模型的潜力并构建更高效的AI生态系统。

该框架目前支持多种模型变体,包括LLaDA、LLaDA-MoE和LLaDA-MoE-TD。

关键点:

  • 首个实现比自回归更快速度的扩散模型开源框架
  • 通过系统工程解决长期存在的效率瓶颈
  • 模块化架构支持灵活实验
  • 代表了迈向实用AGI发展路径的重要进展

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

智谱与华为联手推出基于国产芯片的开源图像模型

智谱AI与华为联合发布GLM-Image,这一突破性多模态模型完全运行在中国昇腾芯片上。这标志着国产AI发展的重大进展,将尖端图像生成技术与完全自主的硬件体系相结合。混合架构融合了语言建模与扩散技术,有望为中国开发者提供更智能的内容创作工具。

January 14, 2026
AI自主化中国科技多模态模型
腾讯WeDLM通过扩散模型突破性进展为AI推理加速
News

腾讯WeDLM通过扩散模型突破性进展为AI推理加速

腾讯微信AI团队发布了创新扩散语言模型WeDLM,该模型在保持文本生成质量的同时显著提升了速度。通过巧妙融合扩散模型与注意力机制,这项技术在特定任务中实现了比现有模型快10倍的处理速度。早期测试显示,该技术在需要快速响应的应用场景(如客服和实时问答)中表现尤为突出。

January 13, 2026
AI创新自然语言处理腾讯技术
News

斯坦福研究揭示:中国在开源AI发展中领先

斯坦福大学一项突破性分析显示,中国已在开源权重AI开发领域超越美国,其中阿里巴巴的通义千问模型系列领跑全球下载量。尽管中国科技巨头和初创企业推动创新,但随着这些模型获得国际采用,安全问题依然存在。

January 12, 2026
人工智能中国科技开源AI
Lightricks推出开源AI,数秒内生成带声音的视频
News

Lightricks推出开源AI,数秒内生成带声音的视频

以色列科技公司Lightricks发布了LTX-2,这是一款创新的AI系统,能够根据文本提示生成20秒高清视频并完美同步音频。与传统方法不同,它采用独特的双流架构同时处理视觉和声音。这款开源模型以惊人的速度超越竞争对手——每步仅需一秒多即可生成720p内容。

January 12, 2026
AI视频生成开源AILightricks
中国电信凭借自研TeleChat3模型实现AI飞跃
News

中国电信凭借自研TeleChat3模型实现AI飞跃

中国电信最新发布完全自主开发的AI模型TeleChat3,实现从芯片到框架的全链路国产化。该模型基于中国自主计算基础设施训练,数据规模达150万亿token,并创新性引入透明推理的'思维模式'。此次开源标志着中国在AI自主可控道路上迈出重要一步。

January 5, 2026
AI创新中国科技开源AI
腾讯新翻译技术,口袋里的专业翻译
News

腾讯新翻译技术,口袋里的专业翻译

腾讯发布了HY-MT1.5,这是一项突破性的翻译系统,将强大的AI能力带到了移动设备上。轻量级的1.8B版本在占用极少内存的同时提供近乎即时的翻译,非常适合智能手机。而更强大的7B模型则擅长企业级复杂翻译任务。这些模型的特别之处在于它们结合了海量训练与人类反馈,能够处理从技术术语到文化差异的一切问题——同时还能保持文档格式不变。

January 5, 2026
机器翻译AI模型移动技术