跳转到主要内容

Radical Numerics发布开源30B参数扩散AI模型

Radical Numerics发布开源扩散AI重大突破

AI研究公司Radical Numerics公开推出了迄今为止最大的开源扩散语言模型RND1-Base。这个300亿参数的架构标志着并行文本生成技术的重大进步。

技术规格

该模型具有以下特点:

  • 总计300亿参数(通过稀疏专家混合激活30亿)
  • 基于Qwen3-30BA3B自回归基础构建
  • 使用双向掩码训练了5000亿token
  • 支持800万token批量大小以确保稳定性 Image

性能基准测试

RND1-Base在多个领域展现出卓越能力:

基准测试 得分

该模型在保持计算效率的同时,通过选择性参数激活超越了Dream-7B和LLaDA-8B等先前开源扩散模型。

架构创新

与传统自回归模型不同,RND1将文本生成视为去噪过程,从而实现了:

  • 并行序列优化
  • 双向注意力机制
  • 降低推理延迟

通过采用分层特定学习率的持续预训练,在保留现有知识的同时获得新能力,完成了从自回归到扩散范式的转变。

研究意义

此次开源内容包括:

  • 完整模型权重
  • 训练方法论
  • 搭载FlashInfer/SGLang后端的推理代码

这种透明度旨在加速社区对扩散语言模型的训练后优化及实际应用的研究。

未来方向

尽管表现出强大性能,但在以下方面仍存在挑战:

  • 泛化能力
  • 内存优化 Radical Numerics建议未来结合多目标微调可能释放更大潜力。

这支由DeepMind、Meta和斯坦福大学研究人员组成的团队将此视为通向递归自我改进AI系统的基础工作。

关键要点:

  1. 发布最大开源扩散语言模型(300亿参数)
  2. 在实现并行生成的同时达到最先进基准测试成绩
  3. 向研究社区提供完整技术栈
  4. 代表了向非自回归AI架构的转变
  5. 为未来自我改进AI系统奠定基础

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Inception Labs以Mercury2颠覆AI领域——一款像编辑一样思考的扩散模型
News

Inception Labs以Mercury2颠覆AI领域——一款像编辑一样思考的扩散模型

AI初创公司Inception Labs发布了突破性的语言模型Mercury2,该模型摒弃了标准的Transformer架构,转而采用扩散模型。与逐字生成的传统AI不同,Mercury2能同时编辑整段文字——想象一个能重写段落而非逐个字母输入的AI助手。早期测试显示其速度惊人,在保持质量的同时每秒生成超过1000个token。凭借具有竞争力的价格和针对速度敏感应用的专有功能,这可能是AI文本生成新方法的开端。

February 25, 2026
AI创新扩散模型自然语言处理
Anthropic收购Vercept以增强其AI雄心
News

Anthropic收购Vercept以增强其AI雄心

AI巨头Anthropic战略性收购西雅图初创公司Vercept,以强化其Claude Code生态系统。部分创始人加入Anthropic的同时,其他人对产品关闭表示失望。这笔交易凸显了主要参与者为争夺新兴技术主导权而展开的顶级AI人才激烈竞争。

February 26, 2026
AnthropicAI并购开发者工具
News

阿里云通过多模型切换革新AI访问方式

阿里云通义平台推出突破性的编程方案,可无缝切换四种顶尖中国开源AI模型。开发者现在能根据需求轻松切换Qwen3.5、GLM-5、MiniMax M2.5和Kimi K2.5模型,无需再为管理多个API而烦恼。这项创新为探索AI解决方案的企业提供了更大灵活性、成本节约和稳定性。

February 25, 2026
人工智能云计算科技创新
News

Wayve凭借AI驱动自动驾驶技术斩获10亿美元融资

伦敦AI初创公司Wayve刚刚获得由软银领投、英伟达和微软跟投的10.5亿美元巨额融资。该公司独特的自动驾驶技术——通过模拟人类学习而非依赖昂贵传感器——可能彻底改变汽车在城市道路的导航方式。这笔融资标志着欧洲AI创新获得重大认可,也预示着业界对'具身AI'应用的兴趣日益增长。

February 25, 2026
自动驾驶汽车AI初创企业软银
Moonshot AI旗下Kimi K2.5达成惊人盈利里程碑
News

Moonshot AI旗下Kimi K2.5达成惊人盈利里程碑

Moonshot AI最新模型Kimi K2.5震撼科技界,其上线前20天创造的收入已超过2025年全年总和。这一突破主要得益于海外用户和开发者对其API服务的青睐,推动公司估值突破100亿美元。创始人杨植麟确认公司资金充足,暂无立即IPO计划。

February 24, 2026
人工智能科技初创企业机器学习
Claude Sonnet 4.6以百万级令牌容量突破新境界
News

Claude Sonnet 4.6以百万级令牌容量突破新境界

Anthropic最新AI模型Claude Sonnet 4.6以非旗舰价格提供旗舰级性能。其突破性特征?开创性的百万令牌上下文窗口,可一次性消化完整代码库或长篇文档。开发者已盛赞其增强的编程能力和工具调用功能,使其成为处理复杂任务的强力助手。

February 24, 2026
AI进展自然语言处理开发者工具