英伟达发布Rubin CPX GPU,专为大规模AI工作负载设计
英伟达发布革命性Rubin CPX GPU架构
加州圣克拉拉 – 英伟达公布了正在开发的下一代Vera Rubin微架构,旗舰产品Rubin CPX GPU计划于2026年底推出。这款突破性硬件针对需要前所未有上下文窗口处理能力的人工智能工作负载。
新一代AI处理能力
在最近的新闻发布会上,英伟达CEO黄仁勋表示:"Vera Rubin平台代表了AI计算的量子飞跃,推出了我们全新的Rubin GPU架构以及我们称之为CPX的全新处理器类别。"
Rubin CPX变体专为需要处理超过100万个token的应用而设计——这对于复杂的软件开发流程和高清视频生成工作流至关重要。公布的Vera Rubin NDL144CPX GPU将提供:
- 8 exaflops的AI性能
- 30 PF NVFP4上下文计算能力
- 相比当前GB300NVL72系统实现3倍指数级计算性能提升
- 128GB GDDR7内存
- 为视频生成优化的四编码器/解码器配置
- 100TB快速内存容量
构建AI工厂基础设施
英伟达高管将Vera Rubin NDL144CPX定位为建设大规模AI工厂的基础技术。为实现这一愿景,公司将推出全面的terascale数据中心参考设计方案。
"我们正在与基础设施合作伙伴合作,从计算第一原理彻底重新构想数据中心,"黄仁勋解释道。"我们的参考架构将涵盖建筑设计、仿真工具和操作框架。"
性能基准树立新标准
此次发布紧随英伟达近期MLPerf推理测试结果之后——Blackwell GPU在这些测试中创造了新纪录,特别是在要求苛刻的Llama3.1405B交互模型上超越基线性能的表现尤为突出。
公司创新的"解耦服务"技术使现有硬件部署能够实现更高的性能指标,为企业客户创造了额外的收入机会。
关键点:
🔍 下一代Vera Rubin架构将于2026年推出,包含专用CPX变体 🚀 专为百万token以上上下文设计,具备革命性内存/处理规格 🏢 Terascale参考设计将改变数据中心建设方法学 ⚡ *建立在Blackwell GPU创纪录的MLPerf基准表现基础上

