蚂蚁集团白灵团队开源AI模型,大幅降低推理成本
蚂蚁集团白灵团队开源高效AI模型
蚂蚁集团白灵大模型团队发布了两款突破性的开源模型,旨在革新深度推理效率:Ring-flash-linear-2.0和Ring-mini-linear-2.0。随同发布的还有两款专有高性能融合算子——FP8融合算子和线性注意力推理融合算子。
技术突破
新模型采用"大参数、低激活"架构,专为复杂推理任务优化。通过架构改进和专业算子集成,团队报告称:
- 相比同类密集模型实现90%的成本降低
- 推理成本较前代Ring系列版本降低超50%
- 强化学习阶段稳定性增强
这些模型在多个具有挑战性的推理基准测试中展现出最先进(SOTA)性能,同时保持卓越的计算效率。
部署优势
主要运营优势包括:
- 训练与推理引擎的紧密对齐实现持续优化
- 支持超长上下文处理拓展应用潜力
- 降低硬件需求从而减少实施门槛
团队强调这些进步将特别有利于运行密集型推理工作负载的机构,其中计算成本占据显著运营开支。
获取方式
完整套件现已通过主流AI平台提供,包括:
- Hugging Face
- ModelScope
开发者可立即开始将这些工具用于项目实践。
战略影响
本次发布彰显了蚂蚁集团在AI基础设施领域日益增长的影响力,同时为更广泛的社区提供了此前仅限于内部使用的生产级工具。
关键要点:
- 发布两款新型开源推理模型(Ring-flash-linear-2.0/Ring-mini-linear-2.0)
- 包含创新的FP8和线性注意力融合算子
- 相比同类密集模型实现90%的成本降低
- 在基准测试中保持SOTA性能
- Hugging Face和ModelScope平台现已可用




