蚂蚁集团推出金融AI评估基准Finova及Agentar-Fin-R1模型
蚂蚁集团发布Finova基准与Agentar-Fin-R1模型
2025年7月28日 —— 在世界人工智能大会上,蚂蚁集团科技板块蚂蚁数科正式推出Finova大模型金融应用评测基准及新一代Agentar-Fin-R1金融推理模型。该基准由兴业银行、宁波银行等机构共同参与制定,为金融AI应用设立了新评估标准。
金融AI的重大突破
基于Qwen3框架开发的Agentar-Fin-R1模型在FinEval1.0和FinanceIQ等权威测试中表现优异,超越通用及专业金融模型。蚂蚁数科CEO赵文彪表示,这一进展弥合了通用AI与行业需求间的"知识鸿沟"。

应对行业挑战
随着金融业数字化转型加速,AI模型需具备处理以下能力:
- 复杂推理逻辑
- 高阶金融知识
- 严格合规要求 现有模型常在实际金融任务中表现不足。Agentar-Fin-R1通过以下创新解决痛点:
- 万亿级金融语料库
- 专家标注的思维链(CoT)训练
- 创新型加权训练算法

核心创新点
该模型提供8B至72B参数多个版本以适应不同部署需求。基于百灵模型的**MOE架构变体显著提升推理速度。值得注意的是,Agentar-Fin-R1可持续更新最新金融政策与市场数据,同时降低企业微调成本。
Finova评测基准
协作开发的**Finova基准聚焦三大评估维度:
- 智能体功能完备性
- 复杂推理性能表现
- 安全合规标准测试
作为完全开源项目,Finova旨在提升行业AI应用水平。初期测试显示Agentar-Fin-R1甚至优于更大规模的通用模型。

实际应用成效
蚂蚁数科技术已在中国主要银行落地:
- 覆盖全部国有银行(100%)
- AI移动银行应用使用活跃度提升25%
- 开发超100个金融智能体解决方案
公司计划进一步拓展新能源领域,同时持续优化金融AI产品矩阵。
关键要点:
- 蚂蚁数科联合头部机构推出Finova基准体系
- Agentar-Fin-R1在金融推理任务中表现卓越
- 高效训练算法显著降低部署成本
- 开源基准推动行业AI协同发展




