跳转到主要内容

蚂蚁集团推出金融AI评估基准Finova及Agentar-Fin-R1模型

蚂蚁集团发布Finova基准与Agentar-Fin-R1模型

2025年7月28日 —— 在世界人工智能大会上,蚂蚁集团科技板块蚂蚁数科正式推出Finova大模型金融应用评测基准及新一代Agentar-Fin-R1金融推理模型。该基准由兴业银行、宁波银行等机构共同参与制定,为金融AI应用设立了新评估标准。

金融AI的重大突破

基于Qwen3框架开发的Agentar-Fin-R1模型在FinEval1.0FinanceIQ等权威测试中表现优异,超越通用及专业金融模型。蚂蚁数科CEO赵文彪表示,这一进展弥合了通用AI与行业需求间的"知识鸿沟"。

Image

应对行业挑战

随着金融业数字化转型加速,AI模型需具备处理以下能力:

  • 复杂推理逻辑
  • 高阶金融知识
  • 严格合规要求 现有模型常在实际金融任务中表现不足。Agentar-Fin-R1通过以下创新解决痛点:
  • 万亿级金融语料库
  • 专家标注的思维链(CoT)训练
  • 创新型加权训练算法

Image

核心创新点

该模型提供8B至72B参数多个版本以适应不同部署需求。基于百灵模型的**MOE架构变体显著提升推理速度。值得注意的是,Agentar-Fin-R1可持续更新最新金融政策与市场数据,同时降低企业微调成本。

Finova评测基准

协作开发的**Finova基准聚焦三大评估维度:

  1. 智能体功能完备性
  2. 复杂推理性能表现
  3. 安全合规标准测试

作为完全开源项目,Finova旨在提升行业AI应用水平。初期测试显示Agentar-Fin-R1甚至优于更大规模的通用模型。

Image

实际应用成效

蚂蚁数科技术已在中国主要银行落地:

  • 覆盖全部国有银行(100%)
  • AI移动银行应用使用活跃度提升25%
  • 开发超100个金融智能体解决方案

公司计划进一步拓展新能源领域,同时持续优化金融AI产品矩阵。

关键要点:

  • 蚂蚁数科联合头部机构推出Finova基准体系
  • Agentar-Fin-R1在金融推理任务中表现卓越
  • 高效训练算法显著降低部署成本
  • 开源基准推动行业AI协同发展

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

谷歌Gemini 3.1 Pro大幅提升AI推理能力
News

谷歌Gemini 3.1 Pro大幅提升AI推理能力

谷歌发布最新AI模型Gemini 3.1 Pro,其推理能力实现显著提升——相比前代产品性能翻倍有余。该模型专为应对复杂科学与工程挑战而设计,在严苛的逻辑测试中获得77.1%的优异成绩。开发者可通过Google AI Studio等多平台使用,而企业用户则能通过Vertex AI获取专属版本。

February 20, 2026
AI技术进步谷歌科技机器学习
智谱AI股价飙升超42%,香港投资者重金押注人工智能
News

智谱AI股价飙升超42%,香港投资者重金押注人工智能

中国人工智能公司智谱AI在香港交易首日暴涨42.7%,令市场震惊,其估值突破3230亿港元。此次上涨伴随着竞争对手MINIMAX的强劲表现,表明尽管整体市场疲软,投资者对AI股票仍有强烈需求。智谱新推出的GLM-5模型和高端定价策略似乎赢得了市场信心。

February 20, 2026
人工智能股票市场中国科技
腾讯撒钱盛宴:元宝App用户狂揽数十亿红包热潮
News

腾讯撒钱盛宴:元宝App用户狂揽数十亿红包热潮

腾讯元宝App以惊人数据收官其春节大型促销活动——超过36亿次抽奖瓜分10亿元数字红包。该活动在低线城市表现尤为亮眼,用户占比近半。除简单抽奖外,本次活动成功融合AI创意任务和社交分享功能,在整个假期期间持续吸引用户参与。

February 18, 2026
腾讯数字支付春节
阿里Qwen3.5-Plus打破纪录成为开源AI新标杆
News

阿里Qwen3.5-Plus打破纪录成为开源AI新标杆

正值农历新年庆祝之际,阿里巴巴重磅推出Qwen3.5-Plus——这款开源AI巨头以更低成本超越行业标杆。这款革命性模型在其紧凑框架中注入了重大创新,提供多模态能力并全面刷新基准测试成绩。全球开发者现在可免费获取媲美谷歌和OpenAI高端产品的技术。

February 17, 2026
AI创新开源技术机器学习
MiniMax全新AI模型实现速度飞跃
News

MiniMax全新AI模型实现速度飞跃

MiniMax最新发布的M2.5-HighSpeed模型以惊人性能提升引发关注。其处理速度达到竞争对手的三倍,每秒可处理100笔交易——这将成为AI应用的颠覆性突破。伴随速度提升,MiniMax还推出灵活定价方案和推荐折扣,使强大AI工具变得前所未有地触手可及。

February 16, 2026
AI加速MiniMax机器学习
豆包AI更智能也更便宜:2.0版本大幅降低成本
News

豆包AI更智能也更便宜:2.0版本大幅降低成本

火山引擎的豆包大模型迎来重大升级。全新2.0版本在全面提升性能的同时,将推理成本降低了90%。四个专精模型满足不同需求,超越Gemini等竞品的多模态理解能力,以及增强的编程功能,使豆包成为AI领域的强力竞争者。开发者将受益于新开放的API接口和亲民定价策略。

February 14, 2026
AI开发机器学习科技创新