跳转到主要内容

蚂蚁集团推出金融AI评估基准Finova及Agentar-Fin-R1模型

蚂蚁集团发布Finova基准与Agentar-Fin-R1模型

2025年7月28日 —— 在世界人工智能大会上,蚂蚁集团科技板块蚂蚁数科正式推出Finova大模型金融应用评测基准及新一代Agentar-Fin-R1金融推理模型。该基准由兴业银行、宁波银行等机构共同参与制定,为金融AI应用设立了新评估标准。

金融AI的重大突破

基于Qwen3框架开发的Agentar-Fin-R1模型在FinEval1.0FinanceIQ等权威测试中表现优异,超越通用及专业金融模型。蚂蚁数科CEO赵文彪表示,这一进展弥合了通用AI与行业需求间的"知识鸿沟"。

Image

应对行业挑战

随着金融业数字化转型加速,AI模型需具备处理以下能力:

  • 复杂推理逻辑
  • 高阶金融知识
  • 严格合规要求 现有模型常在实际金融任务中表现不足。Agentar-Fin-R1通过以下创新解决痛点:
  • 万亿级金融语料库
  • 专家标注的思维链(CoT)训练
  • 创新型加权训练算法

Image

核心创新点

该模型提供8B至72B参数多个版本以适应不同部署需求。基于百灵模型的**MOE架构变体显著提升推理速度。值得注意的是,Agentar-Fin-R1可持续更新最新金融政策与市场数据,同时降低企业微调成本。

Finova评测基准

协作开发的**Finova基准聚焦三大评估维度:

  1. 智能体功能完备性
  2. 复杂推理性能表现
  3. 安全合规标准测试

作为完全开源项目,Finova旨在提升行业AI应用水平。初期测试显示Agentar-Fin-R1甚至优于更大规模的通用模型。

Image

实际应用成效

蚂蚁数科技术已在中国主要银行落地:

  • 覆盖全部国有银行(100%)
  • AI移动银行应用使用活跃度提升25%
  • 开发超100个金融智能体解决方案

公司计划进一步拓展新能源领域,同时持续优化金融AI产品矩阵。

关键要点:

  • 蚂蚁数科联合头部机构推出Finova基准体系
  • Agentar-Fin-R1在金融推理任务中表现卓越
  • 高效训练算法显著降低部署成本
  • 开源基准推动行业AI协同发展

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

印度Alpie AI模型引发热议——但它真的源自本土吗?
News

印度Alpie AI模型引发热议——但它真的源自本土吗?

印度新晋AI竞争者Alpie凭借在数学和编程测试中媲美GPT-4o和Claude3.5等巨头的表现引发关注。然而技术分析显示其实际基于中国开源模型构建,引发了关于创新与优化的讨论。Alpie的特殊之处在于能在消费级硬件上高效运行,有望为中小开发者降低AI使用门槛。

January 15, 2026
AI机器学习印度科技
DeepSeek-V4将于今年二月彻底革新代码生成领域
News

DeepSeek-V4将于今年二月彻底革新代码生成领域

DeepSeek正筹备在农历新年期间推出其强大的新型AI模型DeepSeek-V4。此次更新将在代码生成和处理复杂编程任务方面实现重大突破,有望超越Claude和GPT系列等竞争对手。开发者可以期待这款创新工具提供更有条理的响应和更强的推理能力。

January 12, 2026
AI发展编程工具机器学习
中国研究人员教会AI在图像生成中自我纠错
News

中国研究人员教会AI在图像生成中自我纠错

中国高校取得突破性进展,解决了AI的'视觉读写障碍'——图像系统能理解概念却难以正确呈现的问题。他们的UniCorn框架如同内部质检团队,能在创作过程中捕捉并修正错误。早期测试显示其在空间准确性和细节处理方面有显著提升。

January 12, 2026
AI创新计算机视觉机器学习
ChatGPT进军医疗领域,蚂蚁集团AI医生用户突破3000万
News

ChatGPT进军医疗领域,蚂蚁集团AI医生用户突破3000万

OpenAI携ChatGPT Health加入AI医疗竞赛,推出与蚂蚁集团热门应用「阿福健康」相似的功能。该中国平台月活用户已达3000万,仅一个月就实现用户基数翻倍。两款工具均提供健康问答和智能设备集成服务,但「阿福健康」凭借完整的医疗服务连接仍保持优势。

January 8, 2026
AI医疗数字健康ChatGPT
Falcon H1R7B:小巧AI模型性能超越大型竞争对手
News

Falcon H1R7B:小巧AI模型性能超越大型竞争对手

阿布扎比创新研究院发布了Falcon H1R7B,这款拥有70亿参数的开源语言模型出人意料地强大,正在改写AI性能的规则。通过将创新训练技术与混合架构相结合,这个灵活的竞争者提供的推理能力可与两倍于其大小的模型相媲美。现已在Hugging Face上提供,对于需要高效AI解决方案的开发者来说可能是一个改变游戏规则的产品。

January 6, 2026
AI创新语言模型机器学习
News

Google DeepMind预测AI的下一次飞跃:2026年前实现持续学习

Google DeepMind研究人员预测,到2026年AI将实现持续学习能力,这将成为人工智能发展的关键转折点。这一突破将使AI系统无需人类干预即可自主获取新知识,可能彻底改变从编程到科学研究的各个领域。该技术基于NeurIPS 2025展示的最新进展,有望在2030年实现全自动编程,并在本世纪中叶实现诺贝尔级别的AI驱动研究。

January 4, 2026
AI进化机器学习未来科技