蚂蚁集团发布多语言AI框架强化文档安全
蚂蚁集团在多语言AI安全领域的突破
在最近的香港金融科技周上,蚂蚁金服科技发布了革命性的多语言多模态大模型训练框架,旨在突破AI应用中的语言障碍。这项创新解决了全球文档验证和欺诈检测中的关键挑战。
解决语言瓶颈问题
传统主要基于英语数据训练的AI模型常面临:
- 小语种中的语言混淆问题
- 跨语言场景下的推理不一致
- 资源稀缺语言环境下的性能低下
新框架在多元文化多语言视觉问答(CVQA)基准测试中获得顶尖排名,尤其在以下语种表现突出:
- 埃及阿拉伯语
- 爪哇语
- 印尼语
- 巽他语

技术创新点
该系统的突破来自三大核心组件:
- 目标语言思维机制:以各语言原生方式处理信息
- 多维奖励策略:跨语言维度精细调节模型表现
- 自动化数据解决方案:弥补小语种训练数据不足的问题
对比测试显示该框架:
- 相较同类开源模型准确率提升9.5%
- 在特定任务中超越GPT-4o和Gemini-2.5-flash
- 获得多语言VQA基准测试综合最高分
增强的安全能力
集成安全框架包含:
- 视觉分析检测图像篡改
- 常识推理识别逻辑矛盾
- 可解释AI精确定位篡改区域并提供依据
这些特性显著提升了以下场景的风险管理能力:
- 保险理赔处理
- 信贷申请审核
- 跨境贸易单证
全球部署情况
该技术目前已应用于蚂蚁集团的ZOLOZ RealDoc平台,支持:
- 119种语言的文档认证
- 复杂商业合同与贸易单据处理
- 符合国际金融监管要求
该系统在多语种文档常见的东南亚市场表现出显著成效。
核心亮点:
- 首个超越主流闭源模型的多语言框架
- 相较同类开源方案准确率提升9.5%
- 通过创新训练架构支持119种语言
- 结合视觉防伪与逻辑一致性校验
- 已应用于蚂蚁集团全球金融服务

