阿里巴巴国际发布Ovis2.5,提升AI视觉与推理能力
阿里巴巴国际发布新一代AI模型Ovis2.5
阿里巴巴国际正式推出其最新多模态大模型——Ovis2.5,现已开源。这款新一代AI聚焦于原生分辨率视觉感知、深度推理和高性价比场景设计,旨在突破人工智能应用的边界。

性能与版本
该模型在主流量化评估套件OpenCompass上获得综合得分78.3分,超越许多更大规模的模型,在少于400亿参数的开源模型中位居榜首。
Ovis2.5提供两个版本:
- Ovis2.5-9B:针对高性能应用优化,OpenCompass得分78.3
- Ovis2.5-2B:为边缘端和资源受限环境设计,在保持高效的同时获得73.9分
架构创新
研发团队在三个关键领域进行了系统性升级:
- 模型架构:延续该系列的结构化嵌入对齐设计,具备动态分辨率视觉特征提取能力,并通过Qwen3增强语言处理
- 训练策略:采用五阶段训练方案,包括视觉预训练和大规模指令微调,使用DPO和GRPO等算法提升推理能力
- 数据工程:训练数据量增加50%,重点强化视觉推理、图表识别、OCR和Grounding任务
获取方式与应用场景
代码和模型已在GitHub和Hugging Face等平台开放,全球开发者可探索其在各类AI应用中的潜力。
核心亮点:
- 🚀 SOTA性能:OpenCompass评分78.3分,领跑40B参数以下开源模型
- ⚙️ 双版本配置:Ovis2.5-9B满足高性能需求;Ovis2.5-2B适配边缘计算
- 📈 强化训练:五阶段策略配合偏好对齐算法显著提升推理能力
- 🔍 重点突破领域:扩展数据覆盖视觉推理、OCR和结构化理解




