跳转到主要内容

阿里巴巴国际发布Ovis2.5,提升AI视觉与推理能力

阿里巴巴国际发布新一代AI模型Ovis2.5

阿里巴巴国际正式推出其最新多模态大模型——Ovis2.5,现已开源。这款新一代AI聚焦于原生分辨率视觉感知深度推理高性价比场景设计,旨在突破人工智能应用的边界。

Image

性能与版本

该模型在主流量化评估套件OpenCompass上获得综合得分78.3分,超越许多更大规模的模型,在少于400亿参数的开源模型中位居榜首。

Ovis2.5提供两个版本:

  • Ovis2.5-9B:针对高性能应用优化,OpenCompass得分78.3
  • Ovis2.5-2B:为边缘端和资源受限环境设计,在保持高效的同时获得73.9分

架构创新

研发团队在三个关键领域进行了系统性升级:

  1. 模型架构:延续该系列的结构化嵌入对齐设计,具备动态分辨率视觉特征提取能力,并通过Qwen3增强语言处理
  2. 训练策略:采用五阶段训练方案,包括视觉预训练和大规模指令微调,使用DPO和GRPO等算法提升推理能力
  3. 数据工程:训练数据量增加50%,重点强化视觉推理、图表识别、OCR和Grounding任务

获取方式与应用场景

代码和模型已在GitHubHugging Face等平台开放,全球开发者可探索其在各类AI应用中的潜力。

核心亮点:

  • 🚀 SOTA性能:OpenCompass评分78.3分,领跑40B参数以下开源模型
  • ⚙️ 双版本配置:Ovis2.5-9B满足高性能需求;Ovis2.5-2B适配边缘计算
  • 📈 强化训练:五阶段策略配合偏好对齐算法显著提升推理能力
  • 🔍 重点突破领域:扩展数据覆盖视觉推理、OCR和结构化理解

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

小红书震撼AI界:开源其Relax训练引擎

出人意料的是,生活方式平台小红书开源了其名为Relax的AI训练引擎,该引擎专为多模态场景设计。这一复杂工具通过创新的并行处理技术,能够处理文本、图像、音频和视频。这家非传统AI玩家的意外之举,显示了该公司在人工智能开发上的雄心壮志,以及其希望在科技社区中建立影响力的愿望。

April 15, 2026
AI开源机器学习
AI实验室AfterQuery获3000万美元融资,推动数据领域突破
News

AI实验室AfterQuery获3000万美元融资,推动数据领域突破

人工智能研究公司AfterQuery已完成3000万美元的A轮融资,估值飙升至3亿美元。本轮融资由Altos Ventures领投,The Raine Group跟投。新资金将用于扩大公司专家网络并深化专业数据服务。值得注意的是,AfterQuery近期年收入突破1亿美元,表明其AI训练数据解决方案市场需求强劲。

April 15, 2026
AI融资机器学习科技初创公司
Skywork AI的Matrix-Game 3.0通过实时高清视频让虚拟世界栩栩如生
News

Skywork AI的Matrix-Game 3.0通过实时高清视频让虚拟世界栩栩如生

Skywork AI破解了AI视频生成的最大挑战——长期记忆。其全新Matrix-Game 3.0系统能以40帧/秒生成无缝720p世界,像虚拟导游般记住每个细节。秘诀在于相机感知记忆系统及海量游戏数据,这些数据教会AI理解真实世界的运作规律。这项突破或将彻底改变从电子游戏到机器人训练的各个领域。

April 14, 2026
AI视频生成实时渲染游戏技术
HarmonyGNN:AI理解复杂关系的重大突破
News

HarmonyGNN:AI理解复杂关系的重大突破

一种名为HarmonyGNN的新型AI训练方法正在彻底改变计算机理解数据中复杂关系的方式。由北卡罗来纳州立大学的研究人员开发,该技术帮助神经网络更好地区分图数据中不同类型的连接,实现高达9.6%的准确率提升。这一创新可能对药物发现和天气预报等领域产生重大影响。

April 14, 2026
人工智能机器学习图神经网络
微软全新AI模型以智能轻巧设计展现强大实力
News

微软全新AI模型以智能轻巧设计展现强大实力

微软发布了Phi-4-reasoning-vision-15B,这款AI模型虽轻巧却拥有惊人性能,在视觉推理任务中表现卓越。其独特之处在于能以较低计算成本提供顶级性能,非常适合资源受限的环境。成功秘诀在于高质量训练数据和创新的混合推理方法,能自动适应简单或复杂任务。该模型现已开源,或将改变我们对高效AI的认知。

April 13, 2026
微软AI多模态推理高效AI
小米AI模型加入领先开源框架并开放免费试用
News

小米AI模型加入领先开源框架并开放免费试用

小米将其MiMo-V2系列AI模型集成至开源AI开发主流框架Hermes Agent中。开发者现可免费试用两周小米的Pro、Omni和Flash模型。此次合作结合了小米的硬件专长与Hermes的自我进化能力,为AI助手带来新的可能性。此举标志着AI竞争焦点正从对话质量转向执行效率。

April 10, 2026
小米AI开发开源