阿里巴巴国际发布Ovis2.5，提升AI视觉与推理能力欢迎来到AI DAMN！发现最震撼的最新AI新闻、最酷的AI产品和最前沿的AI项目。从ChatGPT到最新模型，我们精选让你惊呼'太牛了！'的AI发展动态。涵盖机器学习、深度学习等前沿技术，每日更新最精彩的人工智能世界。

发现

语言

账户

阿里巴巴国际发布Ovis2.5，提升AI视觉与推理能力

阿里巴巴国际发布新一代AI模型Ovis2.5

阿里巴巴国际正式推出其最新多模态大模型——Ovis2.5，现已开源。这款新一代AI聚焦于原生分辨率视觉感知、深度推理和高性价比场景设计，旨在突破人工智能应用的边界。

性能与版本

该模型在主流量化评估套件OpenCompass上获得综合得分78.3分，超越许多更大规模的模型，在少于400亿参数的开源模型中位居榜首。

Ovis2.5提供两个版本：

Ovis2.5-9B：针对高性能应用优化，OpenCompass得分78.3
Ovis2.5-2B：为边缘端和资源受限环境设计，在保持高效的同时获得73.9分

架构创新

研发团队在三个关键领域进行了系统性升级：

模型架构：延续该系列的结构化嵌入对齐设计，具备动态分辨率视觉特征提取能力，并通过Qwen3增强语言处理
训练策略：采用五阶段训练方案，包括视觉预训练和大规模指令微调，使用DPO和GRPO等算法提升推理能力
数据工程：训练数据量增加50%，重点强化视觉推理、图表识别、OCR和Grounding任务

获取方式与应用场景

代码和模型已在GitHub和Hugging Face等平台开放，全球开发者可探索其在各类AI应用中的潜力。

核心亮点：

🚀 SOTA性能：OpenCompass评分78.3分，领跑40B参数以下开源模型
⚙️ 双版本配置：Ovis2.5-9B满足高性能需求；Ovis2.5-2B适配边缘计算
📈 强化训练：五阶段策略配合偏好对齐算法显著提升推理能力
🔍 重点突破领域：扩展数据覆盖视觉推理、OCR和结构化理解

喜欢这篇文章？

订阅我们的 Newsletter，获取最新 AI 资讯、产品评测和项目推荐，每周精选直达邮箱。

每周精选完全免费随时退订

News

小红书震撼AI界：开源其Relax训练引擎

出人意料的是，生活方式平台小红书开源了其名为Relax的AI训练引擎，该引擎专为多模态场景设计。这一复杂工具通过创新的并行处理技术，能够处理文本、图像、音频和视频。这家非传统AI玩家的意外之举，显示了该公司在人工智能开发上的雄心壮志，以及其希望在科技社区中建立影响力的愿望。

April 15, 2026

AI开源机器学习

News

AI实验室AfterQuery获3000万美元融资，推动数据领域突破

人工智能研究公司AfterQuery已完成3000万美元的A轮融资，估值飙升至3亿美元。本轮融资由Altos Ventures领投，The Raine Group跟投。新资金将用于扩大公司专家网络并深化专业数据服务。值得注意的是，AfterQuery近期年收入突破1亿美元，表明其AI训练数据解决方案市场需求强劲。

April 15, 2026

AI融资机器学习科技初创公司

News

Skywork AI的Matrix-Game 3.0通过实时高清视频让虚拟世界栩栩如生

Skywork AI破解了AI视频生成的最大挑战——长期记忆。其全新Matrix-Game 3.0系统能以40帧/秒生成无缝720p世界，像虚拟导游般记住每个细节。秘诀在于相机感知记忆系统及海量游戏数据，这些数据教会AI理解真实世界的运作规律。这项突破或将彻底改变从电子游戏到机器人训练的各个领域。

April 14, 2026

AI视频生成实时渲染游戏技术

News

HarmonyGNN：AI理解复杂关系的重大突破

一种名为HarmonyGNN的新型AI训练方法正在彻底改变计算机理解数据中复杂关系的方式。由北卡罗来纳州立大学的研究人员开发，该技术帮助神经网络更好地区分图数据中不同类型的连接，实现高达9.6%的准确率提升。这一创新可能对药物发现和天气预报等领域产生重大影响。

April 14, 2026

人工智能机器学习图神经网络

News

微软全新AI模型以智能轻巧设计展现强大实力

微软发布了Phi-4-reasoning-vision-15B，这款AI模型虽轻巧却拥有惊人性能，在视觉推理任务中表现卓越。其独特之处在于能以较低计算成本提供顶级性能，非常适合资源受限的环境。成功秘诀在于高质量训练数据和创新的混合推理方法，能自动适应简单或复杂任务。该模型现已开源，或将改变我们对高效AI的认知。

April 13, 2026

微软AI多模态推理高效AI