跳转到主要内容

Gemini领跑全球AI视觉竞赛,中国模型崭露头角

AI视觉霸权争夺战升温

最新的SuperCLUE-VLM12基准测试描绘出当今多模态AI领域的精彩图景。谷歌Gemini-3-pro不仅领跑全场——更以83.64分的统治级表现全面改写各项评估标准。

Image

国内挑战者崛起

本次竞赛特别引人注目的是中国模型的强劲表现。商汤科技的SenseNova V6.5Pro以75.35分夺得亚军,在视觉推理任务中展现特殊优势;字节跳动的抖音视觉版则以73.15分跻身前三,甚至在基础认知测试中超越多个国际竞争对手。

"这些结果印证了中国在计算机视觉技术领域日益增长的实力",清华大学AI研究员李伟博士指出,"三年前我们根本看不到国产模型能达到这种竞争水平"。

意外与突破

本次基准测试呈现多个重要动态:

  • 开源里程碑:阿里巴巴的Qwen3-vl成为首个突破70分大关的开源模型(70.89分),为开发者社区提供强大的视觉分析能力
  • 老牌选手失利:Anthropic的Claude-opus-4-5仅获71.44分,而OpenAI的GPT-5.2(高级版)69.16分的表现更是远低于行业预期
  • 百度稳守阵地:ERNIE-5.0-Preview保持第五名的成绩,延续中国模型的强势表现

对AI发展的启示

结果表明我们正在进入新阶段: 1) 视觉理解能力正成为区分模型的关键要素 2) 专有解决方案与开源方案之间的差距正在缩小 3) AI领域的传统实力排名未必适用于视觉能力评估

"我们看到专业化趋势正在形成",MIT教授Alan Chen解释道,"某些优化文本处理的模型在视觉任务中表现挣扎,而像Gemini这样明显优先多模态训练的模型则表现出色"。

核心要点:

  • 全球领跑者:Gemini-3-pro在基础认知(84.2)、视觉推理(83.1)和应用(83.6)三大领域均获最高分
  • 中国进步:两款国产模型现已跻身全球视觉基准测试前三强
  • 开源进展:Qwen3-vl为社区开发的视觉模型开辟新天地
  • 格局变迁:GPT等传统领军者在视觉任务中显现意外短板

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

智谱与华为联合发布完全基于国产技术的突破性AI图像模型
News

智谱与华为联合发布完全基于国产技术的突破性AI图像模型

中国AI企业智谱与华为合作推出GLM-Image,这是一款完全基于国产硬件训练的革命性多模态模型。这一创新系统结合了文本与图像生成能力,尤其在汉字渲染和复杂视觉任务方面表现优异。现已作为开源软件发布,有望使先进的AI图像创作更加普及。

January 14, 2026
AI创新国产技术计算机视觉
MIT自动化'运动工厂'赋予AI物理直觉
News

MIT自动化'运动工厂'赋予AI物理直觉

来自MIT、NVIDIA和加州大学伯克利分校的研究人员攻克了视频分析领域的一大难题——教会AI理解物理运动。他们的自动化'FoundationMotion'系统无需人工干预即可生成高质量训练数据,帮助AI系统以惊人准确度掌握轨迹与时机等概念。初期测试显示其性能超越更庞大模型,标志着机器真正理解物体运动规律的进展。

January 12, 2026
计算机视觉AI训练运动分析
中国研究人员教会AI在图像生成中自我纠错
News

中国研究人员教会AI在图像生成中自我纠错

中国高校取得突破性进展,解决了AI的'视觉读写障碍'——图像系统能理解概念却难以正确呈现的问题。他们的UniCorn框架如同内部质检团队,能在创作过程中捕捉并修正错误。早期测试显示其在空间准确性和细节处理方面有显著提升。

January 12, 2026
AI创新计算机视觉机器学习
News

阿里云新工具包为日常设备注入AI智能

阿里云发布了一款颠覆性的开发工具包,将其强大的AI模型打包成硬件制造商可即插即用的解决方案。该工具包整合了语音、视觉和语言能力,帮助智能眼镜、机器人等设备自然地理解用户并与之互动。凭借从作业辅导到创意工具等预制功能,制造商现可在数周而非数月内为其产品添加类人智能。

January 8, 2026
Alibaba CloudAI硬件智能设备
News

科技行业资深人士创立liko.ai,推出更智能的隐私保护家用摄像头

美团前硬件负责人李瑞安(Ryan Li)的新创企业liko.ai已获得商汤科技和科大讯飞关联公司的投资。这家初创公司旨在通过基于边缘的人工智能技术革新家用安防摄像头——该技术在本地而非云端处理视频,既解决了日益增长的隐私担忧,又增添了更智能的检测功能。他们的首批产品预计将于2026年年中面市。

January 7, 2026
智能家居计算机视觉边缘计算
News

智能家居初创公司liko.ai获得边缘AI视觉技术融资

人工智能初创企业liko.ai已获得首轮融资,投资方包括商汤国香资本和东方财富海等知名机构。这家由智能硬件资深人士Ryan Li领导的公司,旨在通过基于边缘的视觉语言模型(在本地而非云端处理数据)来改变家庭自动化。其AI家庭中心承诺提供更智能、更私密的智能家居体验。

January 6, 2026
边缘计算智能家居计算机视觉