跳转到主要内容

阿里巴巴Qwen3-VL在空间推理测试中超越竞争对手

阿里巴巴AI模型在空间理解领域取得突破

阿里巴巴的Qwen视觉模型在测试AI空间推理能力的严格基准SpatialBench中占据榜首。较新的Qwen3-VL获得了令人印象深刻的13.5分,而其前身Qwen2.5-VL紧随其后获得12.9分——两者均显著优于来自谷歌和OpenAI的竞争模型。

Image

SpatialBench有何特别之处?

SpatialBench评估AI系统处理现实世界空间挑战的能力——从解读工程图表到理解分子结构。它常被称为"具身智能的试金石",推动模型超越简单的图像识别,实现真正的空间理解。

Qwen3-VL脱颖而出的原因

最新版本带来了几项突破性改进:

  • 增强的3D感知:通过添加旋转边界框输出和深度估计,该模型在物体部分遮挡的杂乱环境中实现了18%的准确率提升。
  • 草图转代码功能:用户现在可以绘制粗略图表或上传短视频,系统会使用OpenCV将其直接转换为可运行的Python代码——本质上将视觉想法转化为可执行程序。
  • 灵活的扩展选项:提供从紧凑的2B版本到庞大的235B配置的不同规模选择,允许不同应用选择其理想的性能与效率平衡点。

实际应用已在推进中

阿里云报告称早期实施显示出有希望的结果:

  • 使用Qwen3-VL的物流机器人实现了2厘米以内的空间定位精度
  • AR装配系统展示了改进的零件对齐能力
  • 智能港口运营受益于增强的集装箱跟踪

公司计划到2026年发布端到端的"视觉-动作"模型,可能赋予机器人实时视觉协调能力。

可用时间表

上一代产品(Qwen2.5-VL)已经开源,而Qwen3-VL的代码和工具应于2025年年中通过阿里巴巴即将推出的Qwen App公开发布。

关键点:

  • 阿里巴巴Qwen模型在空间推理基准测试中领先
  • 新功能实现了更好的3D理解和视觉编程
  • 实际部署显示厘米级精度
  • 计划2025年开源发布

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

智谱与华为联合发布完全基于国产技术的突破性AI图像模型
News

智谱与华为联合发布完全基于国产技术的突破性AI图像模型

中国AI企业智谱与华为合作推出GLM-Image,这是一款完全基于国产硬件训练的革命性多模态模型。这一创新系统结合了文本与图像生成能力,尤其在汉字渲染和复杂视觉任务方面表现优异。现已作为开源软件发布,有望使先进的AI图像创作更加普及。

January 14, 2026
AI创新国产技术计算机视觉
MIT自动化'运动工厂'赋予AI物理直觉
News

MIT自动化'运动工厂'赋予AI物理直觉

来自MIT、NVIDIA和加州大学伯克利分校的研究人员攻克了视频分析领域的一大难题——教会AI理解物理运动。他们的自动化'FoundationMotion'系统无需人工干预即可生成高质量训练数据,帮助AI系统以惊人准确度掌握轨迹与时机等概念。初期测试显示其性能超越更庞大模型,标志着机器真正理解物体运动规律的进展。

January 12, 2026
计算机视觉AI训练运动分析
中国研究人员教会AI在图像生成中自我纠错
News

中国研究人员教会AI在图像生成中自我纠错

中国高校取得突破性进展,解决了AI的'视觉读写障碍'——图像系统能理解概念却难以正确呈现的问题。他们的UniCorn框架如同内部质检团队,能在创作过程中捕捉并修正错误。早期测试显示其在空间准确性和细节处理方面有显著提升。

January 12, 2026
AI创新计算机视觉机器学习
阿里巴巴FantasyWorld登顶全球AI模型排行榜
News

阿里巴巴FantasyWorld登顶全球AI模型排行榜

阿里巴巴旗下高德地图发布突破性'FantasyWorld'模型,迅速登上斯坦福大学WorldScore基准测试榜首。这项创新的3D世界建模技术将视频处理与几何精度相结合,为自动驾驶到虚拟导览等应用提供了前所未有的真实感。该模型已集成至高德'飞街景'功能,展现了中国在空间智能技术领域日益增长的领导地位。

January 9, 2026
AI创新空间计算阿里巴巴科技
News

科技行业资深人士创立liko.ai,推出更智能的隐私保护家用摄像头

美团前硬件负责人李瑞安(Ryan Li)的新创企业liko.ai已获得商汤科技和科大讯飞关联公司的投资。这家初创公司旨在通过基于边缘的人工智能技术革新家用安防摄像头——该技术在本地而非云端处理视频,既解决了日益增长的隐私担忧,又增添了更智能的检测功能。他们的首批产品预计将于2026年年中面市。

January 7, 2026
智能家居计算机视觉边缘计算
News

智能家居初创公司liko.ai获得边缘AI视觉技术融资

人工智能初创企业liko.ai已获得首轮融资,投资方包括商汤国香资本和东方财富海等知名机构。这家由智能硬件资深人士Ryan Li领导的公司,旨在通过基于边缘的视觉语言模型(在本地而非云端处理数据)来改变家庭自动化。其AI家庭中心承诺提供更智能、更私密的智能家居体验。

January 6, 2026
边缘计算智能家居计算机视觉