跳转到主要内容

阿里巴巴发布增强版Qwen-VL模型,数学与视频能力显著提升

阿里巴巴Qwen团队推出新型30B参数多模态AI模型

阿里巴巴集团Qwen(通义千问)研究部门发布了两款前沿小型多模态人工智能模型,旨在挑战行业领先基准。Qwen3-VL-30B-A3B-InstructQwen3-VL-30B-A3B-Thinking模型均采用30亿活跃参数,同时提供媲美更大架构的性能表现。

Image

技术能力与竞争定位

根据开发团队分享的内部基准测试,这些模型展现出:

  • 数学推理能力较前代Qwen提升28%
  • 实际测试场景中视频帧处理速度加快19%
  • 光学字符识别(OCR)准确率超越Claude4Sonnet

这些模型专门针对OpenAI的GPT-5-Mini和Anthropic的Claude4Sonnet架构实现竞争对标。早期测试显示其在以下方面具有突出优势:

  1. 复杂方程求解
  2. 跨模态数据解读(图像到文本)
  3. 长上下文视频分析
  4. 自主智能体协调任务

部署选项与可访问性

本次发布包含多种部署格式:

版本 精度 使用场景

开发者可通过以下渠道获取模型:

  • HuggingFace Model Hub
  • 阿里ModelScope平台
  • 通过阿里云服务直接调用API

团队还部署了基于网页的聊天界面,展示模型的对话能力。

战略意义

此次发布体现了阿里巴巴对高效、小规模AI架构的持续投入,这些架构仍保持高性能标准。FP8优化特别满足了企业对高性价比推理解决方案日益增长的需求。

Qwen团队强调其通过无需专用硬件集群即可部署的可访问模型规模,致力于"实现高性能AI民主化"。

关键要点:

  • 双模型发布分别针对指令跟随和推理任务
  • STEM相关基准测试显示15-28%的性能提升
  • 完全兼容现有阿里云AI基础设施 完整模型权重和文档现已根据商业许可条款提供。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

阿里巴巴Qwen3.5-Plus在春节前夕摘得开源AI王冠
News

阿里巴巴Qwen3.5-Plus在春节前夕摘得开源AI王冠

在新春惊喜中,阿里巴巴于除夕夜推出Qwen3.5-Plus,宣称其成为全球最强开源AI模型。这款性能怪兽以更少参数和显著降低成本的优势超越Gemini 3 Pro等竞争对手。其特别之处在于革命性架构——仅需每百万token 0.8元即可实现多模态能力,使得先进AI技术比以往任何时候都更触手可及。

February 17, 2026
Qwen3OpenSourceAIAlibabaTech
News

中国医疗AI竞赛白热化:百川模型超越GPT-5.2

2026年全球医疗AI领域竞争激烈,百川-M3等中国模型展现出超越国际巨头的惊人实力。尽管OpenAI的ChatGPT Health和谷歌的MedGemma1.5在全球引发热潮,但本土企业正凭借政策合规性和中文医疗数据优势迎头赶上。行业分析师重点指出了十大潜力中国竞争者,从综合平台到专业影像专家,标志着实用价值超越纯技术实力的新时代来临。

February 10, 2026
HealthcareAIMedicalTechnologyChinaTech
机器人现可抓握玻璃器皿,得益于突破性深度感知技术
News

机器人现可抓握玻璃器皿,得益于突破性深度感知技术

蚂蚁集团的灵波科技开源了LingBot-Depth,这是一项革命性的空间感知模型,能帮助机器人以前所未有的精度处理透明和反光物体。该系统采用先进的'掩蔽深度建模'技术,填补了立体相机缺失的深度数据,解决了机器人学中长期存在的难题。早期测试显示其准确率比现有解决方案高出70%。

January 27, 2026
RoboticsComputerVisionOpenSource
中国研究人员推出无需眼镜的3D显示技术,效果宛如魔法
News

中国研究人员推出无需眼镜的3D显示技术,效果宛如魔法

复旦大学团队开发出名为EyeReal的突破性3D显示技术,无需特殊眼镜即可投射出清晰的全息图像。该研究成果发表于《自然》杂志,系统提供100度视角且移动时无模糊效果,加上模拟人眼的真实深度感。这款紧凑设备可能彻底改变从游戏到医学影像的各个领域。

December 9, 2025
3DDisplayEyeRealHolographicTech
阿里巴巴新AI语音几乎以假乱真
News

阿里巴巴新AI语音几乎以假乱真

阿里巴巴最新文本转语音模型Qwen3-TTS以49种风格和多语言支持提供近乎自然的语音效果。该技术在准确度上超越商业竞品的同时,还向开发者提供免费访问权限。凭借即时方言切换和即将推出的声音克隆等功能,它将彻底改变我们与合成语音的交互方式。

December 8, 2025
AISpeechSynthesisAlibabaCloud
腾讯OCR技术突破:小模型,大成效
News

腾讯OCR技术突破:小模型,大成效

腾讯推出开源OCR模型HunyuanOCR,这款仅含10亿参数的轻量级模型展现出惊人性能。在文档解析和多语言翻译任务中,其表现超越体积更大的竞品,并能处理从收据到路牌等各种场景。端到端设计使其比传统方法更快输出精准结果。

November 25, 2025
OCRTencentComputerVision