跳转到主要内容

阿里巴巴发布增强版Qwen-VL模型,数学与视频能力显著提升

阿里巴巴Qwen团队推出新型30B参数多模态AI模型

阿里巴巴集团Qwen(通义千问)研究部门发布了两款前沿小型多模态人工智能模型,旨在挑战行业领先基准。Qwen3-VL-30B-A3B-InstructQwen3-VL-30B-A3B-Thinking模型均采用30亿活跃参数,同时提供媲美更大架构的性能表现。

Image

技术能力与竞争定位

根据开发团队分享的内部基准测试,这些模型展现出:

  • 数学推理能力较前代Qwen提升28%
  • 实际测试场景中视频帧处理速度加快19%
  • 光学字符识别(OCR)准确率超越Claude4Sonnet

这些模型专门针对OpenAI的GPT-5-Mini和Anthropic的Claude4Sonnet架构实现竞争对标。早期测试显示其在以下方面具有突出优势:

  1. 复杂方程求解
  2. 跨模态数据解读(图像到文本)
  3. 长上下文视频分析
  4. 自主智能体协调任务

部署选项与可访问性

本次发布包含多种部署格式:

版本 精度 使用场景

开发者可通过以下渠道获取模型:

  • HuggingFace Model Hub
  • 阿里ModelScope平台
  • 通过阿里云服务直接调用API

团队还部署了基于网页的聊天界面,展示模型的对话能力。

战略意义

此次发布体现了阿里巴巴对高效、小规模AI架构的持续投入,这些架构仍保持高性能标准。FP8优化特别满足了企业对高性价比推理解决方案日益增长的需求。

Qwen团队强调其通过无需专用硬件集群即可部署的可访问模型规模,致力于"实现高性能AI民主化"。

关键要点:

  • 双模型发布分别针对指令跟随和推理任务
  • STEM相关基准测试显示15-28%的性能提升
  • 完全兼容现有阿里云AI基础设施 完整模型权重和文档现已根据商业许可条款提供。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

中国研究人员推出无需眼镜的3D显示技术,效果宛如魔法
News

中国研究人员推出无需眼镜的3D显示技术,效果宛如魔法

复旦大学团队开发出名为EyeReal的突破性3D显示技术,无需特殊眼镜即可投射出清晰的全息图像。该研究成果发表于《自然》杂志,系统提供100度视角且移动时无模糊效果,加上模拟人眼的真实深度感。这款紧凑设备可能彻底改变从游戏到医学影像的各个领域。

December 9, 2025
3DDisplayEyeRealHolographicTech
阿里巴巴新AI语音几乎以假乱真
News

阿里巴巴新AI语音几乎以假乱真

阿里巴巴最新文本转语音模型Qwen3-TTS以49种风格和多语言支持提供近乎自然的语音效果。该技术在准确度上超越商业竞品的同时,还向开发者提供免费访问权限。凭借即时方言切换和即将推出的声音克隆等功能,它将彻底改变我们与合成语音的交互方式。

December 8, 2025
AISpeechSynthesisAlibabaCloud
腾讯OCR技术突破:小模型,大成效
News

腾讯OCR技术突破:小模型,大成效

腾讯推出开源OCR模型HunyuanOCR,这款仅含10亿参数的轻量级模型展现出惊人性能。在文档解析和多语言翻译任务中,其表现超越体积更大的竞品,并能处理从收据到路牌等各种场景。端到端设计使其比传统方法更快输出精准结果。

November 25, 2025
OCRTencentComputerVision
钉钉AI表格革新双11数据处理方式
News

钉钉AI表格革新双11数据处理方式

钉钉AI表格突破行业限制,单表支持1000万'热行'数据,恰逢双11前夕。这项与阿里云合作开发的突破性技术消除了人工数据拆分需求,并提供实时分析能力。各大品牌已开始在中国最大购物节期间运用该技术转型数字战略。

November 6, 2025
DingTalkAIinRetailDouble11Tech
MiniMax即将推出M2.1 AI模型,颠覆开源市场
News

MiniMax即将推出M2.1 AI模型,颠覆开源市场

中国AI公司MiniMax将在数周内发布其下一代M2.1模型,延续其高性价比M2平台的成功。新版模型在保持公司对开源可及性和开发者友好定价承诺的同时,承诺提升推理效率和工具集成能力。

November 3, 2025
MiniMaxOpenSourceAIAIModels
清华与快手突破性成果:SVG模型将AI训练效率提升6200%
News

清华与快手突破性成果:SVG模型将AI训练效率提升6200%

清华大学与快手灵犀团队的研究人员开发出革命性的SVG扩散模型,相比传统VAE模型实现了6200%的训练效率提升和3500%的生成速度提升。这项创新在保持卓越输出质量的同时,解决了图像生成中长期存在的语义纠缠问题。

October 29, 2025
GenerativeAIComputerVisionDeepLearning