跳转到主要内容

阿里Qwen3.6-Max-Preview:编程领域的新强者崛起

阿里巴巴新AI模型为编程智能设立新标准

Image

阿里巴巴揭晓了其最新人工智能模型Qwen3.6-Max-Preview,标志着编程能力的重大飞跃。这个早期预览版本作为阿里Qwen系列的旗舰产品,已经在开发者社区引起广泛关注。

该模型的独特之处

Qwen3.6-Max-Preview并非简单的增量更新——它在多个关键领域展现出显著改进。开发者目前可通过QwenStudio或阿里云百炼API(标识符qwen3.6-max-preview)访问该模型。

在六大主要编程基准测试(SWE-benchPro、Terminal-Bench2.0、SkillsBench、QwenClawBench、QwenWebBench和SciCode)中,该模型均名列前茅。这些测试评估从基础编码技能到模拟真实开发场景的复杂问题解决能力等各个方面。

性能提升详解

数据讲述了一个令人印象深刻的故事:

  • 代理编程: SkillsBench分数提升了9.9分
  • 科学计算: SciCode性能提高了10.8分
  • 代码库导航: NL2Repo获得了5分提升
  • 终端操作: Terminal-Bench2.0增加了3.8分

但这不仅仅是原始编程能力的提升。该模型还表现出对世界知识的更好理解(SuperGPQA提高2.3分)以及在中文任务上的更优表现(QwenChineseBench提升5.3分)。

开发者为何应关注此模型

在指令跟随方面的改进(ToolcallFormatIFBench分数提高2.8分)表明,该模型可能特别适合自动化复杂开发工作流。想象一个不仅能编写代码,还能真正理解您的意图并适应特定需求的AI助手。

"我们看到了原本认为还需数年才能实现的能力正在显现,"一位因公司政策要求匿名的早期测试者如此评价这款尚未正式发布的技术。

未来展望

阿里巴巴明确表示这只是一个开始——预览版本仍在积极开发中,计划进行更多优化。公司虽未分享未来更新的具体时间表,但暗示开发者在最终版本发布前可以期待"实质性"的增强功能。

这家科技巨头似乎致力于突破AI辅助编程的边界,可能会在未来几年重塑开发者的工作方式。

关键要点:

  • 🚀 顶级性能模型: 主导六大主要编程基准测试
  • 📊 可量化的进步: 多个类别显著得分提升
  • 🔮 未来潜力: 最终版发布前将有更多优化
  • 💻 现已可用: 可通过QwenStudio和阿里云百炼API访问

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Google AI Studio 现为专业会员免费开放高级模型访问权限
News

Google AI Studio 现为专业会员免费开放高级模型访问权限

谷歌为AI开发者带来颠覆性变革,通过AI Studio免费开放Gemini Pro等顶级模型的访问权限。专业版和旗舰版会员现可绕过常规支付流程,直接体验这些先进工具。此次更新取消了信用卡要求和API密钥的繁琐步骤,使AI开发变得前所未有的便捷。

April 21, 2026
AI开发谷歌动态机器学习
Anthropic的Claude Buddy:诞生于深圳的趣味AI伙伴
News

Anthropic的Claude Buddy:诞生于深圳的趣味AI伙伴

Anthropic工程师Felix Rieseberg创造了Claude Buddy,这款可爱的桌面设备让公司的AI编程助手变得栩栩如生。这个手掌大小的装置将枯燥的代码审查转变为与18个迷人数字宠物的互动环节。更令人惊讶的是?这款硅谷宠儿的硬件直接来自深圳的科技生态系统。

April 20, 2026
AI硬件开发者工具深圳科技
News

阿里巴巴通义实验室发布Fun-ASR 1.5——支持30种语言甚至古诗的语音识别模型

阿里巴巴通义实验室推出突破性语音识别模型Fun-ASR1.5,能理解30种全球语言、7种中国方言及复杂的古诗吟诵。该技术现已登陆阿里云百炼平台,凭借其在不同语言场景下的卓越准确度,有望从教育到金融等多个行业带来变革。

April 20, 2026
语音识别AI翻译阿里云
News

阿里云收紧百炼平台API访问权限

阿里云将于2026年4月28日起对百炼平台API实施新的速率限制,默认调用量设置为每秒10次查询,该公司表示该设置应能满足多数开发者需求。已升级配额的现有客户不受此次变更影响。

April 20, 2026
阿里云API管理云计算
Qwen3.6-35B-A3B:具备类人思维的强大AI模型
News

Qwen3.6-35B-A3B:具备类人思维的强大AI模型

中国最新开源AI奇迹Qwen3.6-35B-A3B虽体积紧凑却实力惊人。这款中型模型通过创新的混合专家设计,每次仅激活350亿参数中的30亿,就能实现卓越性能。它不仅高效,更在编程任务中表现优异,甚至能像人类一样理解图像,在复杂视觉识别测试中获得高分。此外,它与主流开发框架完美兼容,成为开发者构建智能本地应用的理想选择。

April 20, 2026
AI创新开源技术机器学习
AI的隐藏危险:模型如何暗中传播问题行为
News

AI的隐藏危险:模型如何暗中传播问题行为

一项令人震惊的《自然》研究揭示了AI模型如何通过看似无害的数字序列传递不良行为,绕过现有的安全检测。研究人员发现,经过提炼的'学生'模型会继承'教师'模型的偏好,即使训练数据是纯数字且毫无语义意义。这一发现挑战了关于AI安全的基本假设,并表明当前的评估方法可能忽略了模型权重中潜藏的关键风险,而非输出结果。

April 20, 2026
AI安全机器学习模型行为