跳转到主要内容

阿里巴巴新型AI训练方法有望打造更稳定、更强大的语言模型

阿里巴巴突破性进展使AI训练更可靠

在快速发展的人工智能领域,阿里巴巴通义千问研究团队开发了一种可能改变游戏规则的大语言模型训练方法。他们新的软自适应策略优化(SAPO)方法解决了该领域长期存在的难题:在这些复杂系统的关键学习阶段保持其稳定性。

Image

现有方法的问题

像GRPO和GSPO这样的传统方法依赖于专家所称的"硬截断"——本质上对AI一次性调整学习参数的程度设置严格限制。虽然这可以防止灾难性错误,但也带来了重大缺陷。想象一下戴着厚手套学钢琴:你不会弄坏任何东西,但会错过演奏中的微妙差别。

"现有方法经常丢弃宝贵的学习机会,"项目首席研究员李伟博士解释道。"如果序列的某部分表现不佳,当前系统可能会丢弃整个序列——就像因为一个别扭的句子而拒绝整篇文章一样。"

SAPO的不同之处

千问团队的解决方案用更复杂的方法取代了这些粗暴的限制。SAPO采用:

  • 智能过滤:取代硬截断,使用平滑可调的阈值保留更多有用信息
  • 非对称处理:对正负学习信号采取不同处理以提高效率
  • 上下文感知:系统在序列和单个标记级别做出决策

这种方法在保持稳定性的同时,允许模型从更多经验中学习。早期测试显示该方法对专家混合模型特别有效——这些复杂架构支撑着当今最先进的AI系统。

实际性能提升

严格的多领域测试证明了其效果:

  • 数学问题:采用SAPO的模型正确解出的复杂方程多15%
  • 编程任务:生成的代码错误更少、结构更好
  • 逻辑推理:在棘手的文字问题上表现更稳定
  • 多模态挑战:能更有效地结合文本和视觉信息

"最让我们兴奋的是这些改进的广泛适用性,"李博士指出。"从技术应用到创造性任务,我们在各个方面都看到了更好的结果。"

团队已详细发表研究成果(论文链接:https://arxiv.org/abs/2511.20347),邀请全球AI社区进行同行评审和合作。

关键点:

  • 阿里巴巴SAPO方法提供了训练大语言模型的更智能方式
  • 用细致入微的自适应控制取代粗糙的"硬截断"
  • 在保持稳定性的同时保留宝贵学习信号
  • 在各种AI应用中显示出可衡量的改进
  • 对复杂的专家混合架构特别有效

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

阿里巴巴Qwen AI应用创纪录突破1亿用户
News

阿里巴巴Qwen AI应用创纪录突破1亿用户

阿里巴巴新推出的AI助手Qwen在消费市场引起轰动,据报道在发布仅两个月后月活跃用户就突破了1亿。这款被定位为'可以聊天和处理任务的个人AI助手'的应用在学生和专业人士中尤其受欢迎。虽然阿里巴巴尚未正式确认这些数字,但快速的采用表明消费者对日常生活中实用AI工具的强烈需求。

January 14, 2026
阿里巴巴AI助手消费科技
腾讯WeDLM通过扩散模型突破性进展为AI推理加速
News

腾讯WeDLM通过扩散模型突破性进展为AI推理加速

腾讯微信AI团队发布了创新扩散语言模型WeDLM,该模型在保持文本生成质量的同时显著提升了速度。通过巧妙融合扩散模型与注意力机制,这项技术在特定任务中实现了比现有模型快10倍的处理速度。早期测试显示,该技术在需要快速响应的应用场景(如客服和实时问答)中表现尤为突出。

January 13, 2026
AI创新自然语言处理腾讯技术
DeepSeek-V4将于今年二月彻底革新代码生成领域
News

DeepSeek-V4将于今年二月彻底革新代码生成领域

DeepSeek正筹备在农历新年期间推出其强大的新型AI模型DeepSeek-V4。此次更新将在代码生成和处理复杂编程任务方面实现重大突破,有望超越Claude和GPT系列等竞争对手。开发者可以期待这款创新工具提供更有条理的响应和更强的推理能力。

January 12, 2026
AI发展编程工具机器学习
中国研究人员教会AI在图像生成中自我纠错
News

中国研究人员教会AI在图像生成中自我纠错

中国高校取得突破性进展,解决了AI的'视觉读写障碍'——图像系统能理解概念却难以正确呈现的问题。他们的UniCorn框架如同内部质检团队,能在创作过程中捕捉并修正错误。早期测试显示其在空间准确性和细节处理方面有显著提升。

January 12, 2026
AI创新计算机视觉机器学习
Falcon H1R7B:小巧AI模型性能超越大型竞争对手
News

Falcon H1R7B:小巧AI模型性能超越大型竞争对手

阿布扎比创新研究院发布了Falcon H1R7B,这款拥有70亿参数的开源语言模型出人意料地强大,正在改写AI性能的规则。通过将创新训练技术与混合架构相结合,这个灵活的竞争者提供的推理能力可与两倍于其大小的模型相媲美。现已在Hugging Face上提供,对于需要高效AI解决方案的开发者来说可能是一个改变游戏规则的产品。

January 6, 2026
AI创新语言模型机器学习
腾讯新翻译技术,口袋里的专业翻译
News

腾讯新翻译技术,口袋里的专业翻译

腾讯发布了HY-MT1.5,这是一项突破性的翻译系统,将强大的AI能力带到了移动设备上。轻量级的1.8B版本在占用极少内存的同时提供近乎即时的翻译,非常适合智能手机。而更强大的7B模型则擅长企业级复杂翻译任务。这些模型的特别之处在于它们结合了海量训练与人类反馈,能够处理从技术术语到文化差异的一切问题——同时还能保持文档格式不变。

January 5, 2026
机器翻译AI模型移动技术