跳转到主要内容

阿里巴巴新型AI训练方法有望打造更稳定、更强大的语言模型

阿里巴巴突破性进展使AI训练更可靠

在快速发展的人工智能领域,阿里巴巴通义千问研究团队开发了一种可能改变游戏规则的大语言模型训练方法。他们新的软自适应策略优化(SAPO)方法解决了该领域长期存在的难题:在这些复杂系统的关键学习阶段保持其稳定性。

Image

现有方法的问题

像GRPO和GSPO这样的传统方法依赖于专家所称的"硬截断"——本质上对AI一次性调整学习参数的程度设置严格限制。虽然这可以防止灾难性错误,但也带来了重大缺陷。想象一下戴着厚手套学钢琴:你不会弄坏任何东西,但会错过演奏中的微妙差别。

"现有方法经常丢弃宝贵的学习机会,"项目首席研究员李伟博士解释道。"如果序列的某部分表现不佳,当前系统可能会丢弃整个序列——就像因为一个别扭的句子而拒绝整篇文章一样。"

SAPO的不同之处

千问团队的解决方案用更复杂的方法取代了这些粗暴的限制。SAPO采用:

  • 智能过滤:取代硬截断,使用平滑可调的阈值保留更多有用信息
  • 非对称处理:对正负学习信号采取不同处理以提高效率
  • 上下文感知:系统在序列和单个标记级别做出决策

这种方法在保持稳定性的同时,允许模型从更多经验中学习。早期测试显示该方法对专家混合模型特别有效——这些复杂架构支撑着当今最先进的AI系统。

实际性能提升

严格的多领域测试证明了其效果:

  • 数学问题:采用SAPO的模型正确解出的复杂方程多15%
  • 编程任务:生成的代码错误更少、结构更好
  • 逻辑推理:在棘手的文字问题上表现更稳定
  • 多模态挑战:能更有效地结合文本和视觉信息

"最让我们兴奋的是这些改进的广泛适用性,"李博士指出。"从技术应用到创造性任务,我们在各个方面都看到了更好的结果。"

团队已详细发表研究成果(论文链接:https://arxiv.org/abs/2511.20347),邀请全球AI社区进行同行评审和合作。

关键点:

  • 阿里巴巴SAPO方法提供了训练大语言模型的更智能方式
  • 用细致入微的自适应控制取代粗糙的"硬截断"
  • 在保持稳定性的同时保留宝贵学习信号
  • 在各种AI应用中显示出可衡量的改进
  • 对复杂的专家混合架构特别有效

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

谷歌Gemini 3将AI推理能力推向科学新高度

谷歌发布Gemini 3 Deep Think,标志着AI能力在日常对话之外的重大飞跃。这款专业模型以奥林匹克竞赛级别的推理能力解决复杂科学问题,在数学和编程挑战中表现惊人。现已面向精选研究人员和Google AI Ultra订阅用户开放,有望从基准测试冠军转型为真正的实验室伙伴。

February 13, 2026
AI研究机器学习科学计算
马斯克的Grok AI更聪明了:4.2测试版发布,学习速度大幅提升
News

马斯克的Grok AI更聪明了:4.2测试版发布,学习速度大幅提升

埃隆·马斯克的xAI公司发布了Grok 4.2公开测试版,具备突破性的快速学习能力。与以往版本不同,用户需手动选择才能体验这些新功能。马斯克正积极寻求用户反馈,以完善他口中'学习速度最快的AI'。该更新承诺能更快适应新信息,提供更精准的响应。

February 18, 2026
Grok AIElon Musk人工智能
阿里巴巴Qwen3.5-Plus为开源AI模型树立新标杆
News

阿里巴巴Qwen3.5-Plus为开源AI模型树立新标杆

正值农历新年庆祝之际,阿里巴巴发布了具有突破性的开源AI模型Qwen3.5-Plus,该模型在保持惊人成本效益的同时性能超越竞争对手。凭借革命性架构和多模态能力,这款模型的顶级性能仅需Gemini 3 Pro等替代方案的一小部分成本。早期基准测试显示,其在关键评估中甚至超越了GPT-5.2和Claude 4.5。

February 17, 2026
人工智能开源技术机器学习
MiniMax全新AI模型带来极速性能提升
News

MiniMax全新AI模型带来极速性能提升

MiniMax最新推出的M2.5-highspeed模型以其惊人的性能飞跃引发关注。该升级版本比竞品快三倍,承诺为50多个集成平台提供更流畅的AI体验。公司通过新定价方案和特别节日折扣庆祝这一成功。

February 16, 2026
AI加速MiniMax机器学习
豆包AI更智能也更便宜:2.0版本大幅降低成本
News

豆包AI更智能也更便宜:2.0版本大幅降低成本

火山引擎的豆包大模型迎来重大升级。全新2.0版本在全面提升性能的同时,将推理成本降低了90%。四个专精模型满足不同需求,超越Gemini等竞品的多模态理解能力,以及增强的编程功能,使豆包成为AI领域的强力竞争者。开发者将受益于新开放的API接口和亲民定价策略。

February 14, 2026
AI开发机器学习科技创新
蚂蚁集团万亿参数AI模型取得新突破
News

蚂蚁集团万亿参数AI模型取得新突破

蚂蚁集团发布具有里程碑意义的万亿参数AI模型Ring-2.5-1T,该开源模型在数学推理和长文本处理方面树立了新标杆。这款突破性模型在复杂任务中超越竞争对手,同时显著提升效率——从解决奥数级别数学题到驱动AI助手,标志着人工智能能力的重大飞跃。

February 13, 2026
AI创新机器学习开源技术