跳转到主要内容

阿里巴巴新算法助力AI更接近人类思维

阿里巴巴通义实验室在AI推理领域取得突破

阿里巴巴通义实验室的研究人员开发出一种创新算法,可能彻底改变人工智能处理复杂推理任务的方式。这项名为FIPO(Future-KL Influenced Policy Optimization)的新方法,解决了大语言模型在处理多步骤问题时的一个根本性挑战:如何识别哪些信息才是真正重要的。

Image

推理瓶颈问题

当前的强化学习方法在处理长推理链时往往对所有信息一视同仁。"想象一下在解数学题时无法分辨哪些数字会影响最终答案",一位熟悉该项目的研究人员解释道,"这本质上就是这些模型面临的挑战。"

FIPO算法引入了团队所称的"Future-KL"机制。这种巧妙的方法专门奖励那些对后续推理步骤至关重要的token(AI系统中的基本信息单位)。就像在计算过程中给真正导向解决方案的步骤加分,而不是对所有步骤同等对待。

Image

实际表现

在实际测试中,FIPO展现出卓越的效果。应用于阿里巴巴的Qwen2.5-32B-Base模型时,其平均推理长度超过10,000个token——这是一个重大突破。更重要的是,它不仅能够处理更长的推理链,而且在复杂数学问题上表现得更加准确。

在纯强化学习环境中,该算法表现优于o1-mini和DeepSeek-Zero-MATH等同类模型。这些成果特别有趣的地方在于其实现方式:通过聚焦研究人员所称的"优化方向性"——本质上是教会AI识别问题解决过程中的有效路径。

重要意义

传统AI训练中的大多数token在学习前后变化极小——研究人员称之为"极度稀疏"的影响效果。常见的评估指标往往忽略了关键token中微妙但至关重要的变化。FIPO通过引入Δlog p(符号对对数概率差异)作为新的衡量标准,让开发者能更清晰地了解模型的学习过程。

这一突破出现在AI系统被越来越多地要求处理复杂多步推理任务的时代——从科学研究到金融分析皆如此。区分关键信息与非关键信息的能力,可能是开发更可靠、更强大AI助手的关键所在。

要点总结:

  • 智能聚焦: FIPO帮助AI识别并优先处理推理任务中最关键的信息
  • 更长推理: 支持处理超过10,000个token长度的推理链
  • 更高准确率: 在复杂数学问题求解方面展现显著提升
  • 新评估标准: 引入Δlog p作为追踪学习进度的更有效方法

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

阿里巴巴AI模型突破万亿令牌里程碑,登顶全球排行榜

阿里巴巴的通义千问3.6 Plus创下历史,成为首个在OpenRouter平台上日处理量突破10万亿令牌的AI模型,稳居全球排名榜首。这一成就标志着中国在AI领域日益增长的影响力,国内模型通过有竞争力的价格和快速创新赢得市场青睐。与此同时,资本市场对AI技术表现出浓厚兴趣,中国交易所交易量达到1万亿元人民币。

April 7, 2026
人工智能阿里巴巴OpenRouter
大鼠脑细胞展现惊人AI计算天赋
News

大鼠脑细胞展现惊人AI计算天赋

日本研究人员取得惊人发现——他们成功教会大鼠神经元实时执行复杂AI运算。通过将活体脑细胞与微流控技术相结合,该团队创建了一个无需外部输入即可生成复杂波形自学习系统。尽管仍面临技术障碍,这一突破可能彻底改变我们研发脑机接口和神经假体的方式。

April 7, 2026
神经计算AI研究生物技术
News

贝索斯AI实验室重磅出击:聘请OpenAI联合创始人

杰夫·贝索斯在人工智能军备竞赛中祭出大手笔,将OpenAI联合创始人凯尔·科西克招至其神秘的新实验室Project Prometheus。这个雄心勃勃的项目旨在创造真正理解物理世界的机器——随着科西克的深厚专业能力加入,这个登月计划突然变得严肃起来。科技界内部正热议这个梦之队下一步可能创造的突破。

April 7, 2026
人工智能科技行业杰夫·贝索斯
News

红熊AI完成2.1亿元A轮融资,估值突破15亿元

企业AI领域新锐红熊AI刚刚完成高达2.1亿元的A轮融资。本轮投资由华裕创投领投,多家知名机构跟投,推动公司估值突破15亿元大关。这家初创企业的独特之处在于其专注于AI系统的'记忆科学',有望彻底改变机器与物理世界的交互方式。随着今年晚些时候A+轮融资的计划和2028年香港IPO的目标,红熊AI正在竞争激烈的AI领域全速前进。

April 7, 2026
AI初创企业风险投资机器学习
News

中国AI模型连续五周领跑全球排行榜

中国AI模型已连续五周超越全球竞争对手,使用量激增31%至近13万亿token。阿里巴巴的Qwen3.6 Plus位居榜首,而美国模型仅处理了3万亿token,远远落后。这一不断扩大的差距凸显了中国在数字经济中加速发展的AI能力和市场份额。

April 7, 2026
AI中国科技机器学习
News

谷歌Gemma 4:撼动开源格局的AI巨无霸模型

谷歌即将发布新一代开源AI模型Gemma 4,其参数量预计将达到前代的四倍。传闻1200亿参数结合创新的混合专家架构,标志着谷歌重夺开源AI领域影响力的战略举措。这一可能重新定义商业与开源AI模型平衡的进展,正引发科技界密切关注。

April 2, 2026
AI开发开源技术机器学习