跳转到主要内容

腾讯公布低成本AI优化方法

腾讯在高效能AI优化领域的突破

腾讯AI实验室开发了Training-Free GRPO(基于梯度的策略优化),这是一种无需传统参数微调即可优化大语言模型的革命性方法。这项创新在显著降低计算成本的同时,提供了可比的性能提升。

Training-Free GRPO工作原理

该技术将经验知识转化为标记级先验信息,使模型能在不改变核心参数的情况下实现改进。通过动态维护外部经验知识库,该方法在保持主模型架构的同时增强了能力。

Image

性能提升

在DeepSeek-V3.1-Terminus上的测试显示显著进步:

  • 数学推理:AIME24准确率从80%提升至82.7%,AIME25从67.9%提升至73.3%
  • 网络搜索任务:Pass@1指标从63.2%提高至67.8%

该方法仅使用100个跨领域训练样本就取得了这些成果,而传统方法通常需要数千个样本。

成本对比

财务影响令人震惊:

  • 传统微调:约70,000元人民币
  • Training-Free GRPO:约120元人民币

节省主要来自避免梯度反向传播和参数更新等计算密集型操作。

Image

对AI发展的意义

这一突破可能使高级AI优化技术更普及:

  • 使资源有限的小型组织也能提升模型性能
  • 保持模型跨领域的泛化能力
  • 为高效的持续学习系统开辟新可能性

研究团队承认需要在数学推理和信息检索之外更广泛的任务类别中进行进一步测试。

论文参考: Training-Free GRPO on arXiv

关键要点:

  • 以<0.2%的成本实现与传统微调相似的结果
  • 通过更新外部知识库而非模型参数实现优化
  • 在数学和搜索任务中展示出有效性
  • 对资源受限的组织尤其有价值

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

腾讯推出SkillHub:中国AI开发者的游戏规则改变者

腾讯发布了专为中国开发者打造的AI社区SkillHub。该平台提供超过13,000种现成AI技能,解决了下载速度慢和语言障碍等常见痛点。SkillHub不仅数量庞大——还提供精选排名和完整中文支持以简化开发流程。随着腾讯将这些工具整合到腾讯文档等热门应用中,他们正大力推动AI在全国范围内的普及。

March 12, 2026
AI开发腾讯中国科技
腾讯WorldCompass助力AI模型驾驭复杂指令
News

腾讯WorldCompass助力AI模型驾驭复杂指令

腾讯开源了强化学习框架WorldCompass,显著提升AI世界模型理解和执行复杂指令的能力。这一突破解决了长期存在的准确性问题,在挑战性场景中性能提升超过35%。该技术标志着从纯预训练转向精细化微调方法的转变。

March 11, 2026
AI开发腾讯机器学习
腾讯WorkBuddy智能升级:现与微信无缝协作
News

腾讯WorkBuddy智能升级:现与微信无缝协作

腾讯桌面AI助手WorkBuddy迎来重大升级。新版支持与微信无缝连接——只需扫描二维码即可远程操控任务。除了优化与QQ和飞书的集成外,WorkBuddy现在还能处理自动生成报告、会议纪要等工作流。腾讯正全力推动AI助手在实际工作场景中的应用价值。

March 12, 2026
腾讯AI助手职场自动化
微信AI助手将于2026年彻底改变小程序体验
News

微信AI助手将于2026年彻底改变小程序体验

腾讯正在秘密开发一款微信AI助手,或将彻底改变用户与小程序的交互方式。这款智能代理计划于2026年年中开始测试,旨在通过简单语音指令处理打车、外卖等服务。该项目展现了微信进军AI领域的雄心,可能将这个拥有14亿用户的平台打造成一站式'智能任务中心'。

March 11, 2026
微信AI助手腾讯
谢赛宁团队发布Solaris:多用户视频AI领域的重大突破
News

谢赛宁团队发布Solaris:多用户视频AI领域的重大突破

谢赛宁研究团队推出了全球首个多用户视频世界模型Solaris,该模型由昆仑万智的Matrix-Game2.0提供支持。这项创新技术提升了玩家在《我的世界》等环境中的互动体验,表现优于以往解决方案。此次发布恰逢谢赛宁的AI公司AMI获得重大融资里程碑,凸显了世界模型在推动通用人工智能发展中的日益重要性。

March 11, 2026
人工智能机器学习虚拟世界
腾讯AI智能体突破聊天机器人范畴,推出全新任务自动化工具
News

腾讯AI智能体突破聊天机器人范畴,推出全新任务自动化工具

腾讯发布名为'龙虾特战队'的AI智能体阵容,从对话走向行动。该套件包含办公助手WorkBuddy、手机控制工具QClaw以及具备强大安全功能的企业解决方案。这些工具旨在让人人都能使用AI驱动的自动化技术,同时解决部署与安全问题。

March 10, 2026
腾讯AI自动化数字化办公