跳转到主要内容

腾讯公布低成本AI优化方法

腾讯在高效能AI优化领域的突破

腾讯AI实验室开发了Training-Free GRPO(基于梯度的策略优化),这是一种无需传统参数微调即可优化大语言模型的革命性方法。这项创新在显著降低计算成本的同时,提供了可比的性能提升。

Training-Free GRPO工作原理

该技术将经验知识转化为标记级先验信息,使模型能在不改变核心参数的情况下实现改进。通过动态维护外部经验知识库,该方法在保持主模型架构的同时增强了能力。

Image

性能提升

在DeepSeek-V3.1-Terminus上的测试显示显著进步:

  • 数学推理:AIME24准确率从80%提升至82.7%,AIME25从67.9%提升至73.3%
  • 网络搜索任务:Pass@1指标从63.2%提高至67.8%

该方法仅使用100个跨领域训练样本就取得了这些成果,而传统方法通常需要数千个样本。

成本对比

财务影响令人震惊:

  • 传统微调:约70,000元人民币
  • Training-Free GRPO:约120元人民币

节省主要来自避免梯度反向传播和参数更新等计算密集型操作。

Image

对AI发展的意义

这一突破可能使高级AI优化技术更普及:

  • 使资源有限的小型组织也能提升模型性能
  • 保持模型跨领域的泛化能力
  • 为高效的持续学习系统开辟新可能性

研究团队承认需要在数学推理和信息检索之外更广泛的任务类别中进行进一步测试。

论文参考: Training-Free GRPO on arXiv

关键要点:

  • 以<0.2%的成本实现与传统微调相似的结果
  • 通过更新外部知识库而非模型参数实现优化
  • 在数学和搜索任务中展示出有效性
  • 对资源受限的组织尤其有价值

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

腾讯新翻译技术,口袋里的专业翻译
News

腾讯新翻译技术,口袋里的专业翻译

腾讯发布了HY-MT1.5,这是一项突破性的翻译系统,将强大的AI能力带到了移动设备上。轻量级的1.8B版本在占用极少内存的同时提供近乎即时的翻译,非常适合智能手机。而更强大的7B模型则擅长企业级复杂翻译任务。这些模型的特别之处在于它们结合了海量训练与人类反馈,能够处理从技术术语到文化差异的一切问题——同时还能保持文档格式不变。

January 5, 2026
机器翻译AI模型移动技术
腾讯WeDLM通过扩散模型突破性进展为AI推理加速
News

腾讯WeDLM通过扩散模型突破性进展为AI推理加速

腾讯微信AI团队发布了创新扩散语言模型WeDLM,该模型在保持文本生成质量的同时显著提升了速度。通过巧妙融合扩散模型与注意力机制,这项技术在特定任务中实现了比现有模型快10倍的处理速度。早期测试显示,该技术在需要快速响应的应用场景(如客服和实时问答)中表现尤为突出。

January 13, 2026
AI创新自然语言处理腾讯技术
DeepSeek-V4将于今年二月彻底革新代码生成领域
News

DeepSeek-V4将于今年二月彻底革新代码生成领域

DeepSeek正筹备在农历新年期间推出其强大的新型AI模型DeepSeek-V4。此次更新将在代码生成和处理复杂编程任务方面实现重大突破,有望超越Claude和GPT系列等竞争对手。开发者可以期待这款创新工具提供更有条理的响应和更强的推理能力。

January 12, 2026
AI发展编程工具机器学习
中国研究人员教会AI在图像生成中自我纠错
News

中国研究人员教会AI在图像生成中自我纠错

中国高校取得突破性进展,解决了AI的'视觉读写障碍'——图像系统能理解概念却难以正确呈现的问题。他们的UniCorn框架如同内部质检团队,能在创作过程中捕捉并修正错误。早期测试显示其在空间准确性和细节处理方面有显著提升。

January 12, 2026
AI创新计算机视觉机器学习
News

腾讯推出'委屈青蛙',让Z世代用AI玩转故事创作

腾讯正在测试一款名为'委屈青蛙'的创新小程序,将AI叙事与用户互动相结合。与被动的内容平台不同,它让年轻用户通过选择和指令塑造故事情节,围绕协作叙事创造社交空间。虽然仍在测试阶段,这一实验可能为TikTok世代重新定义数字娱乐。

January 9, 2026
生成式AI互动媒体腾讯
Falcon H1R7B:小巧AI模型性能超越大型竞争对手
News

Falcon H1R7B:小巧AI模型性能超越大型竞争对手

阿布扎比创新研究院发布了Falcon H1R7B,这款拥有70亿参数的开源语言模型出人意料地强大,正在改写AI性能的规则。通过将创新训练技术与混合架构相结合,这个灵活的竞争者提供的推理能力可与两倍于其大小的模型相媲美。现已在Hugging Face上提供,对于需要高效AI解决方案的开发者来说可能是一个改变游戏规则的产品。

January 6, 2026
AI创新语言模型机器学习