跳转到主要内容

Meta推出DeepConf技术,在不牺牲准确性的前提下降低LLM成本

Meta发布DeepConf技术实现高效LLM推理

Meta AI与加州大学圣地亚哥分校合作开发了DeepConf(深度置信推理),这项创新技术旨在优化大语言模型(LLM)性能。该技术解决了AI复杂任务中平衡计算成本与推理准确性的行业关键挑战。

Image

基于置信度的创新方法

传统LLM改进策略依赖生成多条推理路径并通过多数表决选择答案。但这种暴力方法消耗大量计算资源,且可能传播低质量推理路径产生的错误。

DeepConf的突破性在于通过多重置信度指标动态评估推理质量:

  • 群体置信度:跨token片段的平均置信水平
  • 尾部置信度:最终阶段推理确定性
  • 最低群体置信度:识别脆弱推理点
  • 底部10%置信度:聚焦最不确定的片段

双模式运行机制

系统提供两种实施策略:

  1. 离线思考:首先生成完整推理路径,然后通过基于置信度的投票选择最优解
  2. 在线思考:实时评估并提前终止低置信度路径以节省资源

已验证的性能提升

在多个模型(包括DeepSeek-8B和GPT-OSS-120B)和挑战性基准测试(AIME、HMMT)中的测试显示出显著成果:

  • GPT-OSS-120B在AIME2025上达到99.9%准确率(离线模式)
  • 与传统方法相比减少84.7%的生成token量
  • DeepSeek-8B在AIME24上实现5.8个百分点的准确率提升(在线模式)
  • 在线实施中消耗的token减少77.9%

企业级部署方案

组织可根据运营需求定制DeepConf配置:

模式 成本降低 准确性影响 最佳适用场景

该技术无需模型重训练,可与vLLM和TensorRT-LLM等现有推理框架无缝集成。

核心优势

  • 🎯 精准优化:用置信度加权路径选择替代统一投票
  • 资源高效:在减少84.7%token生成的同时保持近乎完美的准确性
  • 🛠️ 灵活实施:可选择保守(高精度)或激进(高效率)模式
  • 🔌 即插即用:兼容主流推理框架且无需修改模型

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Moonshot AI与清华大学开创提升AI模型性能的新方法
News

Moonshot AI与清华大学开创提升AI模型性能的新方法

Moonshot AI与清华大学公布了一项名为PrfaaS的创新架构,解决了大语言模型的计算能力挑战。通过在不同数据中心分离预填充和解码阶段,他们的解决方案将吞吐量提升了54%,同时降低了延迟。这一突破可能彻底改变我们大规模部署AI服务的方式。

April 20, 2026
AI创新计算架构大语言模型
News

腾讯QBotClaw:用AI开启更智能的浏览方式

腾讯推出中国首款支持连接主流大语言模型的AI浏览器QBotClaw,将浏览器从简单的网页入口转变为能处理复杂任务的智能助手。凭借跨平台控制和视觉识别等功能,QBotClaw致力于让人人都能使用先进AI技术。Mac版本已上线,Windows版本即将推出。

April 8, 2026
AI浏览器腾讯QBotClaw
小米MiMo AI模型推出订阅制:为开发者提供经济实惠的方案
News

小米MiMo AI模型推出订阅制:为开发者提供经济实惠的方案

小米为其MiMo大语言模型推出了订阅服务,提供四档价格方案,每月仅需39元起。此举标志着小米进军AI商业化领域,套餐涵盖文本、图像和音频处理能力。目前MiMo-V2-Pro模型位列全球前五,每周处理超过4万亿token。行业观察者认为这将彻底改变开发者的AI成本预算方式。

April 3, 2026
小米AI订阅大语言模型
News

抖音AI模型日处理量突破12万亿token——两年激增1000倍

字节跳动豆包大语言模型以日均12万亿token的处理量刷新纪录——较2024年实现了惊人的1000倍增长。这一爆发式增长标志着中国AI行业正从实验性模型转向实际应用。随着国产模型在某些领域超越国外竞品,云服务商正争相抢占token经济红利。

April 2, 2026
AI趋势字节跳动大语言模型
中国AI模型性能超越全球竞争对手,OpenClaw推动需求激增
News

中国AI模型性能超越全球竞争对手,OpenClaw推动需求激增

中国自主研发的大语言模型首次在全球使用量上持续一个月超越国际竞争对手。最新数据显示,国产模型现已占据前九名中的六个席位,其中OpenClaw意外成为市场领导者。这一重大转变源于AI智能体正在改变我们与技术的交互方式,引发了对计算能力的空前需求,并促使中国科技行业出现大规模价格调整。

March 31, 2026
人工智能中国科技大语言模型
News

小米豪赌AI:发布万亿参数模型并追加23亿美元投资

小米发布了三款强大的新AI模型,其中包括一款万亿参数的旗舰模型,作为其积极进军人工智能领域的一部分。创始人雷军宣布追加23亿美元用于AI研发,彰显了公司在该领域的雄心壮志。这些新模型有望通过先进的推理能力、多模态理解和情感感知语音功能彻底改变设备与用户的交互方式——而且价格极具竞争力。

March 19, 2026
小米人工智能大语言模型