跳转到主要内容

Meta推出DeepConf技术,在不牺牲准确性的前提下降低LLM成本

Meta发布DeepConf技术实现高效LLM推理

Meta AI与加州大学圣地亚哥分校合作开发了DeepConf(深度置信推理),这项创新技术旨在优化大语言模型(LLM)性能。该技术解决了AI复杂任务中平衡计算成本与推理准确性的行业关键挑战。

Image

基于置信度的创新方法

传统LLM改进策略依赖生成多条推理路径并通过多数表决选择答案。但这种暴力方法消耗大量计算资源,且可能传播低质量推理路径产生的错误。

DeepConf的突破性在于通过多重置信度指标动态评估推理质量:

  • 群体置信度:跨token片段的平均置信水平
  • 尾部置信度:最终阶段推理确定性
  • 最低群体置信度:识别脆弱推理点
  • 底部10%置信度:聚焦最不确定的片段

双模式运行机制

系统提供两种实施策略:

  1. 离线思考:首先生成完整推理路径,然后通过基于置信度的投票选择最优解
  2. 在线思考:实时评估并提前终止低置信度路径以节省资源

已验证的性能提升

在多个模型(包括DeepSeek-8B和GPT-OSS-120B)和挑战性基准测试(AIME、HMMT)中的测试显示出显著成果:

  • GPT-OSS-120B在AIME2025上达到99.9%准确率(离线模式)
  • 与传统方法相比减少84.7%的生成token量
  • DeepSeek-8B在AIME24上实现5.8个百分点的准确率提升(在线模式)
  • 在线实施中消耗的token减少77.9%

企业级部署方案

组织可根据运营需求定制DeepConf配置:

模式 成本降低 准确性影响 最佳适用场景

该技术无需模型重训练,可与vLLM和TensorRT-LLM等现有推理框架无缝集成。

核心优势

  • 🎯 精准优化:用置信度加权路径选择替代统一投票
  • 资源高效:在减少84.7%token生成的同时保持近乎完美的准确性
  • 🛠️ 灵活实施:可选择保守(高精度)或激进(高效率)模式
  • 🔌 即插即用:兼容主流推理框架且无需修改模型

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

开源AI模型存在安全风险,黑客正利用未受保护系统

SentinelOne与Censys联合研究发现数千个未受保护的开源AI模型正被黑客利用。这些常被移除安全功能的脆弱系统,正被用于生成钓鱼邮件和虚假信息等有害内容。研究人员发现25%的分析实例允许直接访问核心系统指令,其中7.5%已被恶意修改。该研究凸显了在主流平台安全措施之外,不受监管的AI部署引发的日益严重的担忧。

January 30, 2026
AI安全开源风险网络安全威胁
News

Step Star在AI竞赛中获得高达50亿元巨额融资

上海人工智能初创企业Step Star刚刚获得今年国内大模型领域最大单笔投资——惊人的50亿元。本轮融资吸引了顶级投资机构参与,同时标志着战略转型,由AI资深专家印奇出任董事长。这笔巨额资金将助力其开发世界级基础模型,并加速AI设备端集成的宏伟计划。

January 26, 2026
人工智能科技融资中国初创企业
News

达沃斯警告:教育AI需要的远不止大模型

在达沃斯论坛上,松鼠AI的梁静对教育AI泡沫发出了警示。她指出,当前依赖通用大语言模型的解决方案无法真正理解教学。真正的教育AI需要深度专业化和对学习过程的深刻理解——而不仅仅是完美的答案。

January 23, 2026
AI教育教育科技大语言模型
News

中国Kimi AI以效率突破惊艳达沃斯

在2026年达沃斯论坛上,月之暗面(Moonshot AI)的Kimi展示了其开源模型仅用美国竞争对手1%的计算能力就实现更优性能。总裁张宇婷阐释了工程优先思维如何实现这一飞跃——聚焦实际部署而非蛮力计算。该声明标志着中国正通过效率而非资源垄断展现日益增长的AI实力。

January 22, 2026
AI创新计算效率中国科技
News

Kimi新一代AI模型蓄势待发,或将挑战GPT-5

Moonshot AI旗下Kimi即将发布升级版万亿参数模型,有望在基准测试中超越GPT-5。目前正在招募企业测试人员,此次迭代基于以高性价比和卓越性能著称的K2系列。凭借48亿美元估值和雄厚资金支持,Kimi旨在突破文本处理和多模态能力的边界。

January 21, 2026
人工智能Moonshot AI大语言模型
News

腾讯AI实验室震荡:战略重组下资深负责人离职

腾讯AI部门迎来关键时刻,其AI实验室副主任兼混元项目核心架构师汤道权博士在任职八年后卸任。这家科技巨头通过从竞争对手处招揽顶尖人才并整合分散的AI资源作出回应。随着大模型竞赛白热化,腾讯的重组或将决定其能否与竞争对手保持同步。

December 29, 2025
腾讯AI领导层变动大语言模型