跳转到主要内容

Zoom以破纪录的联邦学习方法震撼AI界

Zoom用联邦学习方法重写AI游戏规则

上周,以视频通话而非尖端AI闻名的Zoom在著名的"人类终极考试"基准测试中打破性能记录,引发了人工智能领域的意外震荡。该公司以48.1%的惊人成绩,在这个被广泛认为最严苛的AI评估中险胜谷歌Gemini3Pro(45.8%)。

Image

联邦策略揭秘

Zoom首席技术官黄学东(前微软AI高管)揭示了他们的非常规方法:

  • Z-Scorer:作为决策中枢,实时评估来自各AI模型(包括竞争对手)的响应
  • 探索-验证-联合:一种让AI系统相互辩论以优化答案的智能体工作流
  • 流量控制器:本质上是协调多个模型无缝协作的智能调度系统

"我们不想在计算能力上与谷歌比拼投入," 黄解释道,"相反,我们专注于让现有技术更智能地协同工作。"

行业争议升温

这一成就引发了科技圈的激烈讨论:

像工程师Max Rumpf这样的批评者认为Zoom只是"重新包装他人成果"而缺乏实质创新。"这就像把麦当劳、汉堡王和温迪的产品组合起来赢得烹饪比赛,"他调侃道。

支持者则反驳称模型联邦代表着真正的进步。开发者朱宏成将其比作Kaggle竞赛——集成模型总是优于单一模型。"这不是作弊,而是聪明的工程,"他坚持认为。

商业影响同样重大:通过避免依赖单一AI供应商,Zoom在保持灵活性的同时规避了巨额基础设施投资。

未来展望

目前所有目光都聚焦于Zoom即将发布的AI Companion 3.0。若能将基准测试的成功转化为实际应用,或将重新定义企业实施人工智能的方式。

该进展预示着我们可能正进入一个新时代——协调现有技术与创造新技术变得同等重要,这或将缩小科技巨头与雄心勃勃挑战者之间的差距。

关键要点:

  • Zoom在著名HLE基准测试中获得破纪录分数(48.1%)
  • 采用整合多个现有AI模型的联邦方法
  • 该策略既避免昂贵模型开发又防止供应商锁定
  • 关于这是创新还是重新包装的争论仍在继续
  • 成功可能影响行业更广泛的AI实施方式

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

美团新AI模型在复杂问题解决方面表现卓越
News

美团新AI模型在复杂问题解决方面表现卓越

美团LongCat团队发布了其最新AI模型LongCat-Flash-Thinking-2601,该模型为智能搜索和推理设立了新标准。这款开源工具在编程和数学任务中表现出色,在评估中获得了最高分。它的特别之处在于独特的'重新思考模式',能够模拟人类思维过程。开发者现在可以在主流平台上获取其权重和代码。

January 16, 2026
AI开发机器学习开源技术
News

AI加速金属设计:交大与小米将轻合金研发时间缩短90%

在一项开创性合作中,上海交通大学与小米公司共同推出了一款颠覆材料科学的AI平台。他们的新系统利用专业AI代理,仅需数小时而非数月即可设计出轻量化合金——完美适用于电动汽车与航空航天领域。秘诀何在?一组数字'专家'像人类研究员一样集体研讨,但以硅基速度运行。

January 16, 2026
AI创新材料科学轻量化合金
中国AI重大突破:文心ERNIE 5.0跻身全球前十,数学能力逼近GPT
News

中国AI重大突破:文心ERNIE 5.0跻身全球前十,数学能力逼近GPT

百度最新AI模型文心ERNIE 5.0以1460分的成绩历史性位列LMArena全球排行榜第八位。更令人瞩目的是,其数学推理能力现已排名世界第二,仅次于OpenAI尚未发布的GPT-5.2。这一成就标志着中国AI技术已从单纯的'功能性'发展为真正具备国际竞争力。

January 15, 2026
人工智能文心ERNIEAI排行榜
百度文心ERNIE-5.0以全球第二数学能力登上国际舞台
News

百度文心ERNIE-5.0以全球第二数学能力登上国际舞台

百度发布了其最新AI力作——ERNIE-5.0-0110,展现出令全球瞩目的卓越能力。该模型目前在文本处理领域排名全球第八,数学能力更是高居第二,仅次于GPT-5.2-High。除了数字运算外,它还在编程、专业知识和创意写作方面取得重大进展。已在科学、金融和医疗领域证明价值的百度,邀请用户亲身体验这一技术飞跃。

January 15, 2026
AI发展中国科技机器学习
DeepSeek的记忆增强:AI模型如何变得更智能
News

DeepSeek的记忆增强:AI模型如何变得更智能

DeepSeek的研究人员开发了一种巧妙的解决方案,使大型语言模型更加高效。他们新的Engram模块就像一个心智捷径手册,帮助AI快速回忆常用短语,同时节省脑力处理更复杂的任务。早期测试显示出令人印象深刻的提升——使用Engram的模型在推理、数学和编程挑战中表现优于标准版本,同时能轻松处理更长的文本。

January 15, 2026
AI效率语言模型机器学习
印度Alpie AI模型引发轰动——但它真的是本土研发吗?
News

印度Alpie AI模型引发轰动——但它真的是本土研发吗?

印度新晋AI竞争者Alpie凭借媲美GPT-4o和Claude3.5等行业巨头的基准测试成绩引发关注。这款320亿参数的紧凑模型在数学和编程任务中表现亮眼,但技术审查显示其基于中国开源技术构建。虽然有人质疑其原创性,但Alpie的高效设计让强大AI变得前所未有的触手可及。

January 15, 2026
人工智能机器学习科技创新