跳转到主要内容

微软论文无意中揭示AI模型参数

微软论文揭示AI模型参数

微软于12月26日发布的一篇研究论文无意中披露了多个大型语言模型的参数大小,包括OpenAI和Anthropic开发的模型。这一揭示引发了关于模型架构和技术能力的讨论,特别是与医疗AI评估相关的讨论。

根据论文中详细的研究结果,OpenAI的o1-preview模型拥有大约3000亿参数,而其GPT-4o模型包含约2000亿参数。值得注意的是,GPT-4o-mini变种报告仅有80亿参数。这与Nvidia之前声称的GPT-4模型采用的1.76万亿MoE架构形成了鲜明对比。论文还指出,Anthropic的Claude3.5Sonnet模型大约有1750亿参数。

image

这并不是微软首次在其出版物中披露模型参数。十月份,该公司透露GPT-3.5-Turbo模型由200亿参数组成,尽管此信息后来在更新中被删除。这种反复的披露引发了业内人士的猜测,认为这些泄露是故意的还是只是疏忽。

image

该论文的主要重点是介绍一个医疗领域基准测试,称为MEDEC。研究团队分析了来自美国三家医院的488份临床记录,以评估各种模型在识别和纠正医疗文件中的错误方面的能力。结果显示,Claude3.5Sonnet在错误检测方面优于其竞争对手,得分为70.16。

image

所披露数据的真实性引发了业内的激烈讨论。一些专家认为,如果Claude3.5Sonnet能够在较少的参数下有效执行,这将突显Anthropic的技术实力。相反,其他分析师则建议某些参数估计可能与模型定价结构相关。

image

有趣的是,尽管论文对多个主流模型进行了参数估算,但显著地省略了关于谷歌Gemini的具体细节。分析师推测,这一省略可能源于Gemini使用TPU而非Nvidia GPU,这使得基于令牌生成速度进行准确估算更加复杂。

image

随着OpenAI日益淡化其对开源倡议的承诺,模型参数等核心信息的披露仍然是业内关注的焦点。这一意外泄露促使重新讨论AI模型架构、技术发展路径和行业竞争。

参考文献:

  1. 微软最近的论文揭示了包括OpenAI和Anthropic在内的各种AI模型的参数大小。
  2. 该论文介绍了一个用于医疗AI的基准测试MEDEC,使用临床记录进行评估。
  3. 参数披露中的差异可能表明关于模型性能和架构效率的持续争论。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

AI突破性进展:从常规扫描中发现隐藏的脂肪肝风险
News

AI突破性进展:从常规扫描中发现隐藏的脂肪肝风险

阿里巴巴达摩院公布了一款AI模型,能够通过标准CT扫描以惊人准确率检测脂肪肝疾病。MAOSS系统在发现早期肝损伤迹象方面优于医生,有望阻止数千例病情发展为肝硬化。这项创新的特别之处在于它利用现有扫描数据工作,无需额外检查或费用。

March 9, 2026
医疗AI脂肪肝检测预防性医疗
News

AI测试偏离重点:忽视了大多数现实世界的工作

一项令人震惊的新研究揭示,AI测试过度聚焦编程任务,却忽略了92%的现实世界工作。卡内基梅隆大学和斯坦福大学的研究人员发现,当前的基准测试遗漏了管理、法律和工程等关键领域——这些领域的从业者日常主要与人互动并解决复杂问题,而非编写代码。这种失衡可能限制AI在更广泛经济领域中的潜在影响。

March 9, 2026
AI评估劳动力自动化技术政策
News

微软Bing视频创作工具迎来重大升级:集成Sora 2并新增音效功能

微软通过整合OpenAI先进的Sora 2模型,大幅提升了Bing视频创作工具的性能,使AI生成的视频质量实现显著飞跃。这项免费服务现在能生成更具真实感的视觉效果,场景连贯性更佳,并首次实现了自动匹配音轨的功能。在保留原有免费层级的同时,微软还新增了水印和数字凭证等安全措施以标识AI生成内容。

March 6, 2026
AI视频微软OpenAI Sora
中国AI癌症筛查技术首次亮相巴基斯坦
News

中国AI癌症筛查技术首次亮相巴基斯坦

阿里巴巴达摩院与巴基斯坦医院合作,引入AI驱动的多癌种筛查技术。该系统已在全球服务2000万人,能检测人眼难以察觉的细微病变。巴基斯坦最大云服务商Sky47将支持部署,标志着向发展中国家输出先进医疗AI的重要一步。

March 3, 2026
医疗AI癌症筛查中巴合作
News

AI突破为罕见病诊断带来新希望

上海新华医院发布了全球首款可追溯的罕见病AI诊断系统DeepRare。这项发表在《自然》杂志上的突破性工具分析了超过2万例病例,旨在解决罕见病诊断缓慢且困难的难题。对于面临这些医学谜题的家庭而言,DeepRare可能意味着更快获得答案和更好的治疗方案。

February 28, 2026
医疗AI罕见疾病诊断技术
News

微软Copilot Tasks接管你的待办事项清单

微软推出了Copilot Tasks,这是一款基于云端的人工智能助手,可替你处理日常工作。它在云端独立运行,能将电子邮件整理成演示文稿、管理订阅,甚至寻找公寓——所有这些操作都不会占用你的电脑资源。该系统在进行付款等敏感操作前会请求许可,在实现自动化的同时让你高枕无忧。

February 27, 2026
微软人工智能助手生产力工具