跳转到主要内容

微软开源Phi-4,超越GPT-4o和Llama-3.1

微软推出了Phi-4,一个小巧而强大的语言模型,只有140亿参数,现在可以在Hugging Face平台上使用。尽管体积紧凑,Phi-4在性能上表现出色,超越了包括OpenAI的GPT-4o和Qwen2.5及Llama-3.1等多个知名模型。

Image

在严格的测试中,Phi-4在美国数学竞赛(AMC)等挑战中表现优异,得分91.8,超越了Gemini Pro1.5和Claude3.5Sonnet等竞争对手。该模型在MMLU测试中的表现也非常强劲,取得了84.8的优异分数,展示了其先进的推理和数学问题解决能力。

Image

Phi-4通过使用合成数据生成技术(包括多智能体提示、指令反转和自我纠正方法)来实现差异化。这些创新提高了其推理能力,使Phi-4能够轻松处理复杂任务。与许多主要依赖自然数据的模型不同,Phi-4生成高质量的合成数据以优化其性能。

该模型基于仅解码器的Transformer架构,支持最长16k的上下文长度,能够高效处理大量输入数据。在预训练期间,Phi-4接触了大约1万亿个标记,这些标记结合了合成数据和经过精心挑选的自然数据,确保在MMLU和HumanEval等基准测试中表现出色。

Phi-4的优势不仅在于其体积和性能。它被设计为高效,兼容消费级硬件。它在STEM相关任务中的推理能力,尤其是在数学和科学方面,表现得特别令人印象深刻,超越了更小和更大的模型。此外,Phi-4可使用多种合成数据集进行微调,以满足特定领域的需求。

Phi-4背后的技术创新包括先进的数据生成技术,如多智能体提示和自我纠正,这些技术提高了其推理和问题解决能力。此外,该模型还利用后训练方法,如拒绝采样和直接偏好优化(DPO),优化其决策能力和在复杂推理任务中的表现。关键标记搜索(PTS)的引入帮助Phi-4识别关键的决策点,从而提高其准确性和推理能力。

Image

Phi-4的开源发布标志着人工智能发展的重要一步。该模型可以在Hugging Face上下载,获得MIT许可证,允许商业使用。这一开放政策引起了AI社区的广泛关注,开发者和爱好者对Phi-4的性能和潜力给予了高度评价。Hugging Face的官方社交媒体账户甚至将其称为“有史以来最好的14B模型”。

模型链接:https://huggingface.co/microsoft/phi-4

关键点

  1. 微软的Phi-4模型仅有140亿参数,在性能测试中超越了GPT-4o和Llama-3.1等主要模型。
  2. Phi-4在数学和推理方面表现优异,在AMC和MMLU等测试中得分很高。
  3. 该模型是开源的,并获得商业使用许可,吸引了开发者和AI爱好者。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

微软MAI-Image-2跻身全球AI图像生成三强
News

微软MAI-Image-2跻身全球AI图像生成三强

微软发布全新强力MAI-Image-2模型,现位列全球文本转图像AI系统前三甲。这项突破性技术解决了AI生成图像中文字乱码的长期问题,同时提供惊艳的视觉质量。用户已可免费测试该模型,微软计划很快将其整合至生产力工具中。

March 20, 2026
AIMicrosoftimage-generation
News

日本AI雄心蒙上抄袭指控阴影

乐天集团大肆宣传的'日本最大AI模型'因开发者发现其与中国深度求索模型惊人相似而面临审查。这家科技巨头被指控披露不足和许可证处理存疑,引发了关于AI开发透明度的争论。尽管乐天声称整合了开源元素,但批评者认为该公司将作品作为原创研究呈现已逾越道德界限。

March 19, 2026
AI伦理开源科技争议
News

科技巨头联手应对开源领域AI生成的安全垃圾信息

六家大型科技公司共同出资1250万美元,帮助开源开发者应对大量低质量AI生成的安全报告。这笔资金将支持Linux基金会开发更好的工具来过滤误报,让维护者能够专注于真正的威胁。随着AI让漏洞扫描变得更容易,像cURL这样的项目一直在处理大量不可靠的报告。

March 18, 2026
AI安全开源科技投资
News

科技巨头联手:1250万美元助力开源安全

在一次罕见的团结行动中,Google、Microsoft、OpenAI等科技巨头共同筹集了1250万美元,帮助Linux基金会应对一个日益严重的问题——大量不可靠的AI生成安全报告正在压垮开源维护者。这笔资金将支持过滤这些'AI垃圾报告'的努力,同时保护关键的开源基础设施。此次合作标志着行业在超越竞争利益、建立共享安全标准方面又迈出了一步。

March 18, 2026
开源网络安全人工智能
News

乐天AI因移除许可证信息陷入舆论风波

日本乐天集团因其大肆宣传的AI模型被曝移除开源许可证信息而陷入困境。当技术爱好者发现这一疏漏后,公司迅速做出调整,但其声誉可能已受到持久损害。该事件再次引发关于企业在社区开发技术基础上构建产品时透明度的质疑。

March 18, 2026
AI伦理开源科技丑闻
Manus AI以20分钟应用创建功能让'我的电脑'焕发生机
News

Manus AI以20分钟应用创建功能让'我的电脑'焕发生机

Meta旗下AI平台Manus实现了从云端到桌面的革命性跨越。其全新'我的电脑'功能允许AI代理直接管理文件、自动化任务,甚至能在几分钟内构建应用程序——所有这些操作都在严格的人工监督下确保数据安全。这或将彻底改变我们与设备的交互方式,使AI从助手转变为真正的数字同事。

March 18, 2026
AI生产力工具Meta