跳转到主要内容

百度ERNIE-4.5模型登顶Hugging Face排行榜

百度ERNIE-4.5模型称霸Hugging Face排行榜

百度文心大模型家族迎来重大突破,其最新发布的ERNIE-4.5-21B-A3B-Thinking迅速攀升至Hugging Face文本生成模型榜首,同时位列该平台整体模型榜单第三名。这一成就凸显了中国在全球AI领域日益增长的影响力。

技术规格与创新

该模型采用先进的混合专家(MoE)架构,总参数量达210亿但每个token仅激活30亿参数。这种稀疏激活方式显著降低计算需求的同时保持高性能输出。值得注意的是,该模型支持惊人的128K长上下文窗口,使其在逻辑推理和学术分析等复杂任务中表现尤为突出。

Image

与大多数依赖PyTorch的竞争对手不同,百度使用自研的PaddlePaddle深度学习框架开发了ERNIE-4.5。这一独立框架增强了多模态任务兼容性和硬件优化能力,使百度成为与谷歌并列的少数使用自主框架进行大模型训练的企业之一。

性能基准与能力

基准测试表明,ERNIE-4.5在以下多个领域表现媲美行业领先者如Gemini 2.5 ProGPT-5:

  • 逻辑推理
  • 数学解题
  • 科学分析
  • 编码任务
  • 文本生成

尽管总参数量较少,该模型在数学推理基准测试(BBH和CMATH)上仍优于Qwen3-30B等更大规模模型,展现出卓越的参数效率。

其他特性包括:

  • 高效的API工具调用功能
  • 长上下文处理中减少幻觉现象
  • 面向全球应用的中英双语优化 开源社区反响热烈,Hugging Face平台下载量激增。开发者可使用vLLM、Transformers 4.54+和FastDeploy等流行工具集成该模型。

    战略意义与未来展望

    Apache 2.0许可的发布大幅降低了AI应用门槛,同时强化了百度在开源AI开发领域的地位。此前6月发布的文心4.5家族其他十款模型已共同展现了中国在MoE架构和推理优化方面的进展。

    该模型代表了一种范式转变——证明深度推理无需万亿级稠密参数即可实现。其高效设计使高性能AI更易被资源有限的开发者获取,加速了实验室之外的实际应用落地。

    关键要点:

    1. 顶尖性能表现: Hugging Face文本生成类目排名第一
    2. 高效架构设计: MoE结构使每个token仅激活210亿参数中的30亿
    3. 技术自主性: 基于百度飞桨框架开发
    4. 实际应用优势: 在推理、数学、编码领域表现优异且减少幻觉
    5. 开放生态: Apache 2.0许可证促进商业用途和创新

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

腾讯引进清华明星科学家彭天宇,AI团队再添强援
News

腾讯引进清华明星科学家彭天宇,AI团队再添强援

腾讯通过引入清华大学机器学习新星彭天宇博士,进一步加强其人工智能研究实力。这位青年学者将领导腾讯通义大模型团队的多模态强化学习工作,带来其在可信AI和生成模型方面的专业知识。此次招聘是腾讯近期在全球AI竞赛中吸引顶尖人才战略的一部分。

January 30, 2026
腾讯AI人才机器学习
Yuchu新型AI模型赋予机器人常识
News

Yuchu新型AI模型赋予机器人常识

中国科技公司Yuchu开源了突破性AI模型UnifoLM-VLA-0,该模型能帮助人形机器人像人类一样理解物理交互。不同于仅处理文本和图像的普通AI,该模型能掌握空间关系和现实世界动态——使机器人能够执行从抓取物体到抵抗干扰等复杂任务。基于现有技术构建但仅用340小时机器人数据训练,它已在空间推理测试中超越竞争对手。

January 30, 2026
AI机器人开源AI人形机器人
Ant Lingbo新AI模型为虚拟世界注入生命
News

Ant Lingbo新AI模型为虚拟世界注入生命

Ant Lingbo科技发布了开源AI模型LingBot-World,能创建令人惊叹的真实虚拟环境。该突破性技术与谷歌Genie3质量相当,可实现长达10分钟无失真的无缝交互。从游戏到自动驾驶训练,开发者现在拥有了构建动态数字世界的强大工具,这些世界能即时响应用户指令。

January 29, 2026
AI创新虚拟世界机器学习
蚂蚁集团机器人技术飞跃:开源AI模型提升机器人智能
News

蚂蚁集团机器人技术飞跃:开源AI模型提升机器人智能

蚂蚁集团旗下灵波科技将其具身智能模型LingBot-VLA完全开源,标志着机器人技术的重大进步。该模型展现出卓越的跨平台适应性和训练效率,超越了现有框架。同时发布的新LingBot-Depth空间感知模型增强了机器人和自动驾驶车辆对3D环境的理解能力。这些发展或将加速智能机器人在各行业的应用。

January 28, 2026
机器人技术AI创新蚂蚁集团
Allen AI推出SERA:开源编程助手起价仅400美元
News

Allen AI推出SERA:开源编程助手起价仅400美元

Allen AI发布了突破性的开源编程代理家族SERA,让各种规模的企业都能获得AI辅助编程的能力。该产品培训成本最低仅需400美元,在保持媲美商业模型性能的同时提供了前所未有的经济性。系统创新的'软验证生成'技术可适配不完整的私有代码库,或将彻底改变企业将AI整合至开发流程的方式。

January 28, 2026
AI编程开源工具软件开发
阿里巴巴通义千问AI迎来大脑升级,全新推理模型赋能
News

阿里巴巴通义千问AI迎来大脑升级,全新推理模型赋能

阿里巴巴推出了迄今为止最先进的推理模型——Qwen3-Max-Thinking,为其PC和网页平台的通义千问AI助手提供支持。这款万亿参数模型在事实知识、复杂问题解决和类人推理方面树立了新标杆,可与全球顶级AI系统媲美。用户现在可以体验到更智能、更主动的交互,以及增强的记忆和逻辑能力。

January 27, 2026
人工智能阿里巴巴机器学习