京东发布高效能新AI模型,突破性效率引瞩目
京东凭借高效语言模型实现AI飞跃
中国科技巨头京东本周掀起波澜,将其最新人工智能模型JoyAI-LLM-Flash开源发布至社区。情人节当天在Hugging Face平台的发布标志着京东在尖端AI开发领域的最新进展。
技术突破
该模型拥有48亿总参数(其中30亿活跃参数)的强大计算能力。但最令研究人员兴奋的是其运行效率。"我们从根本上解决了扩展AI模型的最大难题之一",京东人工智能研究负责人张伟博士解释道。
这种高效的核心在于FiberPO——一种借鉴数学纤维丛理论概念的创新优化框架。结合Muon优化器技术和密集多令牌预测,该系统相比传统方法实现了130-170%的吞吐量提升。
实际应用
凭借支持以下特性的架构:
- 128K上下文长度(远超大多数竞争对手)
- 129K词汇量
- 40层混合专家设计
该模型在理解技术文档和编程任务方面展现出特殊优势。早期基准测试显示它能分析复杂代码库同时保持连贯的推理链条。
京东计划首先在其电商平台整合这些能力。"想象一下真正理解产品规格或能解决技术问题的AI助手",张博士建议道。
更广阔前景
此次发布正值中国AI领域激烈竞争之际。通过开源JoyAI-LLM-Flash,京东将自身定位为全球AI社区中的创新者与合作者。
该公司使用惊人的20万亿文本标记训练该模型——相当于将维基百科全部英文语料处理近400遍。
关键要点:
- 突破性效率:FiberPO框架实现更快训练且不牺牲稳定性
- 可扩展设计:混合专家架构允许选择性激活参数
- 实战就绪:在编程和技术理解任务上表现优异
- 开放态度:公开发布促进更广泛的创新生态系统



