京东发布强大新AI模型JoyAI-LLM-Flash
京东以JoyAI-LLM-Flash加码AI竞赛
在中国科技领域的重要举措中,京东已将其最新人工智能模型JoyAI-LLM-Flash开源,通过Hugging Face平台向全球开发者开放。
技术突破
该模型实现了重大飞跃:
- 总计48亿参数(激活30亿)
- 基于20万亿文本标记训练
- 40层专家混合架构
- 支持128K上下文长度
"真正让研究人员兴奋的是,"AI分析师张伟解释道,"京东解决了一些大语言模型中长期存在的挑战。"
公司采用了多项创新方法:
FiberPO优化框架
通过将数学纤维丛理论应用于强化学习,结合其专有的Muon优化器,京东工程师解决了传统的扩展不稳定性问题。
密集多标记预测(MTP)
这项尖端技术使模型能够同时而非顺序地预测多个标记。效果如何?与非MTP版本相比吞吐量提升了130-170%。
实际影响
此次发布使京东不再仅是电商玩家。凭借以下能力:
- 高级推理技能
- 强大的编程理解力
- 前沿知识理解力 该模型可为从客服聊天机器人到供应链优化工具等各种应用提供支持。
行业观察人士指出,这标志着京东继物流自动化计算机视觉系统早期成功后最具雄心的AI产品问世。
关键点:
- 开源可用性:现已在Hugging Face平台上线
- 性能提升:通过MTP技术实现显著吞吐量改进
- 架构:专家混合设计平衡效率与能力
- 词汇量:支持129K标记词汇规模




