京东发布强大新AI模型JoyAI-LLM-Flash
京东开源JoyAI模型实现AI飞跃
中国科技巨头京东通过发布现已在Hugging Face上线的复杂大语言模型JoyAI-LLM-Flash,正式进军人工智能领域。2月14日的发布标志着京东确立其作为人工智能开发重要参与者的最新举措。
技术实力
JoyAI-LLM-Flash背后的数据令人印象深刻:
- 总计48亿参数(其中30亿为活跃参数)
- 基于20万亿文本标记训练
- 展现出卓越的推理与编程能力
真正使该模型脱颖而出的是其理解前沿知识的能力——随着AI系统日益需要理解快速发展的技术领域,这一优势至关重要。
突破性优化
京东工程师攻克了大语言模型中最棘手的挑战之一:扩展过程中的稳定性保持。他们的解决方案?将数学纤维丛理论应用于强化学习的创新FiberPO优化框架。
该方法结合了:
- Muon优化器技术
- 密集多标记预测(MTP)
效果不言而喻——与非MTP版本相比吞吐量提升1.3至1.7倍,为开发者带来显著更高的计算性价比。
架构创新
在底层,JoyAI采用专家混合(MoE)架构,具有以下特点:
- 40层结构
- 支持128K上下文长度
- 129K词汇量规模
MoE设计使得网络不同部分可以专精于各种任务,同时保持整体连贯性——某种程度上就像拥有一个无缝协作的专家团队。
此次开源让全球研究人员能够检视并基于京东的工作进行构建,有望加速整个AI领域的创新进程。
关键要点:
✅ 京东在Hugging Face发布先进JoyAI-LLM-Flash模型 ✅ 将超大规模(48亿参数)与新颖FiberPO优化相结合 ✅ 解决模型扩展过程中的关键稳定性问题 ✅ 相较传统方法带来显著性能提升 ✅ 采用专家混合架构实现专业化能力



