跳转到主要内容

Ling-flash-2.0以创纪录的推理速度正式发布

Silicon-Based Flow发布具有突破性性能的Ling-flash-2.0

Silicon-Based Flow的大型模型服务平台正式推出Ling-flash-2.0,这是蚂蚁集团百灵团队的最新开源模型。这标志着该平台已提供第130个模型,为开发者带来自然语言处理领域的空前能力。

模型架构与训练

MoE(专家混合)架构驱动着Ling-flash-2.0,其特点包括:

  • 总计100亿参数
  • 使用时仅激活6.1亿参数(其中4.8亿为非嵌入参数)
  • 基于超过20TB高质量数据训练

通过包括预训练、监督微调和强化学习在内的多阶段训练,该模型的性能可媲美激活参数超过60亿的密集模型。

Image

性能与应用场景

Ling-flash-2.0在以下方面表现卓越:

  • 复杂推理任务
  • 代码生成
  • 前端开发

该模型支持惊人的128K上下文长度,显著提升了文本处理能力。定价保持竞争力:

  • 输入费用为每百万token 1元人民币
  • 输出费用为每百万token 4元人民币

新用户可获得欢迎额度:

  • 国内站点赠送14元人民币
  • 国际平台赠送1美元

速度与效率优势

经过精心优化的架构带来:

  • 在H20硬件上输出速度超过每秒200个token
  • 比同类360亿参数的密集模型快三倍 这一突破将密集架构的性能优势与MoE的效率完美结合。

Silicon Flow平台持续扩展其在语言、图像、音频和视频模型的布局,使开发者能够: a) 比较多种模型 b) 组合不同AI能力 c) 访问高效API用于生成式AI应用

开发者可通过以下链接体验Ling-flash-2.0: 中国区:https://cloud.siliconflow.cn/models 国际版:https://cloud.siliconflow.com/models

关键亮点: 1. 🚀 MoE架构:结合100亿总参数与仅激活6.1亿参数的高效特性 2. ⚡️ 创纪录速度:每秒处理超200个token——达到同类密集模型的3倍速 3. 💡先进能力:凭借128K上下文支持,擅长复杂推理与创造性任务

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

微软推出UserLM-8b以增强AI助手训练
News

微软推出UserLM-8b以增强AI助手训练

微软发布UserLM-8b模型,旨在通过真实的多轮对话优化AI助手性能。该模型能模拟类人交互行为,通过复现真实用户行为来评估表现并提升可靠性。

October 10, 2025
MicrosoftAI-AssistantsNatural-Language-Processing
News

英伟达通过收购SchedMD及发布新模型推动开源AI发展

英伟达在开源AI领域掀起波澜,采取了两大重要举措。这家科技巨头收购了广受欢迎的Slurm工作负载管理器背后的公司SchedMD,同时承诺保持其开源状态。与此同时,英伟达发布了Nemotron 3 AI模型系列和一款用于自动驾驶研究的新视觉语言模型,彰显其对物理AI应用日益增长的投入。

December 16, 2025
Nvidiaopen-sourceAI-models
DeepSeek-V3.2-Exp 重磅发布,价格大幅下调
News

DeepSeek-V3.2-Exp 重磅发布,价格大幅下调

Silicon-based Flow 发布了实验性 AI 模型 DeepSeek-V3.2-Exp,该模型具备 160K 上下文长度,价格降幅超过 50%。此次更新引入了先进的稀疏注意力技术,同时保持了性能基准。平台仍继续提供稳定的生产环境版本 V3.1-Terminus。

October 11, 2025
AI-modelsDeepSeekSiliconFlow
阿里巴巴Fun-ASR模型将语音识别准确率提升15%
News

阿里巴巴Fun-ASR模型将语音识别准确率提升15%

阿里巴巴通义对其Fun-ASR语音识别模型进行升级,在保险、家装等垂直行业实现超过15%的准确率提升。该模型采用先进算法和强化学习技术,增强上下文理解能力并降低嘈杂环境下的识别错误率。

August 23, 2025
speech-recognitionAI-modelsAlibaba-Tongyi
通义App现支持语音指令点餐
News

通义App现支持语音指令点餐

通义App与支付宝合作推出AI语音点餐功能。只需告诉应用你想吃什么——比如'给我点杯咖啡'——它就会处理从选择商家到支付的全流程。这种无缝集成消除了切换应用的麻烦,让外卖变得像聊天一样简单。该功能标志着AI不仅能回答问题,还能完成任务的重要进步。

January 15, 2026
AI支付语音商务支付宝集成
中国电信GVC技术将视频压缩至原大小0.02%且画质无损
News

中国电信GVC技术将视频压缩至原大小0.02%且画质无损

中国电信人工智能实验室推出革命性视频压缩技术,可将文件体积压缩至原始大小的0.02%。这项名为GVC(生成式视频压缩)的突破性技术可能彻底改变我们在太空通信或灾区等低带宽环境下的视频传输方式。它不再传输完整图像,而是发送简短的'绘制指令',由接收端的人工智能进行重建。早期测试表明,该技术在保持画质的同时,带宽效率比传统方法高出六倍。

January 15, 2026
video compressiongenerative AItelecommunications