跳转到主要内容

Liquid AI推出LFM2-8B-A1B,大幅提升移动AI效率

Liquid AI发布突破性边缘AI模型

Liquid AI正式推出LFM2-8B-A1B——一款颠覆性的混合专家(MoE)模型,重新定义了边缘AI的能力边界。通过创新的稀疏激活机制,该模型在保持高性能的同时显著降低了计算需求。

Image

技术创新

LFM2-8B-A1B具备以下特性:

  • 总计83亿参数,每令牌仅激活15亿参数
  • 融合18个门控短卷积块6组查询注意力块的混合架构
  • 稀疏MoE前馈网络含每层32个专家(top-4激活)
  • 支持32K上下文长度及英语、中文、西班牙语等多语言处理

该模型采用带自适应偏置的归一化Sigmoid路由器,实现了显著的负载均衡——这是边缘部署的关键突破。

训练与性能指标

基于约12万亿token预训练的模型展现出媲美传统3-4B参数密集模型的性能:

Image

基准测试亮点:

  • 知识能力: MMLU-Pro得分37.4(较前代提升11.5分)
  • 数学能力: GSM8K 84.4, MATH500 74.2
  • 多语言能力: MGSM 72.4, MMMLU 55.3
  • 编程能力: HumanEval+ 69.5, LiveCodeBench v6 21.0

该模型在多轮对话、创意写作和检索增强生成任务中表现优异。

部署优势

LFM2-8B-A1B展现出显著的加速效果:

  • 解码速度比同类机型快5倍(移动处理器环境)
  • 针对AMD Ryzen AI9HX370和三星Galaxy S24 Ultra优化
  • 支持int4量化(∼4.7GB)和FP16(∼16.7GB)版本
  • 兼容llama.cpp和vLLM等主流框架

根据LFM开放许可v1.0协议的开源版本包含Hugging Face权重及Colab微调笔记本。

核心要点:

✔️革命性稀疏激活机制降低约80%计算需求 ✔️性能匹敌两倍体积的传统密集模型 ✔️针对资源受限设备的实时交互优化 ✔️开源特性加速边缘AI普及 ✔️验证小规模MoE架构的可行性

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

三星Exynos 2600芯片通过革命性压缩技术将AI装入口袋
News

三星Exynos 2600芯片通过革命性压缩技术将AI装入口袋

三星即将推出的Exynos 2600芯片将通过令人印象深刻的90%模型压缩率彻底改变移动AI格局,且不牺牲准确性。与AI优化专家Nota合作,三星旨在让手机直接运行复杂的生成式AI任务——无需联网。这一突破或将改变我们日常与设备的交互方式。

December 30, 2025
移动AIExynos2600边缘计算
面壁智能获巨额融资推动边缘AI扩张
News

面壁智能获巨额融资推动边缘AI扩张

中国AI公司面壁智能新获数亿元融资,将加速其边缘大语言模型的研发。该公司的技术已应用于吉利、长安和大众汽车的智能座舱,提供注重速度和隐私的离线AI能力。

December 24, 2025
边缘AI汽车科技AI融资
努比亚押注AI手机,推动更智能移动未来
News

努比亚押注AI手机,推动更智能移动未来

努比亚总裁倪飞阐述了AI智能手机作为移动技术下一个前沿的观点。该公司与豆包助手的合作旨在基于自首款Z17机型以来的多年AI研究,提供更智能的体验。尽管承认当前面临的挑战,努比亚仍致力于通过持续创新和用户反馈使AI技术更普及。

December 9, 2025
智能手机创新移动AI努比亚
News

大华AI边缘盒仅凭13GB显存超越行业巨头

当竞争对手追逐昂贵硬件堆砌的规格时,大华已悄然革新AI部署。其星汉2.0模型以边缘计算盒实现十亿美元级性能,证明效率胜过蛮力。从将游客等待时间缩短66%到把食品检测延迟从数天降至分钟级,大华的实践表明AI能创造真实利润——而非实验室奖杯。

November 27, 2025
AI部署边缘计算计算机视觉
IBM发布Granite4.0Nano系列边缘AI模型
News

IBM发布Granite4.0Nano系列边缘AI模型

IBM推出Granite4.0Nano系列,包含八款专为边缘计算优化的紧凑型开源AI模型。这些模型提供3.5亿和10亿两种参数规模,采用混合SSM与Transformer架构,训练数据超过15万亿token。基于Apache2.0许可证发布,具备企业级治理能力并支持多运行时环境。

October 30, 2025
边缘AIIBM研究院开源AI
阿里云扩展Qwen3-VL模型阵容,助力移动端AI应用
News

阿里云扩展Qwen3-VL模型阵容,助力移动端AI应用

阿里巴巴Qwen3-VL系列新增两款针对移动设备优化的模型规格——20亿参数和320亿参数版本。轻量级20亿参数版本支持边缘计算,而强大的320亿参数版本在性能上可匹敌更大规模的竞品。两款模型均具备专业的视觉语言理解能力。

October 22, 2025
计算机视觉移动AI阿里云