跳转到主要内容

BytePush 发布 1.58 位 FLUX 模型以提高 AI 效率

BytePush 发布 1.58 位量化 FLUX 模型

介绍

人工智能 (AI) 驱动的文本到图像 (T2I) 生成模型如 DALLE3 和 Adobe Firefly3 展现了卓越的能力,但它们的庞大内存需求为在资源有限的设备上部署带来了挑战。为了克服这些障碍,字节跳动和 POSTECH 的研究人员推出了一种 1.58 位量化 FLUX 模型,显著减少了内存使用同时提升了性能。

资源限制的挑战

T2I 模型通常包含数十亿个参数,使其不适合移动设备和其他资源受限的平台。低位量化技术的探索对于使这些强大的模型在现实应用中更易获取和高效至关重要。

研究方法

研究团队专注于 FLUX.1-dev 模型,该模型是公开可用的并以其性能而闻名。他们应用了一种新颖的 1.58 位量化 技术,将视觉变换器权重压缩为仅三种不同的值:{-1, 0, +1}。该方法不需要访问图像数据,仅依赖于模型的自我监督。与 BitNet b1.58 方法不同,它需要从头开始训练大型语言模型,这种后训练量化解决方案优化了现有的 T2I 模型。

image

主要改进

使用这种 1.58 位量化方法,研究人员实现了 7.7 倍的存储空间减少。压缩后的权重以 2 位有符号整数的形式存储,过渡到标准的 16 位精度。此外,实施了为低位计算设计的自定义内核,这使得推理内存使用减少了超过 5.1 倍,并提高了推理速度。

对包括 GenEval 和 T2I Compbench 在内的既定基准的评估表明,1.58 位 FLUX 模型不仅保持了与全精度 FLUX 模型相当的生成质量,还增强了计算效率。

性能指标

研究人员量化了高达 99.5% 的视觉变换器参数,总计达到 11.9 亿 个参数在 FLUX 模型中。实验结果显示,1.58 位 FLUX 在 T2I CompBench 和 GenEval 数据集上的性能与原始模型相似。值得注意的是,该模型在较低性能 GPU 上(如 L20 和 A10)在推理速度上表现出更显著的改进。

image

结论

1.58 位 FLUX 模型 的发布代表了在内存和延迟受限设备上部署 T2I 模型的重大进展。尽管在速度提升和高分辨率图像渲染方面存在一些限制,但该模型在提高效率和减少资源消耗方面的潜力对未来的 AI 研究具有前景。

要点

  1. 模型存储空间减少了 7.7 倍。
  2. 推理内存使用降低了超过 5.1 倍。
  3. 在基准测试中,与全精度 FLUX 模型相比,性能保持在相似水平。
  4. 量化过程不需要访问任何图像数据。
  5. 为低位计算优化的自定义内核提高了推理效率。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

荣耀与字节跳动寻求深化AI手机合作

荣耀正与字节跳动进行深入谈判,以扩大双方在人工智能领域的合作,或将实现豆包技术系统级整合至荣耀智能手机。该合作关系始于2024年,经过多项AI计划发展后,现已为更深层次的技术合作做好准备。此举标志着智能手机制造商与AI平台正从应用级整合迈向系统级整合。

April 13, 2026
荣耀字节跳动AI智能手机
News

字节跳动遭遇AI人才外流:70名核心员工转投竞争对手

字节跳动精英团队Seed AI正以惊人速度流失人才,短短一年内近70名技术专家相继离职。多数人才流向腾讯和阿里等科技巨头,其余则催生了一批AI初创企业。尽管字节跳动提供月均高达13.5万元的股票期权,仍难以在中国残酷的AI人才争夺战中扭转颓势。

April 10, 2026
字节跳动AI人才争夺战科技行业
小米AI模型加入领先开源框架并开放免费试用
News

小米AI模型加入领先开源框架并开放免费试用

小米将其MiMo-V2系列AI模型集成至开源AI开发主流框架Hermes Agent中。开发者现可免费试用两周小米的Pro、Omni和Flash模型。此次合作结合了小米的硬件专长与Hermes的自我进化能力,为AI助手带来新的可能性。此举标志着AI竞争焦点正从对话质量转向执行效率。

April 10, 2026
小米AI开发开源
News

腾讯新型机器人脑在关键测试中超越竞争对手

腾讯公布了HY-Embodied-0.5,这是一款突破性AI模型,旨在赋予机器人类似人类的空间感知和物理交互能力。与难以应对现实世界任务的标准AI模型不同,该系统通过专业架构与海量训练相结合,在22项性能基准测试中均获得最高分。这项技术可能最终弥合虚拟智能与实际机器人应用之间的差距。

April 10, 2026
人工智能机器人技术腾讯
阿里巴巴微型AI模型凭借智能升级回收技术大放异彩
News

阿里巴巴微型AI模型凭借智能升级回收技术大放异彩

阿里巴巴研究团队取得了一项令人瞩目的成就——将参数规模仅为6亿的AI模型提升为能在标准CPU上高效运行的173亿参数系统。其秘诀在于创新的'升级回收'技术,运行时仅激活5%的参数。这一突破性进展使得复杂AI变得前所未有的触手可及,无需昂贵硬件即可实现每秒30个token的处理速度。这不仅是规模的胜利——精妙的训练方法让这个小模型表现超越许多大型竞争对手。

April 10, 2026
AI效率机器学习MoE架构
Claude 全新顾问工具:以智能AI助力,无需高昂成本
News

Claude 全新顾问工具:以智能AI助力,无需高昂成本

Anthropic为其Claude AI平台推出了一项巧妙的新功能,将高效与智能完美结合。这款顾问工具让更快速、更经济的模型处理日常任务,同时在遇到复杂决策时自动咨询更强大的Claude Opus。想象一下拥有一位敏捷的初级助手,能在需要时谨慎地寻求资深专家的帮助。早期测试显示,该工具在显著提升性能的同时意外节省了成本——某些情况下甚至以低廉的代价实现了双倍能力。

April 10, 2026
AI创新Claude AI成本优化