跳转到主要内容

BytePush 发布 1.58 位 FLUX 模型以提高 AI 效率

BytePush 发布 1.58 位量化 FLUX 模型

介绍

人工智能 (AI) 驱动的文本到图像 (T2I) 生成模型如 DALLE3 和 Adobe Firefly3 展现了卓越的能力,但它们的庞大内存需求为在资源有限的设备上部署带来了挑战。为了克服这些障碍,字节跳动和 POSTECH 的研究人员推出了一种 1.58 位量化 FLUX 模型,显著减少了内存使用同时提升了性能。

资源限制的挑战

T2I 模型通常包含数十亿个参数,使其不适合移动设备和其他资源受限的平台。低位量化技术的探索对于使这些强大的模型在现实应用中更易获取和高效至关重要。

研究方法

研究团队专注于 FLUX.1-dev 模型,该模型是公开可用的并以其性能而闻名。他们应用了一种新颖的 1.58 位量化 技术,将视觉变换器权重压缩为仅三种不同的值:{-1, 0, +1}。该方法不需要访问图像数据,仅依赖于模型的自我监督。与 BitNet b1.58 方法不同,它需要从头开始训练大型语言模型,这种后训练量化解决方案优化了现有的 T2I 模型。

image

主要改进

使用这种 1.58 位量化方法,研究人员实现了 7.7 倍的存储空间减少。压缩后的权重以 2 位有符号整数的形式存储,过渡到标准的 16 位精度。此外,实施了为低位计算设计的自定义内核,这使得推理内存使用减少了超过 5.1 倍,并提高了推理速度。

对包括 GenEval 和 T2I Compbench 在内的既定基准的评估表明,1.58 位 FLUX 模型不仅保持了与全精度 FLUX 模型相当的生成质量,还增强了计算效率。

性能指标

研究人员量化了高达 99.5% 的视觉变换器参数,总计达到 11.9 亿 个参数在 FLUX 模型中。实验结果显示,1.58 位 FLUX 在 T2I CompBench 和 GenEval 数据集上的性能与原始模型相似。值得注意的是,该模型在较低性能 GPU 上(如 L20 和 A10)在推理速度上表现出更显著的改进。

image

结论

1.58 位 FLUX 模型 的发布代表了在内存和延迟受限设备上部署 T2I 模型的重大进展。尽管在速度提升和高分辨率图像渲染方面存在一些限制,但该模型在提高效率和减少资源消耗方面的潜力对未来的 AI 研究具有前景。

要点

  1. 模型存储空间减少了 7.7 倍。
  2. 推理内存使用降低了超过 5.1 倍。
  3. 在基准测试中,与全精度 FLUX 模型相比,性能保持在相似水平。
  4. 量化过程不需要访问任何图像数据。
  5. 为低位计算优化的自定义内核提高了推理效率。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

DeepSeek-V4将于今年二月彻底革新代码生成领域
News

DeepSeek-V4将于今年二月彻底革新代码生成领域

DeepSeek正筹备在农历新年期间推出其强大的新型AI模型DeepSeek-V4。此次更新将在代码生成和处理复杂编程任务方面实现重大突破,有望超越Claude和GPT系列等竞争对手。开发者可以期待这款创新工具提供更有条理的响应和更强的推理能力。

January 12, 2026
AI发展编程工具机器学习
中国研究人员教会AI在图像生成中自我纠错
News

中国研究人员教会AI在图像生成中自我纠错

中国高校取得突破性进展,解决了AI的'视觉读写障碍'——图像系统能理解概念却难以正确呈现的问题。他们的UniCorn框架如同内部质检团队,能在创作过程中捕捉并修正错误。早期测试显示其在空间准确性和细节处理方面有显著提升。

January 12, 2026
AI创新计算机视觉机器学习
Falcon H1R7B:小巧AI模型性能超越大型竞争对手
News

Falcon H1R7B:小巧AI模型性能超越大型竞争对手

阿布扎比创新研究院发布了Falcon H1R7B,这款拥有70亿参数的开源语言模型出人意料地强大,正在改写AI性能的规则。通过将创新训练技术与混合架构相结合,这个灵活的竞争者提供的推理能力可与两倍于其大小的模型相媲美。现已在Hugging Face上提供,对于需要高效AI解决方案的开发者来说可能是一个改变游戏规则的产品。

January 6, 2026
AI创新语言模型机器学习
News

字节跳动DouBao AI眼镜即将限量发售

字节跳动正准备推出备受期待的DouBao AI眼镜,但有个特别之处——首批10万台将仅限现有DouBao App用户购买。这款搭载高通Snapdragon AR1芯片的轻量化眼镜主打音频功能,并未配备显示屏。虽然公司对更广泛的销售计划守口如瓶,但业内人士透露第二代机型已在开发中。

January 6, 2026
可穿戴技术人工智能字节跳动
News

字节跳动DouBao AI眼镜即将量产 - 无屏版售价低于300美元

字节跳动正筹备推出DouBao AI眼镜,供应链消息确认已开始量产。这款与龙旗科技合作开发的轻量化可穿戴设备重量不足50克,将于2026年第一季度面市。基础无屏版本起售价低于2000元(约280美元),后续还将推出带显示屏的型号。该眼镜通过Doubao应用和火山引擎技术整合了字节跳动的软件优势。

January 5, 2026
可穿戴技术字节跳动智能眼镜
News

字节跳动Doubao AI眼镜即将撼动可穿戴科技市场

字节跳动即将与龙旗科技合作推出的Doubao AI眼镜正在可穿戴科技领域掀起波澜。这款轻巧的眼镜采用定制芯片实现无缝语音交互和翻译功能,同时保持轻量化与亲民价格。不同于独立设备,它们通过Doubao应用智能调用智能手机的算力。定价低于2000元,这些眼镜或将使AI眼镜成为主流配件而非小众产品。

January 5, 2026
可穿戴技术AI硬件字节跳动