跳转到主要内容

BytePush 发布 1.58 位 FLUX 模型以提高 AI 效率

BytePush 发布 1.58 位量化 FLUX 模型

介绍

人工智能 (AI) 驱动的文本到图像 (T2I) 生成模型如 DALLE3 和 Adobe Firefly3 展现了卓越的能力,但它们的庞大内存需求为在资源有限的设备上部署带来了挑战。为了克服这些障碍,字节跳动和 POSTECH 的研究人员推出了一种 1.58 位量化 FLUX 模型,显著减少了内存使用同时提升了性能。

资源限制的挑战

T2I 模型通常包含数十亿个参数,使其不适合移动设备和其他资源受限的平台。低位量化技术的探索对于使这些强大的模型在现实应用中更易获取和高效至关重要。

研究方法

研究团队专注于 FLUX.1-dev 模型,该模型是公开可用的并以其性能而闻名。他们应用了一种新颖的 1.58 位量化 技术,将视觉变换器权重压缩为仅三种不同的值:{-1, 0, +1}。该方法不需要访问图像数据,仅依赖于模型的自我监督。与 BitNet b1.58 方法不同,它需要从头开始训练大型语言模型,这种后训练量化解决方案优化了现有的 T2I 模型。

image

主要改进

使用这种 1.58 位量化方法,研究人员实现了 7.7 倍的存储空间减少。压缩后的权重以 2 位有符号整数的形式存储,过渡到标准的 16 位精度。此外,实施了为低位计算设计的自定义内核,这使得推理内存使用减少了超过 5.1 倍,并提高了推理速度。

对包括 GenEval 和 T2I Compbench 在内的既定基准的评估表明,1.58 位 FLUX 模型不仅保持了与全精度 FLUX 模型相当的生成质量,还增强了计算效率。

性能指标

研究人员量化了高达 99.5% 的视觉变换器参数,总计达到 11.9 亿 个参数在 FLUX 模型中。实验结果显示,1.58 位 FLUX 在 T2I CompBench 和 GenEval 数据集上的性能与原始模型相似。值得注意的是,该模型在较低性能 GPU 上(如 L20 和 A10)在推理速度上表现出更显著的改进。

image

结论

1.58 位 FLUX 模型 的发布代表了在内存和延迟受限设备上部署 T2I 模型的重大进展。尽管在速度提升和高分辨率图像渲染方面存在一些限制,但该模型在提高效率和减少资源消耗方面的潜力对未来的 AI 研究具有前景。

要点

  1. 模型存储空间减少了 7.7 倍。
  2. 推理内存使用降低了超过 5.1 倍。
  3. 在基准测试中,与全精度 FLUX 模型相比,性能保持在相似水平。
  4. 量化过程不需要访问任何图像数据。
  5. 为低位计算优化的自定义内核提高了推理效率。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

豆宝否认存在安全漏洞,回应网络猜测
News

豆宝否认存在安全漏洞,回应网络猜测

字节跳动旗下豆宝移动助手陷入安全传闻,公司称其为'恶意炒作'和黑公关。团队确认未收到正式漏洞报告,并已升级防护措施。他们强调遵守网络安全法规,同时谴责未经授权的漏洞披露行为。

February 27, 2026
豆宝移动安全字节跳动
中国AI模型全球应用率超越美国竞争对手
News

中国AI模型全球应用率超越美国竞争对手

在一项出人意料的转变中,中国AI模型首次在全球使用量上超越美国同行。MiniMax和Moonshot AI等平台引领潮流,中国模型每周处理超过5万亿token——近乎是美国产品的两倍。这一里程碑反映了中国在人工智能发展领域日益增长的影响力。

February 27, 2026
AI竞争中国科技机器学习
字节跳动在与迪士尼版权纠纷后调整AI视频工具
News

字节跳动在与迪士尼版权纠纷后调整AI视频工具

字节跳动在迪士尼等公司提出版权投诉后,更新了其Seedance 2.0视频生成服务。该AI模型因生成包含奥特曼等流行角色的未授权内容而遭到抵制。日本AI大臣警告可能的法律后果,凸显了创意AI工具与知识产权之间日益紧张的矛盾。

February 26, 2026
AI版权字节跳动生成视频
Anthropic收购Vercept以增强其AI雄心
News

Anthropic收购Vercept以增强其AI雄心

AI巨头Anthropic战略性收购西雅图初创公司Vercept,以强化其Claude Code生态系统。部分创始人加入Anthropic的同时,其他人对产品关闭表示失望。这笔交易凸显了主要参与者为争夺新兴技术主导权而展开的顶级AI人才激烈竞争。

February 26, 2026
AnthropicAI并购开发者工具
News

阿里云通过多模型切换革新AI访问方式

阿里云通义平台推出突破性的编程方案,可无缝切换四种顶尖中国开源AI模型。开发者现在能根据需求轻松切换Qwen3.5、GLM-5、MiniMax M2.5和Kimi K2.5模型,无需再为管理多个API而烦恼。这项创新为探索AI解决方案的企业提供了更大灵活性、成本节约和稳定性。

February 25, 2026
人工智能云计算科技创新
News

Wayve凭借AI驱动自动驾驶技术斩获10亿美元融资

伦敦AI初创公司Wayve刚刚获得由软银领投、英伟达和微软跟投的10.5亿美元巨额融资。该公司独特的自动驾驶技术——通过模拟人类学习而非依赖昂贵传感器——可能彻底改变汽车在城市道路的导航方式。这笔融资标志着欧洲AI创新获得重大认可,也预示着业界对'具身AI'应用的兴趣日益增长。

February 25, 2026
自动驾驶汽车AI初创企业软银