腾讯AI绘画技术突破:图像质量提升300%
腾讯AI绘画技术突破:实现300%质量提升
腾讯开发了突破性的微调技术,显著提升了AI生成图像的质量,在人类评估分数上实现了300%的改进。这些新方法解决了扩散模型长期存在的挑战,同时实现了对输出美学的空前控制。
当前模型面临的挑战
虽然现有扩散模型可以通过奖励机制优化图像,但它们面临两个关键限制:
- 奖励作弊:模型生成的图像质量低下但技术上获得高分
- 调整不灵活:离线奖励模型无法实现实时优化

腾讯的创新解决方案
研究团队引入了两种新颖方法:
Direct-Align技术
该方法允许模型通过预注入噪声从生成过程中的任何点恢复原始图像。主要优势包括:
- 减少反向传播期间的梯度爆炸
- 支持在整个扩散过程中进行优化(不仅限于最终步骤)
- 提高训练稳定性
语义相对偏好优化(SRPO)
SRPO将奖励信号转化为文本控制参数,从而实现:
- 通过简单提示修改调整风格(例如添加"明亮"或"黑暗"前缀)
- 无需额外训练数据
- 实时自定义输出特性
性能结果
采用SRPO训练的FLUX.1-dev模型展现出显著改进:
- 真实感优秀率从8.2%提升至38.9%
- 美学质量优秀率从9.8%上升至40.5%
- 在保持高视觉吸引力的同时实现了自然纹理
该技术以高效训练达成这些成果——仅使用32块H20 GPU在10分钟内完成收敛。
未来影响
这一进步为以下领域带来重大飞跃:
- 专业数字艺术创作工具
- 营销和广告内容生成
- 游戏资产开发流程
研究论文可在此获取:https://arxiv.org/pdf/2509.06942
关键要点:
- 腾讯新方法使AI图像质量提升300%
- Direct-Align实现全流程优化
- SRPO允许基于文本的风格控制而无需额外数据
- 真实感和美学表现显著提升
- GPU使用高效且收敛迅速





