腾讯SRPO技术显著提升AI图像真实感
腾讯在AI图像生成领域的重大突破
腾讯混元研究团队开发了语义相对偏好优化(SRPO)新技术,能显著提升AI生成图像的真实感。该技术专门针对Flux等主流开源模型常出现的角色皮肤不自然"油腻"现象进行优化。
AI图像真实感的挑战
随着数字艺术普及,市场对高质量AI生成视觉内容的需求激增。但现有文生图模型常会产生过度光滑、人工痕迹明显的角色皮肤——研究者称之为"油腻"效应。

SRPO技术原理
这项突破源于腾讯与香港中文大学(深圳)、清华大学的合作。SRPO通过以下方式引入语义偏好概念:
- 使用控制提示词(如"真实感")调整奖励模型目标
- 采用正负向词语引导平衡奖励偏差
- 运用Direct-Align策略实现更好的噪声控制
团队发现传统方法仅关注生成后期会导致过拟合。其创新方案通过注入可控噪声作为重建参考点来解决这一问题。

惊人的效率提升
SRPO展现出前所未有的训练效率:
- 真实感/美学评分提升3倍
- 比传统方法快75倍(仅需10分钟)
- 性能超越现有DanceGRPO方案
该技术通过优化生成早期阶段,在保持精确奖励信号传递的同时避免了高频信息过拟合。

未来影响
这项技术进步将通过以下方式革新数字艺术创作:
- 提供更自然的角色渲染效果
- 减少后期处理需求
- 为艺术家和开发者开辟新的创作可能
研究成果已在腾讯项目页面公开发布。
核心要点:
- SRPO解决AI生成图像的"油腻皮肤"问题
- 采用语义偏好优化和Direct-Align策略
- 以极短训练时间实现画质飞跃
- 有望变革数字艺术与内容创作流程



