跳转到主要内容

腾讯SRPO技术显著提升AI图像真实感

腾讯在AI图像生成领域的重大突破

腾讯混元研究团队开发了语义相对偏好优化(SRPO)新技术,能显著提升AI生成图像的真实感。该技术专门针对Flux等主流开源模型常出现的角色皮肤不自然"油腻"现象进行优化。

AI图像真实感的挑战

随着数字艺术普及,市场对高质量AI生成视觉内容的需求激增。但现有文生图模型常会产生过度光滑、人工痕迹明显的角色皮肤——研究者称之为"油腻"效应。

Image

SRPO技术原理

这项突破源于腾讯与香港中文大学(深圳)、清华大学的合作。SRPO通过以下方式引入语义偏好概念:

  • 使用控制提示词(如"真实感")调整奖励模型目标
  • 采用正负向词语引导平衡奖励偏差
  • 运用Direct-Align策略实现更好的噪声控制

团队发现传统方法仅关注生成后期会导致过拟合。其创新方案通过注入可控噪声作为重建参考点来解决这一问题。

Image

惊人的效率提升

SRPO展现出前所未有的训练效率:

  • 真实感/美学评分提升3倍
  • 比传统方法快75倍(仅需10分钟)
  • 性能超越现有DanceGRPO方案

该技术通过优化生成早期阶段,在保持精确奖励信号传递的同时避免了高频信息过拟合。

Image

未来影响

这项技术进步将通过以下方式革新数字艺术创作:

  • 提供更自然的角色渲染效果
  • 减少后期处理需求
  • 为艺术家和开发者开辟新的创作可能

研究成果已在腾讯项目页面公开发布。

核心要点:

  • SRPO解决AI生成图像的"油腻皮肤"问题
  • 采用语义偏好优化和Direct-Align策略
  • 以极短训练时间实现画质飞跃
  • 有望变革数字艺术与内容创作流程

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

小红书发布升级版AI图片编辑器,速度大幅提升
News

小红书发布升级版AI图片编辑器,速度大幅提升

中国生活方式平台小红书近日推出FireRed-Image-Edit v1.1版本,全面增强AI图片编辑能力。此次更新带来更智能的面部识别、更流畅的多元素融合处理,性能显著提升——处理时间缩短近半。令人意外的是,该公司将公开全部代码和技术规格,为全球开发者提供这套专业级工具。

March 9, 2026
AI图片编辑小红书计算机视觉
微软发布Phi-4:一款能像人类一样观察与思考的敏捷AI
News

微软发布Phi-4:一款能像人类一样观察与思考的敏捷AI

微软推出了突破性的开源AI模型Phi-4-Reasoning-Vision-15B,该模型将视觉感知与深度推理能力相结合。与传统模型不同,Phi-4能在理解上下文的同时主动分析图像,使开发者能够从数据分析到UI自动化创建更智能的应用程序。其独特的双模式操作可根据需要在快速响应和深思熟虑的分析之间切换。

March 5, 2026
微软AI计算机视觉多模态模型
Ant Digital推出颈挂式改造方案,智能手机变身为AI数据采集器
News

Ant Digital推出颈挂式改造方案,智能手机变身为AI数据采集器

Ant Digital的天矶实验室将日常智能手机改造成强大的AI训练数据采集工具。其创新的颈挂支架系统以传统成本的一小部分捕捉第一人称视频,解决了具身智能领域的重大挑战。早期测试显示显著提升——当补充这一新数据源时,机器人任务成功率从45%跃升至95%。

March 3, 2026
具身智能AI训练计算机视觉
News

DeepSeek V4 震撼登场:多模态AI新标杆

DeepSeek即将推出V4模型,这一重大升级具备图像、视频和文本生成能力。新版不仅提升了对国产芯片的兼容性,还推出了支持百万级token上下文窗口的'轻量版'。当参数规模可能突破万亿级时,这次发布或将重新定义多模态AI的应用边界。

March 2, 2026
AI创新多模态技术深度学习
News

Anthropic通过收购Vercept为Claude赋予视觉能力

人工智能初创公司Anthropic收购了计算机视觉公司Vercept,为其Claude AI配备了先进的视觉理解能力。这笔交易带来了超越竞争对手的前沿UI识别技术,标志着在创造能够像人类一样真正驾驭数字环境的AI助手方面迈出了重要一步。通过此次收购,Anthropic巩固了其在开发实用AI代理竞赛中的领先地位。

February 27, 2026
人工智能计算机视觉科技并购
News

李飞飞的AI初创公司获得高达10亿美元巨额投资

由著名AI先驱李飞飞联合创立的人工智能初创公司World Labs已完成一轮高达10亿美元的巨额融资。主要投资者包括Autodesk、Andreessen Horowitz、NVIDIA和AMD。该公司旨在推动AI发展的边界,延续李飞飞在ImageNet项目上的开创性工作——该项目彻底改变了计算机视觉领域。

February 19, 2026
人工智能科技初创企业计算机视觉