跳转到主要内容

阿里巴巴通义千问AI推出新图像编辑器,解决换脸难题

阿里巴巴AI突破:编辑照片而不改变人脸

是否曾尝试用AI编辑照片,结果却得到一个与拍摄对象只有几分相似的人物?阿里巴巴通义千问团队清楚地听到了这些抱怨。他们最新推出的Qwen-Image-Edit-2511模型承诺在释放创造力的同时保持人脸可识别性。

Image

解决AI编辑中的身份危机

升级后的模型专门针对那些尴尬时刻——当AI把你精心摆拍的肖像变成恐怖谷体验时。无论是更换服装、调整背景还是玩转灯光效果,这项技术现在都能保持使人脸独特可辨的特征。

"我们已经超越了单人肖像处理,"开发团队在Hugging Face上解释道,"现在即使是复杂的集体照也能保持所有人物身份的一致性。"

不仅仅是漂亮的脸蛋

虽然面部一致性是亮点,但此次更新还带来了几项低调的改进:

  • 相机控制:像专业摄影师一样理解透视关系
  • 几何精度:为工业设计师和建筑师提供支持
  • 集成LoRA技术:将专业级工具带给普通用户

团队通过Apache 2.0许可证开源模型并提供基于网络的演示版本(无需昂贵软件),使这些进步变得触手可及。

为何这比自拍更重要?

这项技术的意义远不止完善Instagram帖子:

  1. 电子商务商家可以在统一模特身上展示产品而无需重拍
  2. 影视制作团队能更好地控制场景间的连续性
  3. 历史修复项目可以修复受损照片而不改变人物外貌
  4. 医学影像可能受益于更可靠的增强工具

该技术问世之际,消费者越来越期待无缝的数字体验——创意工具应该增强而非扭曲现实。

关键要点:

  • 👤 保脸技术:解决AI编辑中"这人是谁?"的问题
  • 🛠️ 多功能工具包:处理从人像修饰到产品设计的各种需求
  • 🔓 开放获取:免费演示降低了专业级编辑的门槛

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

阿里通义千问Qwen-Image-2.0震撼发布:创作与编辑合二为一,呈现2K超清细节
News

阿里通义千问Qwen-Image-2.0震撼发布:创作与编辑合二为一,呈现2K超清细节

阿里云推出突破性AI模型Qwen-Image-2.0,将图像生成与编辑功能无缝整合。这款轻量级7B架构模型可生成令人惊叹的2K分辨率图像,实现像素级文本渲染与逼真材质表现。从古典书法到现代信息图,它能处理多样化创意任务,并在复杂场景中保持角色一致性。该模型已通过阿里云百炼平台开放测试。

February 10, 2026
AI图像生成阿里云计算机视觉
深度求索全新OCR技术模拟人类视觉,大幅降低成本
News

深度求索全新OCR技术模拟人类视觉,大幅降低成本

中国AI公司深度求索发布了突破性的视觉编码器OCR2,其处理文档的方式如同人眼浏览页面。通过摒弃僵化的网格处理方式,采用灵活的'因果流令牌'技术,该系统在性能超越Gemini3Pro的同时,将视觉令牌使用量减少了80%。这项开源技术可能为真正统一的多模态AI铺平道路。

February 2, 2026
计算机视觉AI突破文档AI
News

商汤科技推出新型AI模型,思维模式堪比侦探

商汤科技发布开源AI模型SenseNova-MARS,该模型融合视觉推理与图文搜索能力。在多项基准测试中超越GPT-5.2,这项创新技术模拟人类调查技能——放大微小细节、串联信息点并自主解决复杂问题。公司已向全球开发者公开8B和32B两个版本。

January 30, 2026
AI创新计算机视觉机器学习
News

商汤科技发布革命性AI,具备视觉、推理与行动能力

中国AI领军企业商汤科技刚刚开放了其突破性的SenseNova-MARS模型访问权限——这项技术不仅能理解图像,还能像人类一样思考问题。该创新提供两个针对不同需求定制的版本,或将重新定义机器与视觉世界的交互方式。

January 30, 2026
人工智能计算机视觉商汤科技
News

海康威视AI检测仪攻克工厂包装瑕疵难题

海康威视推出基于观澜AI模型的智能质检系统,可即时识别包装错误。与传统人工检测不同,该方案能精准扫描每件产品,适应复杂生产环境。已在汽车和电子工厂展现价值,标志着智能制造又迈进一步。

January 30, 2026
工业自动化质量控制计算机视觉
谷歌Gemini 3 Flash现可如人类侦探般观察图像
News

谷歌Gemini 3 Flash现可如人类侦探般观察图像

谷歌为其Gemini 3 Flash AI升级了突破性的'Agentic Vision'技术,彻底改变了机器分析图像的方式。该AI不再只是简单浏览图片,而是能像人类专家一样主动调查——放大细节、标注元素并进行推理。这一突破使复杂视觉任务的准确率提高了5-10%,并将很快通过移动助手向普通用户开放。

January 28, 2026
计算机视觉谷歌AI图像分析