阿里通义 Qwen-lmage-Edit-2511 图像编辑 AI 模型开源,支持两人隔空“合照”
12 月 25 日消息,阿里通义千问今日宣布 Qwen-Image-Edit-2511 正式开源。

Qwen-Image-Edit 是阿里通义团队推出的图像编辑模型。2511 版本中着重进行了包括一致性提升在内的多项增强,新版本的整体生成质量、尤其是人物生成质量,得到显著提升。
Qwen-Image-Edit-2511 的主要特性包括:
提升了角色一致性
集成了 Lora 能力,例如打光、多场景
提升了工业设计能力
提升了几何推理能力
从具体案例来看,Qwen-Image-Edit-2511 提升了角色的一致性在 Qwen-Image-Edit-2511 中,角色的一致性获得了提升,模型可以依据输入肖像图进行具有想象力的编辑,并维持输入肖像的人物一致性。
此外,Qwen-Image-Edit-2511 的多人合照的一致性也进一步提升了。Qwen-Image-Edit-2509 相比于 Qwen-Image-Edit 提升了单人合照的一致性,而 Qwen-Image-Edit-2511 又进一步提升了多人合照的一致性,这种一致性使得可以输入两张人物照片,并返回一致性很好的合照。

Qwen-Image-Edit-2511 的一个新的特色是集成了部分社区的有趣 Lora Qwen-Image-Edit。Qwen-Image-Edit-2511 集成了这些 Lora,因此基础模型本身就具备一些 Lora 效果,例如打光的 Lora 效果可以在基础模型中展现:


再比如,新视角生成 Lora 效果也可以通过基础模型直接达成:


Qwen-Image-Edit-2511 在实际工程场景中的应用,比如进行批量的工业产品设计:


或是,进行工业材质替换:


值得一提的是,在 Qwen-Image-Edit-2511 版本中,模型增加了几何推理能力,模型可以直接生成一些辅助线效果:


附 Qwen-Image-Edit-2511 开源地址如下:
ModelScope:
https://modelscope.cn/models/Qwen/Qwen-Image-Edit-2511?spm=a2ty_o06.30285417.0.0.2304c9216VPArP
Hugging Face:
声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。
游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。
AI 中文社