8月5日电,阿里通义千问Qwen开源 Qwen-Image,一个20B的MMDiT模型。这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。通过增强的多任务训练范式,Qwen-Image 在编辑过程中能出色地保持编辑的一致性。在多个公开基准测试中的评估表明,Qwen-Image 在各类生成与编辑任务中均获得SOTA,是一个强大的图像生成基础模型。