生活网4月29日 消息:最近,华为的4K图像模型PixArt-Σ放出了模型文件,而且diffusers也支持了这个架构,用户可以在Comfyui上尝试。
尽管他们XL-1024版本的模型大小只有2G,但在图像表现和提示词理解方面,它与SD3模型相当接近。可以在Comfyui上尝试。
工作流地址:https://civitai.com/models/420163
项目地址:https://github.com/PixArt-alpha/PixArt-sigma
据悉,PixArt-Σ模型采用了先进的弥散Transformer技术,通过弱到强的训练方法,专注于生成4K分辨率的高质量图像。
模型特点:
轻量化设计:PixArt-Σ的XL-1024模型大小仅为2G,相较于其他同类模型,它在保持较小体积的同时,图像表现力和提示词理解能力却毫不逊色。
风格多样性:在一些特定风格的表现上,PixArt-Σ与著名的SD3模型相比也显得颇具竞争力。
Diffusers支持:PixArt-Σ模型支持Diffusers框架,这使得用户可以在Comfyui等平台上尝试使用该模型,并通过使用patches来加速生成过程,提升用户体验。
技术实现:
PixArt-Σ通过弥散Transformer进行训练,该技术允许模型从低分辨率逐渐过渡到高分辨率的图像生成,有效提升了生成图像的细节和质量。
应用场景:
该模型的应用场景广泛,不仅适用于艺术创作和设计领域,还能满足游戏开发和营销等不同行业的需求。PixArt-Σ为用户提供了一种高质量的图像生成工具,能够根据文本提示生成具有特定风格的4K分辨率图像。