稳定扩散 XL 1.0: 最新的文图生成模型

2024年4月17日 Stable Diffusion

Stability AI 公司近期发布了其最新的文图生成模型——稳定扩散 XL 1.0，这是一款开源的文图生成模型，旨在提供更加生动、精确的颜色以及更好的对比度、阴影和光线效果。该模型具有 3.5 亿参数，能够在几秒钟内生成全 1-兆像素分辨率的图片，并支持多种长宽比。此外，稳定扩散 XL 1.0 在文本生成方面也有所改进，能够处理复杂的设计任务，并提高文字可读性。

模型的开发考虑到了安全性和道德问题，尽管如此，模型的开源特性意味着潜在的滥用风险仍然存在。为了减少不良内容的生成，Stability AI 在模型训练数据中进行了过滤，并封锁了一些可能引发问题的特定术语。

稳定扩散 XL 1.0 不仅提高了图像质量，还引入了细化功能（fine-tuning），允许用户使用最少五张图片来专门生成特定的人物、产品等内容。模型还被引入亚马逊的 Bedrock 云平台，旨在扩大其在云计算环境中的应用。

此外，Stability AI 正在与多个合作伙伴合作，进一步扩展其 API 功能，支持本地 GPU 加速、动画生成和逻辑多阶段工作流等。公司期待通过这些新功能和合作关系，来提升模型的实用性和影响力。

通过提供这种强大的开源模型，Stability AI 希望不仅仅是图像分辨率的提高，而是在多个层面上实现突破，为所有用户带来益处。

Stable Diffusion