稳定扩散 XL 1.0: 最新的文图生成模型

Stability AI 公司近期发布了其最新的文图生成模型——稳定扩散 XL 1.0,这是一款开源的文图生成模型,旨在提供更加生动、精确的颜色以及更好的对比度、阴影和光线效果。该模型具有 3.5 亿参数,能够在几秒钟内生成全 1-兆像素分辨率的图片,并支持多种长宽比。此外,稳定扩散 XL 1.0 在文本生成方面也有所改进,能够处理复杂的设计任务,并提高文字可读性。

模型的开发考虑到了安全性和道德问题,尽管如此,模型的开源特性意味着潜在的滥用风险仍然存在。为了减少不良内容的生成,Stability AI 在模型训练数据中进行了过滤,并封锁了一些可能引发问题的特定术语。

稳定扩散 XL 1.0 不仅提高了图像质量,还引入了细化功能(fine-tuning),允许用户使用最少五张图片来专门生成特定的人物、产品等内容。模型还被引入亚马逊的 Bedrock 云平台,旨在扩大其在云计算环境中的应用。

此外,Stability AI 正在与多个合作伙伴合作,进一步扩展其 API 功能,支持本地 GPU 加速、动画生成和逻辑多阶段工作流等。公司期待通过这些新功能和合作关系,来提升模型的实用性和影响力。

通过提供这种强大的开源模型,Stability AI 希望不仅仅是图像分辨率的提高,而是在多个层面上实现突破,为所有用户带来益处。

下一页
上一页