資訊

穩定擴散模型的最新動態

最近,穩定擴散推出了新版本,包括 2.1 版和 3.0 版,帶來了性能和安全性的重大提升。穩定擴散 2.1 版本通過新的文本編碼器 OpenCLIP 增強了表達範圍,提高了圖像質量,並優化了數據集過濾方式,增加了生成人物圖像的質量。此版本還改進了解析不同藝術風格的能力,特別是在極端縱橫比的圖像創建上具有更高的靈活性。此外,2.1 版本也引入了“負提示”功能,允許用戶指定不希望生成的圖像細節,從而提高生成圖像的精確度。 穩定擴散 3.0 版本目前處於早期預覽階段,已開放等候名單註冊。該版本在多主題提示、圖像質量和拼寫能力方面有顯著改進。新版本採用了擴散變換架構和流匹配技術,提供了從 800M 到 8B 參數的多種模型選擇,以滿足不同用戶的需求。穩定擴散 3 強調安全和責任感,引入了多項安全措施,以防止模型被不良行為者濫用,並計劃在正式發布前進一步完善。 Web UI 方面,穩定擴散提供了基於 Gradio 庫的瀏覽器界面,支持從文本提示生成圖像、圖像到圖像處理等多種功能。此界面允許用戶輕鬆控制和調整參數,以創造不同風格的 AI 生成圖像,無需在個人電腦上安裝額外軟體即可通過瀏覽器訪問並使用。 這些更新強調了開放源代碼和社區合作的重要性,預示著 AI 發展的新趨勢和更廣泛的應用前景。