(資料圖片)
IT之家 6 月 25 日消息,Stability AI 近日宣布,旗下文字生成圖片模型 SDXL 0.9 已經正式推出。該版本在圖像內容與構圖細節(jié)方面做了大幅改進,并可以在消費級 GPU 上運行。
據悉,SDXL 0.9 在所有開源圖像模型中參數數量位居前茅,其具備一個 35 億參數的基礎模型和一個 66 億參數的附加模型。圍繞這兩個模型,SDXL 的工作原理即,使用基礎模型創(chuàng)建粗略的細節(jié),再使用附加模型精細化生成的圖片,如果IT之家的小伙伴們有使用過 Stable Diffusion 的話,應該可以注意到這一漸進式的工作過程。
▲ 圖源 SDXL 團隊
Stability AI 表示,SDXL0.9 中使用了兩個 CLIP 模型,其中包括 OpenCLIP vitg /14,這是迄今為止體積最大的 OpenCLIP 模型。憑借該模型,Stable Diffusion 可以創(chuàng)建深度更廣、分辨率更高的逼真圖像。
Stability AI 同時表示,SDXL 團隊將發(fā)布一篇研究博客,詳細介紹 SDXL 0.9 的模規(guī)范和更多參數細節(jié),預計該模型將在 7 月迎來 1.0 正式版本,并將在 GitHub 開源。
標簽: