(資料圖)
IT之家 6 月 25 日消息,Stability AI 近日宣布,旗下文字生成圖片模型 SDXL 0.9 已經(jīng)正式推出。該版本在圖像內(nèi)容與構(gòu)圖細(xì)節(jié)方面做了大幅改進(jìn),并可以在消費(fèi)級 GPU 上運(yùn)行。
據(jù)悉,SDXL 0.9 在所有開源圖像模型中參數(shù)數(shù)量位居前茅,其具備一個(gè) 35 億參數(shù)的基礎(chǔ)模型和一個(gè) 66 億參數(shù)的附加模型。圍繞這兩個(gè)模型,SDXL 的工作原理即,使用基礎(chǔ)模型創(chuàng)建粗略的細(xì)節(jié),再使用附加模型精細(xì)化生成的圖片,如果IT之家的小伙伴們有使用過 Stable Diffusion 的話,應(yīng)該可以注意到這一漸進(jìn)式的工作過程。
▲ 圖源 SDXL 團(tuán)隊(duì)
Stability AI 表示,SDXL0.9 中使用了兩個(gè) CLIP 模型,其中包括 OpenCLIP vitg /14,這是迄今為止體積最大的 OpenCLIP 模型。憑借該模型,Stable Diffusion 可以創(chuàng)建深度更廣、分辨率更高的逼真圖像。
Stability AI 同時(shí)表示,SDXL 團(tuán)隊(duì)將發(fā)布一篇研究博客,詳細(xì)介紹 SDXL 0.9 的模規(guī)范和更多參數(shù)細(xì)節(jié),預(yù)計(jì)該模型將在 7 月迎來 1.0 正式版本,并將在 GitHub 開源。
標(biāo)簽: