「谷歌 GAN 生成人臉」對抗創造新藝術風格,128 像素擴展到 4000
新智元編譯
(文/Mike Tyka)一段時間以來,我一直在嘗試使用生成神經網路製作人物肖像。早期試驗基於類似 Deep Dream 的方法,但最近我開始將精力集中在 GAN 上面。當然,無論在什麼時候,高精度和精確的細節都是很難實現的,使用 GAN 生成人臉也一樣。首先,這些網路的感受野往往不到 256×256 像素的大小。
解決這個問題的一種辦法是使用 stack GAN。我用基於 stack GAN 的方法,終於將像素提升到 768×768 的大小,最多使用 3 個階段 stack 將像素提升到了 4k×4k。我不在意結果是否真實,但細節紋理逼真很重要。
為了減少 artifact(模糊不清的地方),我需要應對 mode collapse 等各種問題。具體說,光滑皮膚和多毛皮膚之間,第二階段 GAN 是 meta stable,往往導致輸出變成一塊一塊的。
現在我使用的最多是 vanilla GAN。當然,我覺得我也該試一下 WGAN、CramerGAN 或 BEGAN,因為大家都說後面幾種收斂更好。
下面就是我使用 GAN 生成的空想人物肖像(我選了效果比較好的放上來)。
生成圖像的質量與低解析度輸出(lowres output)實現密切相關。我通常在第一階段生成 128×128 或者 256×256 像素的結果,然後在第二階段提升至 768×768 或者 1024×1024。大多數情況下,生成的結果都很糟糕,遠遠沒有我挑選出來的這幾張好,但有些時候會出現非常富有藝術性的圖像,偶爾看上去還像是有藝術風格誕生。
我在最後的第三階段將像素提升到 4k。但是,實際上我並沒有這個像素級別的訓練數據,也就是說,網路做的只是大致預測邊緣是否平滑等等。
系統不可能知道皮膚高解析度的人臉資料庫。毛孔或睫毛這些細節。因此,我們需要一個與高解析度的人臉資料庫。
考慮到最終的印刷效果,在這種解析度下故意保留一些 artifact 可能還不錯(相比 )。
Mike Tyka 參考了下面這篇論文中所提到的方法 Stack-GAN,並且在論文基礎上做了 3 次堆疊。有興趣你也可以一試:)
摘要
根據文本描述合成逼真圖像是計算機視覺一大挑戰,也有很多應用。使用現有方法合成的圖像在細節和生動方面差強人意。本文中,我們提出 StakeGAN 方法,根據文本描述生成逼真的圖像。在第一階段(Stage-I GAN),GAN 根據給定描述生成相對原始的形狀和基本的色彩,得出 Stage-I 低分辨圖像。Stage-II GAN 將 Stage-I GAN 和文本描述作為輸入,生成高解析度的逼真圖像。Stage-II GAN 能夠修正錯誤,增加令人信服的效果和細節。使用 StackGAN 生成的圖像比現有方法更加合理逼真。最重要的是,StackGAN 根據文本第一次生成 256×256 像素的圖像,現有方法最多只能生成 128×128 像素的圖像。
※「歷史最高A輪?」Bengio聯合創立的Element AI融資1.375億美元
※Bengio聯合創立的Element AI融資1.375億美元
※MXNet達成一萬個星;馬斯克:威脅人類的是深度人工智慧;華夏-微軟宣布在AI投資領域戰略
※AI時代市場營銷生存指南:8大應用方向,無限搜索與超級個性化
※腦研究:海馬體發現「事件細胞」,神經重組反映時間順序
TAG:新智元 |
※2018UI設計風格
※萬豐國際點擊部17308833339具有英倫的風格和單品中形象的塑造感
※Yamy段奧娟換風格?《創造101》今晚58進36!
※復古計時風格!XF廠沛納海pam518 519 520 測評
※1972年款雅馬哈XS650改極簡風格Bobber
※76平米北歐風格全包才8.2萬,裝完的感覺有100平米
※美國最牛豪車店,展廳完全是老美風格,威龍1974萬,邁巴赫62S僅230萬
※北京別墅裝修-新世界麗樽別墅500-1000㎡ 新中式風格效果圖
※20萬,怎樣打造103㎡港式風格新家
※D-632018秋冬女裝 風格自由時尚
※4種風格+30套開學穿搭,回頭率100%
※13萬打造134平典雅輕奢,精緻歐式風格家!
※20多歲身高170+的女生適合什麼類型的搭配風格
※香奈兒2016與2017的風格之變化您注意到了吧
※MIUI 9 8.5.11流出:界面風格大變
※2018夏季流行的4大美甲風格
※2018值得期待的10部動畫!風格各異!
※6.5萬打造滄州139平米歐式風格裝修設計
※濃濃的OPPO風格!驍龍450賣1500將低配高價演繹的淋漓盡致
※2018年4種奇怪的流行插畫風格