當前位置:
首頁 > 知識 > GANs合輯 國慶特輯

GANs合輯 國慶特輯

國慶節來了,社長我也休息一下。

藉此機會,把我們之前發過的內容做一次總結,也方便大家查閱~

今天帶來的是GANs合輯。

GANs從去年火起來之後,應用範圍越來越廣,我們也在努力的跟上,所以也發了一些文章。

每篇文章之間的聯繫不強,大家可以根據摘要選擇文章去讀。(封面圖這個幽默,你懂了么?)

大家可以把本文收藏下來,這樣方便回過頭來向各個章節跳轉。

生成式對抗網路(GAN)是近年來大熱的深度學習模型。最近正好有空看了這方面的一些論文,跑了一個 GAN 的代碼,於是寫了這篇文章來介紹一下 GAN。

本文主要分為三個部分:

介紹原始的 GAN 的原理

同樣非常重要的 DCGAN 的原理

如何在 Tensorflow 跑 DCGAN 的代碼,生成如題圖所示的動漫頭像,附送數據集哦 :-)

本文會從頭介紹生成對抗式網路的一些內容,從生成式模型開始說起,到 GAN 的基本原理,InfoGAN,AC-GAN 的基本科普,如果有任何有錯誤的地方,請隨時噴,我剛開始研究 GAN 這塊的內容,希望和大家一起學習。

GAN 網路是近兩年深度學習領域的新秀,火的不行,本文旨在淺顯理解傳統 GAN,分享學習心得。現有 GAN 網路大多數代碼實現使用 Python、torch 等語言,這裡,後面用 matlab 搭建一個簡單的 GAN 網路,便於理解 GAN 原理。

GAN 的鼻祖之作是 2014 年 NIPS 一篇文章:Generative Adversarial Net,可以細細品味。

分享一個目前各類 GAN 的一個論文整理集合

再分享一個目前各類 GAN 的一個代碼整理集合

2017 年 4 月 21-23 日,VALSE(視覺與學習青年學者研討會)在廈門舉行,國內 CV 領域頂級專家學者齊聚一堂,參會的青年學者達 2000 多人。在 VALSE 的「年度進展評述」環節,共有 12 名學者依次上台,對 CV 研究和應用分支領域近年發展做了詳細系統的梳理,堪稱「12 顆重磅炸彈」。針對近年來 CV 領域火熱的方向之一:GAN,哈爾濱工業大學計算機學院教授左旺孟從多方面做了詳盡的評述報告。

啦啦啦,現今 GAN 演算法可以算作 ML 領域下比較熱門的一個方向。事實上,GAN 已經作為一種思想來滲透在 ML 的其餘領域,從而做出了很多很 Amazing 的東西。比如結合卷積神經網路,可以用於生成圖片。或者結合 NLP,可以生成特定風格的短句子。(比如川普風格的 twitter......)

可惜的是,網路上很多老司機開 GAN 的車最後都翻了,大多只是翻譯了一篇論文,一旦涉及演算法實現部分就直接放開源的實現地址,而那些開源的東東,缺少了必要的引導,實在對於新手來說很是懵逼。所以兔子哥哥帶著開好車,開穩車的心態,特定來帶一下各位想入門 GAN 的其他小兔兔們來飛一會。

CycleGAN 是在今年三月底放在 arxiv 的一篇文章,文章名為 Learning to Discover Cross-Domain Relations with Generative Adversarial Networks,同一時期還有兩篇非常類似的 DualGAN 和 DiscoGAN ,簡單來說,它們的功能就是:自動將某一類圖片轉換成另外一類圖片。

GAN 從 2014 年誕生以來發展的是相當火熱,比較著名的 GAN 的應用有 Pix2Pix、CycleGAN 等。本篇文章主要是讓初學者通過代碼了解 GAN 的結構和運作機制,對理論細節不做過多介紹。我們還是採用 MNIST 手寫數據集(不得不說這個數據集對於新手來說非常好用)來作為我們的訓練數據,我們將構建一個簡單的 GAN 來進行手寫數字圖像的生成。

此前我們曾編譯了一篇英文教程,詳細介紹了如何基於 PyTorch 平台用 50 行代碼實現 GAN(生成對抗網路),詳情參見:在 PyTorch 上跑 GAN 只需要 50 行代碼,不試試?近期,針對文中介紹的 「50 行代碼 GAN 模型」,有開發者指出了局限性,並基於此模型給出了改進版本,也就是本文將要介紹的 「130 行代碼實現 GAN 二維樣本」。

對於圖像問題,卷積神經網路相比於簡單地全連接的神經網路更具優勢。

本文將繼續深入 GAN,通過融合卷積神經網路來對我們的 GAN 進行改進,實現一個深度卷積 GAN。

如果還沒有親手實踐過 GAN 的小夥伴可以先去學習一下上一篇專欄:生成對抗網路(GAN)之 MNIST 數據生成。

本次代碼在 NELSONZHAO/zhihu/dcgan,裡面包含了兩個文件:

dcgan_mnist:基於 MNIST 手寫數據集構造深度卷積 GAN 模型

dcgan_cifar:基於 CIFAR 數據集構造深度卷積 GAN 模型

本文主要以 MNIST 為例進行介紹,兩者在本質上沒有差別,只在細微的參數上有所調整。由於窮學生資源有限,沒有對模型增加迭代次數,也沒有構造更深的模型。並且也沒有選取像素很高的圖像,高像素非常消耗計算量。

本節只是一個拋磚引玉的作用,讓大家了解 DCGAN 的結構,如果有資源的小夥伴可以自己去嘗試其他更清晰的圖片以及更深的結構,相信會取得很不錯的結果。

Generative Adversarial Network,就是大家耳熟能詳的 GAN,由 Ian Goodfellow 首先提出,在這兩年更是深度學習中最熱門的東西,彷彿什麼東西都能由 GAN 做出來。我最近剛入門 GAN,看了些資料,做一些筆記。

上次帶大家寫了原始版的 GAN,只生成了高斯分布。但兔子哥哥發現在 GAN 論文的底下,有 GAN 生成圖片的 example。

因此,這足以說明 GAN 亦有能力生成圖片,並非只有 DCGAN 才能生成圖片,這一點與我學 GAN 之前的認知大為不同。於是我就開始嘗試了使用原始的 GAN 來嘗試生成圖像,但接下來,我就開始懷疑人生了。

在開始的時候我採用了 MINST 的數據集,按照我上一篇文章兔子哥哥帶你從零寫一個 GAN中提及的訓練 GAN 的方式中連續訓練原始 GAN 多次,得到的仍然全是噪點,並沒有一點手寫數字的影子。

在嘗試多次後,未免讓我懷疑我是不是讀了假論文,自己是不是一隻假兔子。

在查閱多番資料後,在知乎偶遇到,令人拍案叫絕的Wasserstein GAN - 知乎專欄(下文簡稱 WGAN) 一文,不讀不知道,讀了簡直驚為天人。讀完之後,我打消了原本打算去學習 DCGAN 的念頭,改成繼續學習 WGAN。因此,本文兔子哥哥將會帶讀者一起來領略一下 WGAN 的風采。

文章目錄如下:

為什麼原始 GAN 訓練困難重重?

WGAN 是什麼鬼?

WGAN 的個人一些使用經驗總結

本文由作者 Adit Deshpande 總結,AI 研習社編譯整理。Adit Deshpande 目前是 UCLA 計算機科學專業生物信息學方向的大二學生。他熱衷於將自己的機器學習和計算機視覺技術應用在健康領域,給醫生和患者帶來更好的解決方案。

一直以來,Adit Deshpande 都有總結和解釋一些深度學習論文的習慣,在本文中,Adit Deshpande 將圍繞對抗生成網路(GANs)的主題來展開介紹。

近些年來,生成對抗網路在許多圖像生成和圖像編輯任務上都獲得了很大的成功,並受到越來越多的關注。對於圖像編輯任務,現在面臨的兩個重要的挑戰分別是:如何指導網路向目標圖像學習(以提升圖像編輯的效果)和如何感知輸入圖像內容(以提升圖像編輯的精度)。

悉尼科技大學 FEIT 三年級博士生,優必選悉尼 AI 研究院訪問學生,陶大程教授學生王超岳在 AI 研習社主辦的學術青年分享會上結合他的兩篇論文Tag Disentangled Generative Adversarial Networks for Object Image Re-rendering(IJCAI 2017 Best student paper)和Perceptual Adversarial Networks for Image-to-Image Transformation(arXiv 2017),分享了對圖像編輯做出的相應探索。

新人福利

關注 AI 研習社(okweiwu),回復1領取

【超過 1000G 神經網路 / AI / 大數據,教程,論文】

入門合輯,不知道該怎麼入門的可以看這裡 | 國慶特輯


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 唯物 的精彩文章:

入門合輯,不知道該怎麼入門的可以看這裡
2分鐘論文系列合輯
深度學習之父Geoffrey Hinton的神經網路合集
Deep Learning解讀合輯 國慶特輯
微軟刷新了SQuAD記錄!聊天機器人居然懂人類情感?谷歌大腦「神經網路優化器搜索」又雙叒叕更新……

TAG:唯物 |