Facebook 創意生成網路CAN，比 GAN 更有創造力

新聞 07-04

實驗發現，人類參與者認為計算機生成的圖像和人類藝術家畫作在創意程度上不相上下。

新智元編譯

來源：hackernoon.com

編譯：文強

【新智元導讀】美國羅格斯大學、Facebook AI 實驗室和查爾斯頓學院的研究人員合作，在生成對抗網路（GAN）的基礎上，對損失函數稍作修改，提出了創意生成網路（CAN），能夠生成「具有創意」的畫作。實驗發現，人類參與者認為 CAN 生成的圖像和人類藝術家畫作在創意程度上不相上下。

近來，生成對抗網路（GAN）在生成抽象內容方面成效顯著。今天我們要介紹的研究，則進一步探討了計算機在「創造力」方面的能力。

模仿大師 GAN：生成器和鑒別器的博弈

我們知道，GAN 由兩個相互博弈的神經網路組成，即生成器和鑒別器。顧名思義，生成器負責根據輸入生成數據（輸入可以是雜訊，也可以是一些其他的數據）。鑒別器負責分析數據，並區分這些數據是真實的（來自數據集），或者是虛假的（來自生成器）。在數學上，這可以被看作是生成器和鑒別器之間的小遊戲：

如果上面的公式看上去很複雜，不必擔心——你不是一個人。下面，我們依次說明公式里的各個部分都代表什麼。

首先，公式的左邊是 MiniMax 方程。

下標 G 和 D 分別代表生成器 G（Generator）和鑒別器 D（Discriminator）。生成器的工作是將方程的值最小化，而鑒別器負責將這個值最大化。生成器 G 和鑒別器 D 會一直博弈，直到我們決定停止為止。

鑒別器 D 接收來自真實數據集的輸入 x，然後輸出它判定為真的結果 log(D(x))。

G(z) 表示生成器生成的數據。log(1-D(G(z)))) 計算的是鑒別器在判定數據真假方面表現得有多好。D(G(z)) 表示鑒別器認為是真實的那些數據。用 1 減去這個值則表示判別器認為不是真實的數據。

將所有綜合在一起，鑒別器負責將 log(D(x) + log(1-D(G(z)))) 的值最大化，而生成器則負責使 D(G(z))) 的值最大化，從而使上述值最小化。

生成器會不斷修正自己，讓鑒別器判定其生成的值是真實的，而鑒別器也會不斷修正自己，讓自己能判別出虛假的數據。

因此，生成器 G 要做的，就是讓自己的輸出與真實數據儘可能地相似。

而要讓計算機「有創意」，就必須讓生成器生成嶄新的數據，光是讓生成器去模仿是不夠的。

修改 GAN 的損失函數，讓創意對抗網路 CAN 「有創意」

論文作者在生成對抗網路的基礎上，提出了一種新的架構，能夠生成「有創意」的內容。他們實現的方法，是在生成器上面增加了一個信號，避免讓生成器生成與現有數據過於類似的內容。

具體說，論文作者修改了 GAN 的損失函數。

下面，我們來詳細看看 CAN。

在原始的 GAN 架構中，生成器會根據生成內容是否「騙過」了鑒別器來修改權重。GAN 的架構是不會探索新的內容的，GAN 做的只是模仿，其目標就是生成與真實數據集毫無二致的數據。

而 CAN 在兩個方面作了修改：

鑒別器不僅僅會判定數據的真假，還會根據圖像屬於哪個時間段（time period）進行分類

然後，生成器會接收這一額外的信息，將那個指標和鑒別器的真假判斷一起做衡量

這樣做的結果是什麼呢？

有了時間段（以及置信度）這個額外的指標後，生成器就知道它生成的內容與一個時間段的內容的相似度有多高了。

於是，生成器就能不僅讓其生成的內容與真實數據相似，同時還能與某一時間段的內容不那麼相似。

上圖展示了創意對抗網路 CAN 的架構。可以發現，主要的修改發生在損失函數部分。新的損失函數如下：

那麼，我們再來看看這個新的損失函數。

上面一行與 GAN 的損失函數類似。注意，下標 r 表示鑒別器對真實/虛假的輸出，下表 c 表示鑒別器對時間段分類的輸出。

第二行則是為了讓系統輸出有創意的重頭戲。

看上去有些複雜，實際上就是多標籤交叉熵損失（Multi Label Cross Entropy Loss）。注意，這裡的 K 表示分類的數目。這個損失跟常見分類器用的損失是一樣的。生成器會將這部分值最小化，從而將新損失函數的值最大化。

人類參與實驗者的評估結果：CAN 生成了藝術作品

下面展示的就是 CAN 生成的圖像。

如何？

下面是藝術展 Art Basel 2017 展出的 21 位人類畫家的作品（實驗中選擇了 25 位，這裡露出 21 位）：

為了驗證 CAN 生成的圖像是否「有創意」，論文作者特意做了幾組實驗。他們請 Amazon MTurk 上的人類參與者觀看 GAN、DC-GAN、CAN 生成的圖像和人類畫家的作品，然後評估圖像的創新程度、複雜程度、讓人意外的程度，以及是人類畫家創作的，還是計算機生成的等問題。

結果如下表所示。

從第二欄 Novelty 得分可以發現，參與實驗的人類志願者認為，CAN 生成的圖像較之藝術家作品（下面兩行）在創意上相差不大，甚至超過了抽象派藝術家。

參與實驗的人還認為，CAN 比 GAN 更加「創新」——評判是由人創作的還是計算機生成的提問 Q6，結果是 75% vs. 65%。

至於是 CAN 更有創意，還是人類畫家更有創意，論文作者並沒有給出確切的回答。要了解更多，在看完摘要後，可以下載他們的論文，對實驗以及思路有詳細的介紹。

創意生成網路 CAN：學習風格並從學會的風格偏離，生成「藝術」

摘要

我們提出了一個新的藝術創作系統。這個系統能夠通過觀看圖像學習風格進行藝術創作。不僅如此，這個系統還能偏離已經學會的風格，增強生成圖像的喚醒能力（arousal potential），從而變得具有創造力。我們建立了生成對抗網路（GAN），GAN 在接收給定分布的輸入後，能夠學習生成全新的圖像。我們認為，GAN 結構原本生成有創意的產品的能力有限。我們通過修改網路的目標，使其最大限度地偏離已經確立的風格，同時最小限度地偏離藝術分布，從而創造有創意的圖像。我們進行了實驗，比較了人類參與者觀看系統生成的圖像和藝術家創作的畫作的反應。結果表明，人類參與者無法分辨系統生成的圖像和當代藝術家在頂級藝術博覽會中展示的畫作。

論文地址：https://arxiv.org/pdf/1706.07068.pdf

論文已在 6 月亞特蘭大舉行的第 8 屆國際計算機創意大會（ICCC）發表

點擊「閱讀原文」查看新智元招聘信息

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※NLP大突破：語義角色標記深度模型，準確率提升10％
※一圖讀懂你不得不知道的10個影響人類社會的演算法
※AI TOP 10-百度開源中文建模工具，谷歌自動卡車曝光

TAG:新智元 |

您可能感興趣

※Ian Goodfellow：生成對抗網路 GAN 就是強化學習超全資料
※Ian Goodfellow：生成對抗網路 GAN 就是強化學習（超全資料）
※Coindesk也要發幣？｜EOS矽谷測試網路完成搭建｜Telegram放棄ICO計劃
※Facebook，Twitter，Snapchat三大社交網路同時登陸GMIC！
※哈希日報：OmiseGo與泰國ETDA達成合作關係；ATM網路商Athena Bitcoin即將支持BCH
※UNDEFEATED x Air Jordan 4 Sample 現身網路
※Ian Goodfellow：生成對抗網路 GAN 的公式是怎樣推導出來的
※OFF-WHITE × Vapor Street Flyknit 驚現網路！
※還有彩虹配色？！OFF-WHITE x Blazer Mid 「Rainbow」驚現網路
※全球最稀有的 Nike SB Dunk 「eBay」現身網路！
※SDN與NFV催生智能網卡需求，Ethernity基於FPGA加速虛擬化網路
※NSA網路武器DoublePulsar升級，Windows Embedded也淪陷了
※無人機開發商PrecisionHawk收購Droners、AirVid，建造行業專才網路
※淺入淺出TensorFlow 6—實現AlexNet和VGG等經典網路
※網路大時代下的頂級音質——Apogee Symphony I/O MkII WSG 初探
※電池能源初創公司Gegadyne EnergyLabs獲孟買天使網路MAN新一輪融資
※Facebook將關閉三個社交網路應用程序：Moves，Hello和TBH
※把醬油瓶放進菜籃子：UC Berkeley提出高度逼真的物體組合網路Compositional GAN
※基於注意力機制的深度網路HydraPlus-Net
※「Science重磅」DeepMind生成查詢網路GQN，無監督學習展現3D場景