完勝柯潔之後,AI 又想搶藝術家的飯碗……
在機器學習越來越火的今天,人們漸漸得看到很多機器產生的藝術,並且警覺了起來,如果藝術這塊領域也被機器佔領,那麼人類還剩下什麼?確實現在機器學習已經漸漸可以吟詩作畫,可以模仿大師的風格,雖然目前來說水平還都不怎麼樣,但誰都不敢小看技術發展的速度,畢竟從0到1是最難的,從1到2隻是時間問題。我們現在恰好就在發展的時間段上。
由Google開發的人工智慧「創作」的繪畫作品
令人驚艷的AI藝術家:Magenta
Magenta 是 Google Brain 團隊正在研究一個項目,用機器學習的方法來推進音樂和畫作,並已經於去年6月份推出。很多人聽到這個項目第一反應就是,哦,用機器來生成音樂和畫作,我們人類可以到一邊去了。但其實並非如此,這個項目想要建立新時代的藝術工具,幫助音樂家和畫作做出更好的作品。
音樂和繪畫在很久很久以前不插電的那個年代就有了,音樂是人類靈魂的一部分,無論是敲打還是歌唱都是人類與身俱來的本領,在山洞裡那一塊石頭刻畫也是我們祖先智慧的證明。但到了今天,我們有了吉他,有了電吉他,有了音響,有了照相機,年輕人開始在 Ipad 上,在繪畫版上畫畫,新時代的工具造就了新時代的藝術潮流,老一輩可能完全不能接受,但不可否認科技的發展推動了藝術的發展。
所以 Magenta 的目標並不是他自己產生什麼藝術作品,而是在五年後有人利用 Magenta 這個新時代的工具創造了新時代的藝術。
Magenta 背後的黑科技是什麼?
必須是機器學習,機器學習其實就是一組很多層的計算單元組合在一起,然後能夠從圖片或者序列數據中提取到一些我們感興趣的特徵。例如下圖我們要識別一張圖片中是貓是狗?
一個經過訓練的深度神經網路可以輕鬆完成這個任務。他首先在底層提取出線條,弧度等基本元素,然後在中間層提取出一些基本的圖案,例如圓形,直角,條紋等等。然後在最上層提取出一些圖像的高層元素,例如眼睛,耳朵,鼻子等等。最後根據這些元素,來做出正確的貓狗分類。
其實神經網路並不是一個特別新的模型。早在1980年就已經有人提出,只是在那個時候神經網路的表現並不如其他模型好。但是當計算能力和數據都有了質的飛躍,擅長擴展的神經網路模型在今天已經超過了其他模型成為表現最好的模型之一。
靈魂畫手AI:Sketch-RNN
Magenta 是 Google Brain 給整個大項目的起的名字,旗下包含了多種多樣的小項目,有藝術的,有音樂的。這篇文章會著重講解其中一個小項目 Sketch-RNN,就是傳說中的靈魂畫手 AI。其實就是我只要先畫幾筆,整個程序就可以把剩餘的畫給畫出來。
整個項目的高層面其實就是一個 Autoencoder 。即一個編碼器把輸入序列變成一個中間表達z,這個中間表達z要比輸入數據佔用更小的空間,也就是說編碼器必須學習到一些歸納或者特徵提取的方法來用更小的中間狀態z來表達輸入數據。接著一個解碼器把中間狀態z通過另一種方式解碼成我們想要的輸出。通過不斷的訓練,我們就能夠得到不錯的編碼和解碼器從而能夠講輸入的一個個筆畫變成一幅完成的畫。
我們可以這個圖切開一個個說
輸入
輸入就是一個個畫圖中的筆畫,而且這裡是一個筆畫的序列。無論是在訓練還是預測環節,筆畫的序列都是至關重要的信息。
編碼器
編碼器用了雙向LSTM網路,把輸入序列中每一個筆畫正序倒序進行編碼,並最終得到一個中間狀態,存儲了輸入序列中的每個筆畫和整個序列的順序。有了這些編碼後的信息,之後的解碼器就可以解碼出一個序列來執行剩餘的筆畫。
中間狀態
雙向LSTM網路的狀態合并以後輸入給中間狀態,同時為了保證在解碼的過程不會太依賴中間狀態,我們也會增加一些噪音,就好像在圖片訓練的過程中我們有dropout來幫助增強網路的魯棒性。
解碼器
解碼器是另一個LSTM網路,同時在網路的每一個輸出層添加了一個高斯分布將向量轉換成最終的筆畫。這和語言翻譯的seq2seq模型相同,在解碼的過程中,訓練和推理會用到不同的輸入數據,訓練的時候使用真實的解碼筆畫數據,推理的時候使用上一個LSTM狀態。這個在實踐中一定會注意到。
輸出
輸出當然也是一個筆畫的時間序列,我們可以看幾個例子:
示例1:如果我畫一個雨點,其他的雨點就會自動產生。
示例2: 如果我畫一條條雨絲,其他的雨絲就會自動產生。
示例3: 如果我畫一朵雲,那麼雲下面就會開始下雨。
示例4:如果我畫一艘船,那麼船上的其他東西就會自動跑出來。
示例5:如果我就畫兩個耳朵,那麼圓臉的貓和鬍鬚就會自動出來
還有很多圍繞這個項目的有趣例子。例如可以在中間狀態z附近隨機抽樣幾個點,然後看解碼器能給出什麼結果。例如可以在中間狀態進行狀態運算,然後看解碼器會給出什麼。
更多項目體驗
Magenta還包含其他很多很好玩的項目,給大家展示一下Demo,也推薦你們自己去試試。
項目1:AI Duet
這個項目中,我們彈了幾秒鐘鋼琴,人工智慧能夠回復我們一段音樂。裡面的技術細節就不說了,和人工智慧的來回交流,你想不想現在就體驗一下呢?
項目2:Quick draw
這個項目中,我們有20秒時間來畫一個簡單的東西。例如拖鞋,例如畫框,等等。20秒也就只能畫幾筆,然後一邊畫一邊人工智慧就在猜你花了什麼。比如我畫的是拖鞋,它猜出是遙控器,深深為自己的繪畫水平擔憂啊!
畫了一個拖鞋,成功和已知的一隻拖鞋匹配,開心!
又掏心掏肺花了一個畫框,結果被當作是一個插頭或者洗衣機。
Quickdraw 好不好玩,快去親自體驗吧!
大師還是工具?
如果你玩完了所有這些項目,那看來這樣的交互你覺得很有趣。相比來說,按一個按鈕就讓人工智慧開始創作就顯得很無趣。我們也可以思考看看,究竟未來的人工智慧會成為創造音樂,創造畫作的大師,還是新時代藝術家的工具,啟發我們人類作出全新的藝術作品?
Udacity上的 Machine Learning(機器學習)在線課程,最近就要開班啦,報名倒計時只剩最後3天!
優達學城(Udacity)與 Google、滴滴出行合作開設的 「機器學習工程師」 納米學位項目將教你如何成為一名機器學習工程師,並將預測模型應用於金融、醫療、教育等領域內的大數據處理。
TAG:優達學城Udacity |
※AI來襲,你的「飯碗」還好嗎?
※藝術家們小心了!人工智慧要跟你們搶飯碗了……
※為了「奪回飯碗」,美國開出天價!但……富士康還是想找中國?
※人工智慧來啦?藝術家們,小心你的飯碗
※未來,AI搶了人類「飯碗」,誰消費?
※不冷笑話:貓咪看到飯碗里沒有貓糧之後……
※威脅你飯碗的不是人工智慧,而是……
※小島秀夫:雲遊戲時代即將來臨!不用擔心AI搶飯碗!
※「惹不起」的買家秀,老闆娘看完狂抱大腿,模特:別搶飯碗好嗎?
※「大神級別」的漢服買家秀,看到最後,網友:這是和模特搶飯碗?
※未來已來,我們的孩子怎麼才能搶贏AI的飯碗?
※機器人:搶走飯碗,還是帶來職業安全?
※佟麗婭把垃圾往劉憲華飯碗里扔,後者:沒關係,我都可以吃!
※美術生「公認」最抓狂的瞬間,看到最後,乞丐:喲,搶飯碗呀!
※真想不到,搶廠商的飯碗,是他們
※「仙女級別」買家秀完美逆襲,看完後,模特:跪求留個飯碗吧!
※人工智慧會讓藝術家「丟飯碗」嗎?
※這群該在家裡帶孫子的爺爺奶奶,突然進軍模特圈跟鮮肉搶飯碗。。結果當然是:K.O!
※人工智慧時代來臨,你的飯碗還好嗎?
※范冰冰、林允,你們是打算搶美妝博主的飯碗嗎?