谷歌多次嘗試結合AI和藝術,可意義在哪?
提到谷歌的人工智慧,大家想到的大多是會下棋的阿爾法狗和Waymo無人車。可要我說,谷歌對於教人工智慧畫畫這件事,好像有種特別的執念。
今年,谷歌推出了一款可以幫助人畫簡筆畫的工具Autodraw,隨便畫幾筆,演算法就能識別出你想要畫什麼圖案,為你優化出來。其實這並不是谷歌推出的第一個人工智慧+繪畫項目,早從2015年開始,谷歌就已經在用演算法挑戰人類對藝術的認識和審美了。
DeepDream:是深夢還是噩夢?
谷歌不僅僅有DeepMind,還有DeepDream——利用深度學習技術識別圖片,再把自己解讀的畫面呈現出來。後來谷歌將這一項目開源,讓所有人都可以上傳圖片,再生產出被DeepDream解讀的結果。
不知道是不是在訓練是被餵了太多眼睛和小狗的圖案,反正經過DeepDream加工過的圖片基本都是這樣……
充滿了狗臉、眼睛、詭異的螺旋圖案,有種異樣的魔性。谷歌甚至還為DeepDream舉辦過一次展覽,展出的六幅作品還被一位收藏家拍了下來,最高單幅價格高達 8000 美元。這可能是第一位靠「藝術」賺錢的人工智慧了。
實際上,谷歌DeepDream真正想要了解的,是神經網路黑盒子的工作邏輯。我們都知道,神經網路在識別圖像時通常是層數越多、越細緻,第一層神經網路可能在識別輪廓,中間層的神經網路可能就在識別紋理、筆觸等等細節了。我們看到的那些正確識別出圖像的演算法,都是經由人工調試後的,而DeepDream則跳過了人工指導、矯正這一步,直接憑著自己的意願識別圖片,並且會經過數次重複,最終就成了我們現在看到的樣子。
和上圖一樣,如果讓我們把樹看成建築,把植物看成鳥,恐怕只能去發揮想像力了。這種機器識別出人眼不能識別的圖案的情況,讓我們再一次開始思考機器視覺和人類視覺的不同。或許,DeepDream真的是一個有著無限想像力的嬰兒人工智慧,把人類世界裡的一切都看做它可愛的寵物狗。
Quick,Draw!來和人工智慧玩你畫我猜
很快,谷歌就不再止步於只讓人工智慧畫狗臉了。在去年,谷歌推出了一款叫Quick, Draw!的繪畫小程序。Quick, Draw!其實就是人與人工智慧合作的「你畫我猜」,系統隨機顯示一個名詞,要求用戶在20秒內把它畫出來。用戶用滑鼠簡單畫出物體形狀後,然後 Quick, Draw! 會判斷你畫的到底像不像,並且會顯示出除了題目之外,你的畫還像什麼其他的東西。
顯然,這是一個收集數據的好方法。僅僅半年的時間,就有來自 100 個國家的 2000 萬用戶,在 Quick, Draw! 上共繪製了 8 億幅塗鴉。谷歌還表示,這些數據了反映的不同文化背景與觀念,比如不同國家的人所畫的椅子是不一樣的,有些國家人畫的椅子總是側面,有些則通常是正面。現在,谷歌已經開放了其中的部分數據,供所有開發者一起玩耍。
Autodraw:人工智慧塗鴉大師
文章開頭提到的Auto draw就是Quick,Draw!數據的研究成果,也展示了谷歌強大的機器學習技術。
Autodraw能做到的不僅僅是識別你在畫什麼,它甚至能幫你補完未完成的塗鴉,糾正其中的錯:如果你花了一隻三隻眼睛的貓,Autodraw會去掉一隻眼睛。
這意味著,Autodraw已經擁有了我們所說的抽象思維,它並非僅僅是按照歷史數據規整圖畫的線條,而是「知道」眼睛這一概念,並且知道貓只有兩隻眼睛。
Autodraw的背後,是人工智慧系統SketchRNN。當我們在Quick,Draw!上作畫時,SketchRNN會記下我們每一筆的形狀和順序,為每一種特定物體(貓、椅子等等)訓練出一種神經網路。把人類塗鴉的筆畫當成輸入,進行序列編碼,用人們的繪畫方式來訓練神經網路。完成這一訓練後,SketchRNN就了解了某一圖案繪畫時的「一般規則」,比如我們畫貓時,會畫一張圓臉,兩個尖耳朵,兩隻眼睛,六根鬍鬚。SketchRNN就能明白,一個大圓、兩個小圓、六根線和兩個尖角加起來就是「貓」。然後,再向其中引入變數,讓SketchRNN可以輸出和接受隨機性。比如貓臉的圓形可以不那麼圓,貓的鬍鬚可以長短不齊。但是三隻眼睛這種錯誤超過了變數浮動的範圍,是會被SketchRNN修正的。
和上圖一樣,同樣是汽車,顏色越偏暖的圖案,代表隨機性越大,而這些全都是SketchRNN的作品。
SketchRNN雖然神奇,可很多人認為這項技術的實用性比較差。因為SketchRNN能識別甚至創造圖形的原因,是因為團隊為每一種圖案都訓練了一個神經網路。能做到這些,離不開Quick,Draw!收集到的龐大數據量,更離不開TensorFlow的強大算力。可動用了如此之多的資源之後,SketchRNN的應用範圍還只限制於塗鴉之中,如果圈定在「筆畫」這個邏輯里,或許以後還能在書法上有所作為,但效率如果還停留在每個個字搭建一個神經網路上,性價比未免太低了。
不過也有人提出了其他的看法,有學者認為,「筆畫」是世界範圍共用的溝通方式。象形文字、壁刻畫式的線條會對人類大腦形成一種天然的刺激,人類的藝術創造越來越具象,或許展示了一種大腦和思維進化的可能。按照這個邏輯,SketchRNN或許能為我們找回曾經的思維方式,在未來幫助考古、史學、人類學等等領域更好的進行研究。
※停止對人類的迷戀!AI完全模仿人類大腦是在浪費時間
※傳統零售客流正在「被打劫」,但是不要再怪電商了
※與巨頭劃清界限,如何從零建立一家小而美的人工智慧公司?
※語音界面已經成熟,語音助手的突破口不再局限於智能音箱
TAG:旗瀚科技 |