33歲 AI 新生代「教父」已崛起,或將成就人類歷史上邁向具有類人意識機器的一大步
昨日,《麻省理工科技評論》公布了 2018 年全球十大突破性技術,「對抗性神經網路」即「生成對抗網路」作為突破性人工智慧技術赫然上榜。這家全球最頂級科技雜誌編輯部對這項革命性技術給出的評價是:它給機器帶來一種類似想像力的能力,因此可能讓它們變得不再那麼依賴人類,但也把它們變成了一種能力驚人的數字造假工具。
實際上,這是一個青年科學家的故事:今年 33 歲的青年科學家 Ian Goodfellow 在過去數年中通過讓神經網路互打擂台創造出了一款威力強大的 AI 工具。而如今,你、我、他都需要面對這一發明所帶來的後果。
在 2014 年的某個夜晚,為了慶祝一位研究生同學成功畢業,Ian Goodfellow 與他的小夥伴們來到了加拿大蒙特利爾市,人氣極旺的 Les 3 Brasseurs 酒吧。就在大家觥籌交錯之時,他的朋友們突然向他問起了手上一個項目所遇到的難題:如何開發一款可以自己創造圖片的程序。
那時候,研究人員已經開始使用神經網路來試圖創造逼真的圖片。但是,這些由計算機創造的圖片的質量往往十分低下,比如人臉照片,要不然會是十分模糊,要不然就會出現少一隻耳朵這種錯誤。Goodfellow 的朋友們當時計劃,首先對照片的各種元素進行複雜的統計分析,然後用分析結果對神經網路進行訓練,讓它學會如何生成逼真的照片。而由於這將需要海量的計算力,Goodfellow 當場就直接跟他們說了這不可行。
圖 | Ian Goodfellow
但是,科學家思維讓他在喝酒之餘也止不住對這個難題的思考。他突然間獲得了一個靈感:如果再多的數據也無法讓一個神經網路學會如何生成逼真的圖片,那麼兩個相互對抗的神經網路可不可以呢?對此,他的朋友們表示保持懷疑,但他決定當晚回家就動手試試。背著他熟睡的女友,Goodfellw 直接一口氣編程到清晨,把他腦中「兩個對抗的神經網路系統」給創造了出來。而這個系統在首次測試時,就成功了。
如今,他四年前那晚上所發明的技術被稱之為GAN,即對抗式生成網路(Generative Adversarial Network)。而在短短四年內,這項技術給機器學習領域帶來了巨大的影響,也讓它的發明人成為了 AI 領域裡的一名新生代"教父"。
在 GAN 出現之前的幾年裡,AI 領域的研究人員們通過深度學習(Deep Learning)而實現了驚人的突破。只要你為一個深度學習系統提供經足夠多的圖片,它就能學會分辨出「即將過馬路的行人」這種圖片識別能力。正是通過深度學習,自動駕駛汽車以及驅動 Alexa 和 Siri 等虛擬助手的對話技術才能成為現實。
然而,雖然基於深度學習手段的 AI 系統可以學會識別東西,但它們非常不擅長創造東西。GAN 的目標則是為機器帶來一種類似人類想像力的能力。
如果我們實現這一點,我們不僅可以讓機器學會如何作畫或作曲,我們也可以減少機器對人類指導的需求。畢竟對於 AI 系統來說,它對於這個世界以及其運轉方式的認知都是必須由人類提供的:開發者需要告訴 AI 系統所輸入數據究竟是什麼,比如在一百萬張圖片里,哪些是行人過馬路,哪些不是。而這不僅僅需要大量的人工和費用,這也限制了 AI 系統處理脫離其訓練內容的能力。通過 GAN,未來的 AI 系統將更善於使用沒有經過大量處理的原始數據來進行訓練,並且可能在不需要外部指導的情況下就能自己學會所需要的。
這意味著,我們的 AI 技術將往「無監督學習」方向邁出一大步,極大的簡化、加快 AI 產品的普及。比如,一輛從未行駛過一公里,在車庫裡就能學會如何處理各種情況的自動駕駛汽車,或者一台從未去過倉庫,在廠房裡就能得知倉庫內一切障礙的倉儲機器人。
想像與反思的能力正是人類的本能之一。而當未來的科技史學家回望時,他們很可能將 GAN 視為邁向具有類人意識的機器的一大步。Facebook 首席 AI 科學家 Yann LeCun 曾稱 GAN 為「過去 20 年裡深度學習領域最酷的主意」。另外一名 AI 大牛,百度前任首席科學家吳恩達表示,代表了「一個重大的基礎性進展」的 GAN 激勵了全球日益增長的研究者社區。
GAN 之父 II:AI 搏擊俱樂部
如今,Goodfellow 已是谷歌 Brain 團隊中的一名的研究科學家。而當我最近來到了加州山景城的谷歌總部,對他進行採訪時,他對他的明星地位依然十分驚訝。作為這項技術的發明者,他現在絕大多數的時間都用於對抗那些想把它用於非法目的的人。
GAN 的魔力在於兩個神經網路之間的對抗。它模擬的是一個師出同門的贗品大師與鑒寶專家之間爾虞我詐的過程。師出同門,是因為這兩個神經網路所使用的訓練數據集為同一個。這兩個神經網路一個叫「生成網路」:它的任務就是儘力合成最逼真的輸出,比如一張照片或手寫文字;另一個叫「判別網路」:它的任務是把這些輸出與來自原數據集的照片進行對比,來判斷哪些是真實的,哪些是假的。根據判別的結果,生成網路會調整它合成圖片的參數,直到判別網路無法找出真假之間的區別。
就拿去年一個廣為人知的例子來說,在那場實驗中,英偉達的研究人員使用明星照片對一個 GAN 系統進行了訓練,讓它學會了如何生成假明星照片。而雖然並不是每一張生成的照片都十分完美,但有些確實可以以假亂真。此外,與其他機器學習手段所需要的數十萬張圖片來進行訓練不同的是,GAN 系統僅需數百張照片就足夠精通此道。
圖 | 一個用真明星照片訓練出來的 GAN 系統可以自己想像出一套假明星照片,而其中絕大多數看起來都十分真實
不過,這種「想像力」的能力還十分有限。就拿一款用大量狗狗照片訓練出來的 GAN 為例,如果我們讓它生成具有不同花紋的狗的照片,結果可能十分逼真。
但是,它並不能想像出一種全新的動物,比如貓。而訓練所使用的數據集的質量,也會對結果帶來巨大的影響。在另一個例子中,一個被要求生成貓咪圖片的 GAN 系統突然開始吐出含有各種字母的貓圖片,十分詭異。在分析後,研究人員發現,這是由於該系統訓練所用的數據集包含了來自網上的貓咪表情包,因此導致它誤認為英語單詞也是屬於貓的一部分。
圖 | 讓 GAN 完美的工作並不簡單,一旦出現問題,結果可能十分詭異
而據華盛頓大學機器學習教授 Pedro Domingos 表示,GAN 的性能也並不穩定。如果一個判別網路十分容易騙,那麼它的生成網路的輸出看起來就不會十分逼真。而調試這兩個對抗的神經網路並不容易。這也解釋了為什麼有時候 GAN 會吐出奇怪的東西,比如有兩個頭的動物。
當然,這種挑戰並不會讓研究人員氣餒。自 Goodfellow 與其他幾位研究人員在 2014 年首次發表 GAN 相關的研究成果後,如今已有數百篇關於 GAN 的論文。一名 GAN 技術的粉絲甚至創辦了一個叫「GAN 動物園」的網站,志在記錄這項技術的各種版本。
可以立刻應用這項技術的領域很明顯,就是遊戲業和時尚業這些涉及大量圖片的行業,用來回答比如「一個在雨中奔跑的遊戲人物看起來會是什麼樣?」這種問題。但是在未來,Goodfellow 認為,GAN 將驅動更重大的突破。「我們有很多科學和工程領域需要優化一些東西」,他說道,並舉了需要變得更有效的葯和更高效的電池為例,「這將是下一波潮流。」
圖 | Goodfellow 的發明可以用於創造各種東西,包括新的裝修設計
在高能物理領域裡,科學家們會使用威力強大的超級電腦,來對歐洲核子研究中心(CERN)的大型強子對撞機(LHC)這種機器中可能出現的數百種亞原子粒子之間的互動進行模擬。而這些模擬不但很慢,還需要大量的計算力。因此,美國耶魯大學與勞倫斯伯克利國家實驗室的研究人員為此開發出一款 GAN:在使用現有的模擬數據進行訓練後,它可以以更快的速度,非常準確地預測某種粒子將會有何表現。
醫療研究則是另外一個極具潛力的領域。對於隱私的擔憂意味著研究人員有時候無法得到足夠的真實患者數據,因此無法對藥物效果進行分析。而賓利法尼亞大學的 Casey Greene 表示,GAN 可以通過生成與真實醫療記錄一樣高質的假記錄來解決這個問題——這些可以被大量分享的數據將被用於推進醫學研究,而真實的記錄則可以受到嚴密的保護。
GAN 之父 III:壞人們
但是,在 GAN 光明的未來的背後也有黑暗的一面。對於希望散播假新聞來操控股市、選舉等社會各方各面的壞人來說,一個專門為產生以假亂真的贗品而設計的機器簡直是個完美的武器。AI 工具已經被用來把別人的面孔放在成人女星的身體上,或把假話從政客的嘴裡播出來。而雖然 GAN 並沒創造這個問題,它卻將加重這個問題。
達特茅斯學院數字取證教授 Hany Farid 正在開發更好的假視頻識別方式,比如探測呼吸時面色會出現的變化,因為 GAN 很難將這一點完美的複製出來。但是他警告說,GAN 將會學會適應:「我們在根本上就處於弱勢地位」,他說道。
而這場貓和老鼠的遊戲也會發生在數字安全領域中。研究人員們已經開始重點警告「黑匣子」攻擊的風險,即用 GAN 來猜出安全軟體用來識別惡意軟體的機器學習模型。如果一個攻擊者猜出了守衛者演算法的工作方式,他就可以避開安全軟體,向系統上傳惡意的軟體。而同一種手段也可以用來躲避垃圾郵件過濾器等其他安保手段。
Goodfellow 對這些危險十分了解。如今,他正在谷歌帶領一個專門注重於把機器學習變得更安全的團隊。他警告,AI 社區必須從前幾波創新浪潮中,技術人員們事後才考慮到安全和隱私這一點學到教訓。因為當他們終於發現其中的風險時,壞人們已經領先一大步了。「很顯然,我們已經錯過起跑線了,」他說道,「但我希望,我們可以在前進太遠之前,在安全上面做出足夠重大的突破。」
不過,他並不認為「贗品」會有一個純技術方面的解決辦法。事實上,他認為我們需要依靠社會方面,比如通過演講與辯論課等方式來培養孩子的批判性思維。
「在演講與辯論時,你會與另外一名學士進行比賽」,他說道,「你就會思考如何給出誤導性的說法,或者給出正確又非常有說服力的說法。」但是,雖然他可能是十分正確的,但是他對於技術無法解決假新聞的問題的說法,可能並不是許多人想要聽到了。
-End-
翻譯:陳翔宇
GIF
※尋找失眠基因,130 萬人參與史上規模最大的遺傳學研究
※能解決加密貨幣價格波動問題,這兩種貨幣真的這麼厲害?
TAG:DeepTech深科技 |