當前位置:
首頁 > 最新 > 具有人類意識的深度學習模型之父:一個給予了機器想像力的男人

具有人類意識的深度學習模型之父:一個給予了機器想像力的男人

高層速讀

關鍵信息:通過將兩種神經網路進行相互對立,Ian Goodfellow(伊恩·古德費羅)創造了一個強大的人工智慧工具——生成式對抗網路(GAN)。GAN在生成模型和判別模型的互相博弈學習產生好的輸出,能夠給予機器想像、創造的東西,具有一定的自主意識。

關鍵意義:GAN是人工智慧中所謂「無監督學習」的一大步,更能夠使機器更少地依賴人類來幫助它們了解這個世界。

關於生成式對抗網路(Generative Adversarial Net

近年來,深度學習技術被廣泛應用於各類數據處理任務中,比如圖像、語音和文本。而生成式對抗網路(GAN)是一種深度學習模型,也是無監督學習最具前景的方法之一。GAN通過框架中(至少)兩個模塊:生成模型(Generative Model)和判別模型(Discriminative Model)的互相博弈學習產生好的輸出。

GAN深度學習模型:讓機器學會創造

2014的一天晚上, Goodfellow和他剛畢業的博士同學們一起喝酒慶祝,在蒙特利爾最受歡迎的酒吧Les 3 Brasseur,當時一些朋友想讓他幫忙做一個非常棘手的項目:一個可以自己製作照片的電腦程序

當時研究人員已經在使用神經網路作為對策,這種演算法以人腦中的神經元網路作為生成模型,用以創造合理的新數據。但結果往往不是很好:計算機生成的臉往往很模糊,或者有錯誤,如缺少耳朵等。 Goodfellow的朋友們提出的改進是對構成照片的元素進行複雜的統計分析,以幫助機器自行生成圖像。然而這將需要大量的數據和運算, Goodfellow告訴他們這根本行不通。

但是,當他在喝著啤酒思考這個問題時,他想到了一個主意:如果讓兩個神經網路互相對抗呢?他的朋友們對此持懷疑態度,但他決定試一試。Goodfellow在家中寫代碼一直到凌晨,然後測試了他做寫的軟體,第一次成功了。

Goodfellow

Goodfellow那晚發明的東西現在被稱為「GAN」,也叫「生成式對抗網路」,可應用在NPL(自然語言處理)等技術領域。這項技術在機器學習領域引發了巨大影響,其創作者也變成了人工智慧領域的重要人物。

在過去的幾年裡,人工智慧研究人員利用一種叫做深度學習的技術取得了令人興奮的進展。例如提供一個有足夠圖像數據的深度學習系統,它可以識別出即將過馬路的行人。深度學習技術使得自動駕駛汽車和為Alexa、Siri等虛擬助手提供動力的人機對話成為可能。

但是,儘管深度學習的人工智慧可以學會識別事物,但他們並不擅長創造事物。而GAN的目標是給機器一些類似於想像、創造的東西。

讓機器進行創造不僅能使他們進行繪畫或作曲,更重要的是,這能使它們更少地依賴人類來幫助它們了解這個世界和其運作方式。今天,人工智慧程序員經常需要告訴機器所提供的訓練數據是什麼,比如在一百萬張圖片中,哪一張包含行人橫過馬路,哪些沒有。這不僅數據和人力成本高,而且限制了機器系統處理的能力,即使是輕微的偏離數據的訓練。在未來,計算機將在不被告知的情況下更好地利用原始數據並計算出他們需要從中學習的東西。

微軟推出的「看圖作畫」機器人

這是人工智慧中所謂「無監督學習」的一大步。譬如,一輛自動駕駛汽車可以在不離開車庫的情況下自學到許多不同的道路條件;機器人可以預見它在繁忙的倉庫中可能遇到的障礙,而不需要帶著它去倉庫中體驗。

我們擁有想像和思考許多不同情景的能力是我們成為人類的原因之一。當未來的技術歷史學家回顧過去時,他們可能會認為GAN是朝著創造具有人類意識的機器邁出的一大步。Facebook首席人工智慧科學家Yann LeCun稱GANs是「過去20年來深度學習中最酷的想法」。另一位人工智慧名人、中國百度前首席科學家吳恩達(AndrewNg)也表示,GAN代表著「一項重大而根本性的進步」,這激發了越來越多的全球研究人員投入到深度學習研發之中。

生成式對抗網路要「對抗」多種因素

Goodfellow現在是谷歌大腦團隊的一名科學家,該公司位於加州山景城的總部。當記者在那裡遇見他時,他仍然對人工智慧名人身份感到驚訝,稱這是「有點超現實」。同樣令人驚訝的是,他已經發現了有人正在利用GAN達到不法目的,現在他的大部分時間都花在這方面。

GAN的特點在於兩個神經網路之間的對抗。第一個被稱為生成器,負責輸出儘可能逼真的素材,如照片或手寫稿。第二個被稱為鑒別器,它將這些圖像與原始數據集中的真實圖像進行比較,並試圖確定哪些是真實的,哪些是假的。在這些結果的基礎上,生成器再調整其參數以創建新的圖像。如此循環,直到鑒別器不能再分辨出真假。

在去年一個公開的例子中,晶元公司英偉達的研究人員對GAN進行了培訓,通過研究真實的照片來生成虛擬名人的照片。雖然並不是所有的「假明星」都是完美的,但與其他需要數萬張訓練圖像的機器學習方法相比,GAN可以精通幾百張圖像。

原始訓練數據的質量對訓練效果也有很大的影響。在一個例子中,GAN開始製作帶有隨機字母的貓圖片。因為訓練數據中包含了來自互聯網的貓模因(模因即在生物進化中與基因作用類似的事物),所以機器已經告訴自己,字母是它作為一隻貓的含義的一部分。

華盛頓大學的機器學習研究人員Pedro Domingos說道,GAN是個性情暴躁的AI。如果鑒別器太容易欺騙,生成器輸出將看上去不真實。而校準兩個對抗的神經網路可能很困難,這就解釋了為什麼GAN有時會輸出奇怪的東西,比如有兩個頭的動物。

GAN輸出的假照片

然而,這些挑戰並沒有阻止研究人員。自從 Goodfellow和其他幾個人在2014發表了關於他發現的第一份研究報告以來,已經有了數百篇與GAN有關的論文。這項技術的一位粉絲甚至創建了一個名為「GAN Zoo」的網頁,致力於跟蹤已經開發出來的各種技術版本。

GAN深度學習模型最明顯的即時應用是在涉及大量圖像的領域,如電子遊戲和時尚領域。但展望未來, Goodfellow認為GAN將推動更大的進步。他說:「科學和工程領域有很多方面需要優化,」他舉例說,比如需要更有效的藥物或必須提高電池的效率。「這將是下一波巨浪。」

在高能物理中,科學家們使用強大的計算機來模擬數百個微粒像瑞士核研究中心大型粒子對撞機這樣的機器中可能發生的相互作用。這些模擬速度慢,需要大量的計算力。耶魯大學和勞倫斯伯克利國家實驗室的研究人員開發了一種GAN,在對現有的模擬數據進行訓練之後,GAN學會了準確地預測某一粒子的行為,並使其運行得更快。

醫學研究是深度學習另一個有前途的領域,隱私問題的存在意味著研究人員有時無法獲得足夠的真實病人數據,比如分析藥物無效的數據。賓夕法尼亞大學的CaseyGreene說,GAN可以通過生成幾乎和真實記錄一樣好的假記錄來幫助解決這個問題。這些數據可以更廣泛地共享和研究,而真正的記錄則受到嚴格保護。

GAN之父:技術進步不能缺少負面因素

然而,技術有黑暗的一面。一台用來製造「真實假貨」的機器,對於那些想要影響股票價格、選舉等假新聞的提供者來說,是一個完美的武器。況且,人工智慧已經被用來在色情片的身體上放別人臉的照片,以及在政客的嘴上放上文字。GAN雖沒有製造這個問題,但GAN的存在確實會讓問題更糟。

哈尼·法里德(Hany Farid)是達特茅斯學院(DartmouthCollege)的數字取證專業畢業生,目前他正在研究更有效的識別假視頻的方法,比如檢測吸入和呼氣引起的面部顏色的細微變化,這種方法是有效的,因為GAN發現這些變化很難精確模仿。但Hany Farid警告說,GAN會反過來適應,「我們從根本上說處於弱勢。」

這種「貓捉老鼠」的遊戲也將在網路安全中發揮作用。研究人員已經強調了「黑匣子」攻擊的風險,在這種攻擊中,GAN被用來找出機器學習模型,因為許多安全程序都用這些模型來發現惡意軟體。但是,在預測了防禦演算法的工作原理之後,攻擊者可以避開它並插入流氓代碼。

現在, Goodfellow領導著谷歌的一個團隊,專註於讓機器學習更加安全。他警告說,人工智慧社區必須吸取以往創新浪潮的教訓,在創新浪潮中,技術人員將安全和隱私視為事後考慮。當他們意識到風險的時候,壞人已經有了明顯的領先優勢。「很明顯,我們已經開始了,」他說,「但希望我們能在安全方面取得重大進展,否則我們就會離我們的出發點越走越遠。」

儘管如此, Goodfellow認為將不存在一個純粹沒有任何欺騙的技術解決方案。相反,他認為,技術依賴於各種社會因素而進步。比如教孩子們批判性思維,讓他們參加演講和辯論課。他說:「在演講和辯論中,你會和另一個學生競爭,你在考慮如何編造有利於自己甚至是誤導的說法,或者如何編造出非常有說服力的正確說法。」

Goodfellow很可能是對的,但他的結論是,科技不能解決假新聞問題,雖然這不是人們想聽到的。此前我們也報道過假新聞相關的文章,點擊此處查看。

分享這篇文章

與同仁共同探討AI行業動向

往期文章


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 全球大搜羅 的精彩文章:

「四知清臣」楊企震
年三十,備年菜,逛市場

TAG:全球大搜羅 |