Bengio TED演講:無監督學習是深度學習突破的關鍵
選自TEDx
機器之心編譯
參與:李亞洲、吳攀
在 2016 年 9 月 24 日舉辦的 TEDxMontreal 2016 上,深度學習領域的著名學者 Yoshua Bengio 發表了主題為《使用深度學習的人工智慧的崛起(The Rise of Artificial Intelligence through Deep Learning)》的演講。近日,TEDx Talks 官方在 YouTube 上發布了該演講的視頻。機器之心在本文中對該演講的主要內容進行了整理介紹。
演講主題:在深度學習進步的推動下,人工智慧領域正在發生革命。我們離實現人類水平的人工智慧還有多遠?我們未來還面臨著怎樣的難題?Yoshua Bengio 相信每個人都應該理解人工智慧的基本思想。民主化這些問題是很重要的,這樣在面臨人工智慧將帶來的重大變革時,我們的社會才能做出最好的集體決策,以使這些變革能有利於我們所有人。
我們的世界一直在發生變化,其中對未來會有巨大影響的一件事就是人工智慧,它將帶來另一場工業革命。
之前的工業革命增強了人類使用機械的能力,而此次第二波的機器紀年(Machine Age)將會增強我們的認知能力與心智(mental power)。計算機不只是要替代體力勞動力,還有腦類勞動力。所以,我們今天到了哪一步?
你可能在去年三月份聽過,一個名為 AlphaGo 的機器使用深度學習擊敗了世界圍棋冠軍。圍棋是中國古老的棋類遊戲。對計算機而言,圍棋要比象棋更難掌握。經過十幾年的人工智慧研究,我們是如何做到的呢?
首先,通過反覆觀看強大的人類棋手所下的千萬手棋來訓練 AlphaGo,然後自我博弈百萬局。機器學習使得機器能從樣本、數據中進行學習,它是將知識填充到計算機中的關鍵。這非常的重要,因為有知識才能產生智能。
向計算機填充智能曾是先前人工智慧方法的難題。為什麼呢?因為大腦中的許多東西都是直覺性的,我們無法用言辭表達它們,對這種直覺性知識沒有意識過程。那如何向計算機編程這種知識呢?解決方案又是什麼?
解決方案就是讓計算機自己去學習這種知識,就像我們人類一樣。
我的工作對發現、理解通過學習的智能的原理有所貢獻,無論是人類、動物還是機器學習。
我和其他人相信,機器學習像物理學一樣,有一些簡單的理論能解釋智能並幫助我們建立智能機器。例如,空氣動力學,它足夠綜合,能夠解釋鳥類、飛機的飛行原理。如果能夠發現一種簡單的理論解釋智能,是不是很驚人?現在,我們已經有所進展了。
我和我的合作者在神經網路與深度學習領域的研究對人工智慧革命有所貢獻,它們是機器學習的一種方法,受啟發於大腦。深度學習的崛起開始於 2012 年,手機上的語音識別使用到了神經網路。不久之後計算機視覺也迎來突破,計算機如今在識別圖像中內容上已經做的非常好了,甚至過去五年在某些基準上已經達到人類的水平。現在,計算機能夠直觀的理解一個圍棋棋盤視覺外觀,這種能力可媲美於最好的棋手。
最近,隨著我所在室驗室的一些發現,機器翻譯也用到了深度學習。這項工作擴展了計算機理解、生成自然語言的能力。但不要被欺騙了,我們離一台全能的機器還非常遙遠。例如,計算機還不能像一個 2 歲兒童那樣學習,事實上 2 歲的兒童能掌握直觀地物理世界,她知道丟球時球會下落,潑水時會一團混亂,但她的父母並為教過她牛頓力學或微分等式。她以無監督的方式自己學習了這些知識。
無監督學習是現在人工智慧的一個重大挑戰,可能還要花費數十年的時間才能解決。無監督學習嘗試找到數據的表徵,讓我來演示一個例子。
我們眼睛看屏幕上的頁面,在計算機看來就是一張圖片,一堆的像素。為了回答關於此圖像內容的問題,你需要了解它的高層含義,這種高層含義對應大腦中的最高層表徵。向下,你了解單個詞的含義;更往下是組成單詞的字元,這些字元可用不同的筆觸、不同的方式進行渲染;而筆觸由 edges 構成,edges 由像素構成。所以裡面有不同層級的表徵。
但像素來表達圖像的含義還不夠,還不能回答有關圖像內容的高級問題。你的大腦其實有這些不同等級的表達。從皮質的首個視覺區域 V1 中的神經元開始,識別 edges。皮質的第二個視覺區域 V2 識別筆觸和小形狀。更高級別上,你有檢測物體部位的神經元,然後是整個物體和全部畫面。
使用圖像訓練神經網路的時候,它們實際上就能夠發現這些不同層級的表徵,與我們在大腦中觀察到的一樣。我們大腦中的神經網路與機器中的深度神經網路都能學習不同層級表徵間的轉換,用更高的層級對應更抽象的概念。例如字母 A 的抽象概念可用低等級的不同方式進行渲染,因為許多像素的構成由位置、旋轉、字形等決定。
那麼我們如何學習高等級表徵呢?
深度學習應用中如今比較成功的一件事是監督學習,人類需要告訴計算機許多問題的答案。例如在大量圖像上,人類需要告訴計算機這是狗的圖片、這是貓的圖片,以及電腦、鍵盤等。這是一個非常痛苦的過程,我們通過眾包來做。同時,這又非常強大,我們已經能用它解決許多有趣的問題了。
儘管這非常強大,而且我們已經能解決許多有趣的問題了,但人類仍然還是強大得多——他們可以以一種遠遠更加自動化的方式學習世界的遠遠更多的不同方面。就像我們看到二歲孩童也能學會直觀的物理知識一樣,無監督學習可以幫助我們解決自動駕駛汽車的問題。讓我解釋一下。無監督學習允許計算機投射未來的狀況,即基於當前狀況生成可能的未來,並且可以允許計算機為它們之前從未訓練過的情形提前進行推理和規劃。這是非常重要的,因為如果我們用的是監督學習,我們就必須告訴計算機汽車可能遭遇的所有情形以及人類在那些情形中會做出的反應。
我們是怎樣學會避免危險的駕駛行為的?我們必須在事故中死上幾千次才行嗎?這就是我們現在訓練機器的方式。我們需要做的是訓練我們的模型去生成可信的圖像、可信的未來,具有創造力。在這方面,我們正在取得進展。我們正在訓練這些神經網路將高級的含義轉變成像素,而不是從像素轉變成高級的含義。
因此以這種方式按另一個方向通過不同層面的表徵時,計算機可以生成新的圖像,這些圖像不同於該計算機之前訓練時所見過的圖像,但仍然很可信,看起來就像是真實的自然圖像一樣。
我們也可以使用這些模型來「夢想」奇怪的事物和恐怖的畫面,就像是我們的夢境和噩夢一樣。
這裡給出了一些計算機使用這些深度生成模型合成的圖像。它們看起來就像是真實的自然照片,但如果你看仔細一點,你會看到它們還是不同的,它們還是缺少一些我們會將其看作是「自然的」的細節。
大約十年前,無監督學習就已經成為了我們在深度學習領域實現突破的一個關鍵。這些突破僅僅發生在少數幾個實驗室,包括我的實驗室。那時候,神經網路還並不流行,幾乎已經被科學界給拋棄了。現在情況已經發生了很大的變化。這已經變成了一個非常熱門的領域。每年都有數百名學生申請我的實驗室及合作夥伴的研究生。蒙特利爾已經變成了世界上最大的深度學習研究者聚集地。我們剛剛收到了一大筆研究資助,共 9400 萬美元,來推動人工智慧和數據科學的前沿研究以及推動深度學習和數據科學技術向工業界的轉化。受到這些技術激發的商業人士正在創造創業公司和工業界的實驗室,其中很多都與大學走得很近。比如說,就在幾周前,我們推出了一個創業公司工廠 Element AI,其將專註於深度學習的應用。
深度學習專家的數量還不夠,所以他們得到的報酬高得驚人。我許多前學術界的同事都從企業公司拿到了非常慷慨的交易,以在企業的實驗室工作。我自己選擇呆在大學,為公共福利而工作,和學生一起工作,以保證獨立性和引導下一代深度學習專家。
除了商業價值之外,我們還在做的另一件事情是思考人工智慧的社會影響。現在我們許多人都開始將目光轉向能增加社會價值的應用,比如健康。我們認為我們可以使用深度學習來實現個性化醫療,從而提升治療。我相信未來隨著我們從數百萬乃至數十億人身上收集到的數據越來越多,我們將能為數十億現在還沒法獲得醫療服務的人提供醫學建議。現在我們可以想像人工智慧在社會價值上的許多應用,比如一些來自我們自然語言理解方面的研究成果將能為那些無力負擔法律服務的人提供各種法律服務等等。現在我的團隊已經將目光投向了人工智慧的社會影響,但思考這個問題並不是專家的專利。我相信在數學和行業術語之外,普通人也能足夠理解隱藏在下面的基本思想,從而參與到將在未來數年和數十年到來的關於人工智慧的重大決策中來。
所以請拿出一點時間和空間,讓你自己學習了解它。我和我的合作者已經寫出了好幾篇入門論文和一本名為《Deep Learning》來幫助學生和工程師進入這個激動人心的領域。另外還有很多在線的資源可用,比如軟體、教程、視頻。許多大學學生在自學深度學習,從而對這些研究有了很好的了解,並在後來加入了排名前列的實驗室,比如我的實驗室。
人工智慧將會對我們的社會產生重大的影響。所以必須要問:我們將如何使用它?它既有可能帶來極大的益處,也可能帶來極大的負面影響,比如軍事用途、對就業市場的顛覆。確保未來幾年我們做出的關於人工智慧的集體選擇將有益於所有人應該在人工智慧塑造我們未來的方式上扮演積極的角色。
※回歸、分類與聚類:三大方向剖解機器學習演算法的優缺點(附代碼)
※谷歌I/O李飛飛等四位女性專家,談機器學習的過去、現在和未來
※人物:「天空的另一半」:推進人工智慧研究的二十一位傑出女性
※資源|Picasso:開源的CNN可視化工具
TAG:機器之心 |
※深度學習之DenseNet
※深度學習基礎-TensorFlow 概覽
※Tomaso Poggio:深度學習需要從鍊金術走向化學
※深度學習——Bhiksha Raj 主講
※Yann LeCun分享Facebook最新AI研發成果:AI變革的下一站是無監督學習
※深度學習之CapsuleNets理論與Python實踐!
※深度學習綜述:Hinton、Yann LeCun和Bengio經典重讀
※R語言攜手TensorFlow進軍深度學習
※Windows Defender ATP機器學習和AMSI:發掘基於腳本的攻擊
※深度學習的「教父」Geoff Hinton:從神經科學適應AI的想法
※專訪MIT教授Tomaso Poggio:表達、優化與泛化——數學視角里的深度學習
※用深度學習解決Bongard問題
※使用Caicloud TaaS 平台落地深度學習演算法實戰
※類Keras的PyTorch 深度學習框架——PyToune
※Yoshua Bengio團隊基於深度強化學習打造聊天機器人MILABOT
※用Python和NumPy學習《深度學習》中的線性代數基礎
※Roofline Model 與深度學習模型的性能分析
※LeCun、Bengio、Hinton三巨頭曾合體,Nature發文綜述深度學習
※深度學習之解剖Hello World
※OpenAI Baselines 更新,新增 HER 強化學習演算法