Yann LeCun說阿爾法狗在現實世界無法複製，還和MJ、李開復聊了聊AI前景

最新 04-29

大數據文摘作品

記者：龍牧雪

還記得去年春天，Facebook首席AI科學家Yann LeCun在清華一票難求的演講嗎？

剛剛，在國家會議中心舉辦的2018年GMIC Beijing大會上，他再次現身，做了題為「AI的最新技術趨勢」的遠程視頻演講。不同於往年幾乎巡迴演出一樣的「雷同」PPT，這一次，他確實給出了非常多的新料，包括2018年Facebook最新將在CVPR發布的研究內容：識別肢體動作的DensePose。

隨後，針對人工智慧發展的前景、應用和人才問題，他也和來到現場的「機器學習之父」伯克利教授Michael I.Jordan，以及創新工場CEO李開復一同參與了一場精彩的圓桌討論。

順便提一句，Yann LeCun現在出場時的Title是「Facebook首席AI科學家楊立昆」，看來去年取的中文名已經開始被全面使用啦。

大會主題：AI（愛）生萬物

Yann LeCun從神經網路的歷史講起，從優化、反向傳播演算法、卷積神經網路開始，講解了AI在自動駕駛、醫學成像等領域的進步。

在演講中，Yann LeCun特別指出，下一輪革命不會是「有監督」，也不會完全是「強化」。他的原話是：

The revolution will not be supervised (nor purely reinforced)。

也即，有監督學習和強化學習單獨來說都不會引領下一波浪潮。技術進步的關鍵在於自我監督或者無監督學習，而且會結合類似嬰兒學到「東西拿不住會掉在地上（也就是引力的存在）」這樣的常識性學習。

究其原因，是用於學習下圍棋、玩遊戲的強化演算法們，在現實世界中並不適用。強化學習需要太多嘗試、不斷犯錯誤，才能學到它要學的規則。但是如果在無人車上進行同樣的試驗，這會造成不必要的傷亡。再有一點是，我們無法加速現實世界的時間。阿爾法狗在幾小時中下幾乎無限多盤棋的訓練的方式將無法複製。

以下為Yann LeCun的演講速記及現場PPT，大數據文摘對其中的精華進行了摘錄：

今天我想講一下關於深度學習的一些情況，深度學習的未來，以及我們所面臨的挑戰。

今天AI系統中的主要組成部分是有監督學習。不管是影像、聲音或者是圖像的識別，或者是語言翻譯等等，比如說向計算機展示一個車的圖像，它就會知道這是一輛車，下次向機器展示同一個圖像的話你就會得到你想要的答案。有監督學習對於計算機學習是非常重要的。

機器學習的整個過程，是端到端的學習過程。通過這種方式計算機會更好地了解我們的世界。我們知道神經網路是非常複雜的，運算能力一般的計算機在運行神經網路時會有困難。

越來越多人相信深度學習是可以發揮作用的。2009年、2010年，我們與紐約大學合作進行了一項實驗：可以讓計算機識別圖像、馬路上的建築，以及路上的車和人等等。我們可以利用這樣的技術來去識別一些車輛。再過幾年之後，我們可以看到有一些公司，它們利用視頻和這些技術也可以識別圖像。

大家可以看到在神經網路當中使用的幾個層，例如有100層或者180層神經網路。因為有了這樣一些應用，可以看到錯誤率、故障率是在不斷下降的。有的時候神經網路表現得甚至要比人還要好。它的性能非常好，已經成為了一種標杆。另外它實際上比CPU識別圖像要更加複雜一些。它不僅僅能夠識別對象，同時也能夠進行本地化處理。

我們在Facebook人工智慧部門進行了一項叫做Mask-RCNN的研究，它可以對圖像進行標記，並展現出了非常好的性能。它不僅僅可以識別出每個人，同時它會為每個人做一個標記，所以可以很容易區分出事物的類別，例如，它可以識別電腦、酒杯、人、桌子等等，而且也可以對數量進行計數。

五年前，我們可能認為需要10-20年時間才能達到今天呈現的效果。Facebook已經開源了Detectron，大家都可以去下載代碼，這樣的話世界各地都可以更好的熟知這種技術。當然，利用這樣的技術不僅僅可以進行識別圖像、進行面部識別，也可以識人的行為或是用來翻譯。

我們最新的研究成果是DensePose，實時識別身體姿勢。相關論文即將發表在今年的CVPR上。效果可以看下圖：

這個演算法能把人身體的各個部分分解開來：

由此可以輸出3D圖像：

這是DensePose在COCO數據集上的結果：

另一些結果：（文摘菌備註：可以用來識別廣場舞大媽的動作創造一套廣場舞？）

對於我們研究團隊來說，不僅僅要開發，同時我們也希望所開發的技術能夠引導整個社區，解決我們所感興趣的問題。AI不僅僅會幫助我們解決問題，同時還會幫助我們應對很多人類自己無法解決的挑戰。

這是Facebook人工智慧實驗室FAIR所發布的一些開源項目，比如深度學習網路、深度學習框架等，大家都可以學習。

接下來我們再來看一下可微分編程，可以從另外一個角度學習深度學習。實際上它也是一個固定的架構，它涉及到的編程可以用人工神經網路解釋。這個編程共有三個指數，實際上和人工神經網路非常的類似，會根據數據的不同而變化。另外，數據系統的變化也會導致編程的變化。

它相當於一個有記憶力組件的增強神經網路。比如如果建立一個系統能夠回答覆雜問題的話，比如說關於圖像的複雜問題。我們輸入了一個問題，這個問題可能有一些不同的代碼，它之後被解碼，而且之後會用在編程中，這樣就可以使得我們的系統能夠回答問題。

對於這樣的編程，之後它總會成為圖片。比如說有多少是方形體，或者有多少顏色，最後告訴你具體的答案是什麼。通過這麼做我們可以建立起一個端到端的解答的途徑。而且也允許你提出更多新的問題。這些圖像都是動態的，之後你可以加以操作。當然根據你輸入數據的不同它有所變化。基於此，我們可以進行更多醫學影像方面的分析。

機器學習能做很多事，但也有很多事做不了。

強化學習擅長玩遊戲，但在現實世界中並不適用！機器需要學習很長時間才能去玩遊戲，可能要進行100個小時、成千上萬次的訓練才能夠做到。

所以我覺得有些核心的功能方面，我們確實現在還沒有觸及到。可以看一下DeepMind的演算法玩Atari遊戲的數據：多數方法需要相當於230小時的遊戲時間，表現最好的需要83小時（1800萬幀）。

有些學習涉及力學，但是在實際的生活當中不可能實時的來進行這些實驗，否則我們的無人車就會翻下山坡去。所以我們只能夠進行模擬，但是它也需要我們進行很多的嘗試才能夠讓機器學到。

有兩點要注意：你在現實中做的任何事都可能導致死亡、你不可能調快現實世界的時間。

我們來看看嬰兒是怎麼去學習的。六個月大的嬰兒可能不太了解物理規律，可是在滿了八個月之後，你就會驚奇他們的能力，因為他們已經知道「自由落體」這回事了。直觀的來說就是，東西如果沒有支撐，像下圖中的小車那樣，它們就會掉到地上。

「落地」這個動作就是嬰兒對小車的行為作出的預測。人們學習常識，通過不斷的「建模-預測」來了解世界。下圖裡的大猩猩也是這樣。飼養員給它展示了一個讓杯子里的東西消失的魔術，它表現得非常意外，因為東西消失不是它的預期。

我們需要這樣的監督或者學習能夠使得機器得到訓練，使得他們能夠進行規劃，進行反映。這就是我們需要建立起的一個系統。

不管下次的變革從哪個點出發，它們都應該是自我監督或者無監督式的學習，而且其中也會出現一些常識性的學習。

學習的三種形式：強化學習、有監督學習、自監督預測學習：

擺在我們面前的是通往所謂真正的AI的兩大疑問：

我們怎樣才能讓機器學習的過程像人類和動物的學習過程那樣有效？

我們怎樣訓練機器去規劃和行動？

答案是：使用常識。

我們已經做了一些工作，包括預測簡單情景當中有哪些物體有可能會跌落下來、有什麼樣的可能性、它的大概概率有多少等，這裡的結果不僅僅是唯一正確的，可能有多種結果。

我們進行了對抗性的訓練，比如說我們可以訓練機器了解哪個分項是看起來是更可能的、或者在實際生活中會發生什麼樣的結果。對於發生性它也會來做出預測，可能哪些時候哪種結果是虛假的，哪種是真實的。通過這麼做我們就能夠得到不同機器產生的結果，之後得到了很多的影像和圖片資料。

最後做一下總結。有監督學習是不能夠被替代的，不管是無監督學習還是其他的學習方式都不能夠替代它。所以這點已經引起了很多人的興趣，接下來幾年還會持續的發展。我相信這也會使得我們不斷進行更多的實驗，我們也要進行更多的嘗試。

還有一點也非常重要，我們既然要使得機器能夠推理，那麼深度學習能給我們什麼樣的推理能力？同時我們也要回顧一下在AI時代的機器，它的推理能力有多高，它的邏輯性有多強。

接下來我相信我們會不斷的進行演變，而且也要朝著可差異化的智能學習的方向持續發展，這就需要我們對於對抗性訓練進行更多的研究。當然了，還會出現更多的有關深度學習的變革，比如包括有一些多渠道的發展或者是複雜的架構，而且在這個領域會不斷地出現更多的理論。

接下來技術監督的趨勢很顯然會不斷弱化，甚至監督會消失，這就會出現一些新的理論的產生，比如新的語言、新的並行的文本，我相信之後應該有多維度的可能性。可能會出現一些新的框架，包括一些動態的影像。而且我們詮釋的能力也會不斷地提升。我們也會不斷地開源。

當然了，現在我們的工作量很大，但是移動工具和其他工具也變得越來越流行了，Facebook的用戶每天能夠製造大概20億個不同的影像，所以之後大家可能會出於不同的目的去參與，我們也希望能夠充分發揮這方面的力量，它可能是一種很強的驅動力。另外，這也使得我們要不斷的強化硬體，以便用戶的需求能夠得到專業化的處理。感謝各位的傾聽，謝謝。

圓桌討論

演講之後，Yann LeCun通過視頻，與現場另外兩位AI領域的研究者加州伯克利大學教授Michael Jordan以及創新工場董事長兼CEO李開復進行了圓桌討論，就人工智慧的研究現狀、產業發展、在中國的機遇，以及人才發展的相關問題進行了交流。

主持人：在你看來在當前人工智慧的技術，現狀是怎麼樣的呢。而我們中國處在什麼樣的位置和機遇呢？

李開復：剛才的演講是在學術的角度上描述的，我們在過去的五年左右看到了深度學習和相關的技術對各領域的滲透。尤其是計算機視覺。從應用的角度來看，我會把人工智慧的應用的發展歸納成為四波浪潮，這四波浪潮應用的方式不一樣。

第一波浪潮就是互聯網的AI浪潮，也就是說當你每次在淘寶點擊的時候，每次在朋友圈點贊的時候，這些數據都被收集起來，成為巨頭互聯網公司能夠更深度地的了解用戶的依據，然後為用戶提供更好的服務、更貼切的服務，這是互聯網AI。

由於互聯網的數據量非常龐大，我們每天都像小白老鼠一樣幫助這些互聯網巨頭。所以今天的AI巨頭和互聯網巨頭之間是畫等號的。所以美國的Google、Facebook、亞馬遜引領第一波浪潮。

第二波浪潮以大量有價值的信息為核心。比如說一個銀行用戶的數據，可以降低信用卡的欺詐率或者提高貸款的還款率。當然在各種其他的應用，比如說供應鏈、醫療、學校，其實任何有數據的領域都可以把它商業化，現在這波商業化AI的浪潮正在發生，大部分AI公司都是做商業化AI的工作。

第三波浪潮以基於視覺、聽覺或者其他感測器收集的數據為主，這些數據是過去沒有的。然後把這些數據變成一個新的應用，甚至是一個新的用戶體驗。比如說我們看到各種智能音響智能語音交互。例如在創新工場的前台我們放著Face++，我們是無前台自動運營的。當然我們可以把這樣一個聰明的計算機視覺加感測器用在各個不同的領域。比如說在無人商店、工廠等等。所以第三波浪潮已經開始來臨，我們會看到更多的感測器、更多的晶元，更多的攝象頭布置在周圍的各個地方。

第四波浪潮我們叫做自主化、自動化的AI，這也就是我們科幻片看到的無人駕駛，聰明的機器人等等。那麼這個浪潮會徹底顛覆我們生活習慣。然後我們的工廠會慢慢變成熄燈工廠、無人工廠，我們的商店慢慢會變成無人商店，所以第四波浪潮是巨大的。第四波浪潮已經有一些初級的應用出來了，比如說無人駕駛，這四波浪潮會來得非常迅猛。

這四波浪潮也給中國帶來更多的機會，尤其在互聯網上，我們已經佔了世界的半壁江山。在視覺方面和感測器方面的應用，我們也發展的非常快。因為我們有海量的數據。在那些比較有深度的科技，像無人駕駛方面還是美國領先的。但是中國有數據的優勢和強的政策推動，所以以後應該是中美兩國並駕齊驅的格局。

主持人：下一個問題要請教的是Michael Jordan，在最新的博文當中你提到了很多新的東西，你提到了以人為中心的工程科學等等方面的主題，你覺得人工智慧的技術將來是什麼樣發展的演化過程呢？

Michael Jordan：我是一個學術界的人士，我對整個產業發展也是有很多的關注，對我們來說，我們的原則就是要搭建一個體系，目前我們的原則並不是很多。我在博客里用了化學工程這個比喻。在四十年代的時候，我們當時就有這樣一個學科。當時建立了很多的準則、原則，使得我們能夠讓很多的化工廠，能夠以非常合理的成本來進行演化和發展。

目前，這樣一些原則並沒有完全的建立，所以體系還不能全面的建立起來。我想人工智慧還不能太誇大。現在我們奢望建立的是智能的自動化系統。其實無人駕駛這些並不是我們最終的目標，包括銀行或物流也並不是以無人化為目標，這些領域能夠連接協作起來才是我們追求的

所以在很多方面，其實智能並沒有完全建立起來。現在我們在很多地方可以實現一些功能。但是語意或者其他背後的背景和引申的含義等等，這種智慧和智能還不存在。

因此我們需要每一個體系，每一個系統都達成這種智能。目前並沒有這樣一個智能的網路，所以我們要實現整個智能，需要整個體系的搭建，而不是單個個體的智能。其實在無人駕駛或者無人商店這些領域，需要它自己自主做出決策。並且一些決定可能還是有先後順序和優先順序別的。有的做決定是同時做出多個決定，在真實世界當中可能我們要同時做出幾百個、上千個，在經濟、金融、商業方面的各種決策。

因此，我們可以想像一下，有這樣一個提建議的體系，看起來是非常智能，推薦你看這本書、看這部電影，然後在全世界進行部署，就像今天的阿里巴巴、亞馬遜做的事情。很多時候亞馬遜向人們推薦一本書的時候，人們感覺到真的非常好。所以這些AI的技術正在不斷的部署。推薦一部電影也沒有問題。

但如果說在交通上，人們從機場到市區，推薦哪條路是不堵的。或者說大家都想去投資股票賺錢，向人們推薦同一個股票。很多時候在建立這個體系的時候，如果向人們推薦的都是同一個路線或者股票，可能這個體系就會出現問題。我們必須要負起責任來。我們在做這樣一個體系搭建的時候，我們考慮的並不是單個的個體智能，而是整個體系和網路。包括數據、決策，包括還可能出現的錯誤都要考慮進去。

因此在這個研究當中，一些原則性的東西正在不斷的湧現。但是還在過程當中，並沒有成熟，有很多概念還需要去完善。我想現有的問題是，我們似乎認為人工智慧無處不在，但實際上整個體系還需要時間來建立。

我們現在目標就是使得無人駕駛汽車像人一樣在駕駛，但是這個目標很奇怪，因為人的駕駛技術很糟糕。我們需要建立一個自動化的體系。這是很不容易的。人們可以用人工智慧這樣一個詞來表述，這沒有問題，但是千萬不要誇大。

主持人：請問Yann LeCun，你講到過讓機器來學常識，這樣它能夠預測一些問題和可能的答案，這方面你可以再進一步的闡述一下嗎？它和監督式學習、無監督式學習和增強式學習的關聯度在哪裡呢？

Yann LeCun：在這樣幾個表述之下，其實我在整個人工智慧的領域，在這方面有很多的想法和交流。當然從學術性的到實際的應用，也有很多東西。要讓它們相互之間搭建起這種體系，的確是很重要的工作。

比如說在Facebook公司，有這樣的一些應用，我們希望機器有真正的智能，搭建起這樣一個體系架構。我們希望人工智慧可以很好的實時的做相關的事情，很多技術現在還沒有到位。比如說包括人臉的識別，很多事情進行了幾十年的工作，有些目標還沒有達成。因為機器要獲取大量的知識，它才能夠真正的去實現像人類那樣的智能和智慧，從而做出很多的預測和判斷。

我認同Micheal的說法，我們需要有很多基本的原則到位才能建立一個體系，這樣才能真正達到人類的智能水平。

因此，在我的演講當中也強調了監督式和無監督式的學習。從中可以看到，機器需要有預測能力。它需要從不同感官的輸入來進行自我的判斷和預測，從全世界獲取相應的數據，來揣摩如何模擬出近似於人類的思想。

監督式的學習，提供給機器的數據量是非常少的，數據很少，在訓練機器的時候就比較局限。因此它所獲取這樣一些反饋、信息是不足夠的。在這個過程當中，人類與機器的區別是很明顯的，這點也可以幫助我們向前進一步地推進。

主持人：剛才我們問了這麼多技術的問題，下面要問一下關於人工智慧產業相關的問題。請問一下Michael Jordan教授，你曾經講過機器學習技術對整個產業發展和技術價值的生成有一些相關的作用，你能舉例說明一下嗎？

Michael Jordan：剛剛會場上的自動翻譯把Red Herring in AI（一個比喻）聽成了Red hair in the eye「眼睛裡面的紅頭髮」，可能是一些同音字的問題，所以人工智慧在語意的理解上會存在一些問題。

其實很多時候，要搭建一個智能的體系，並不需要對人工智慧的所有方面都了解。人工智慧本身是一個計算機科學，但是需要跟經濟產生關聯。所以我們需要搭建這樣一個體系。

如果在我們的生產者和消費者之間搭建一個體系，這種體系的搭建就生成了經濟效益，也關聯到我們前面講到的問題。如果我們向所有的人都推薦同樣一個餐廳，那麼這個餐廳人滿為患，大家都不想去太擁擠的餐廳了，它的價值在哪裡呢？同樣的，我們的計算機科學怎麼樣為經濟服務？所以最好有一個相應的競爭關係。

我們有一個相應的體系，座位是一座一價的方式來進行相應的競標。比如說我想吸引這裡的人過來，這裡的座位是3%的折扣或是其他折扣。因此在這個過程當中，大家都可以去競價，然後實現相應座位合理的分配。

最後經過這樣的方式，我的餐廳也有很好的上座率。我旁邊的競爭對手可以看到這個餐廳已經開了，而且裡面已經滿座了。這個時候競爭對手可能會想，我提供30%的折扣，也許能吸引到相應的客戶來我這裡就餐。

現在整個所謂的人工智慧體系，並沒有考慮這麼多，做推薦的時候還是有相應的局限。

還可以舉一些其他的例子，比如說音樂。現在有各種各樣的人都在做音樂的創作，有一些音樂的製作是非常好的。通過目前一些體系，很多人都在聽音樂，但是在做音樂的時候，我們可以看到很多人並不能從做音樂當中賺錢，它並沒有真正的經濟效益。

怎麼樣去解決這樣的問題呢？如何用我們的人工智慧技術，實現技術到市場化的轉變，使它有商業的價值，能夠從中賺錢，可以有相應的數據流？這是我們需要思考的問題。

比如說可能我的音樂在深圳很流行，因為那邊的人既喜歡聽我的音樂，又喜歡向他們的親朋好友推薦，這樣數據就很有價值。既然深圳人很喜歡聽我的歌，我就去深圳開一個音樂會，就會很賺錢。我一邊是開車的司機，一邊可以賺錢，我可以把唱歌的愛好實現商業價值的轉換。

通過這樣一些數據組創造出很多商業價值，目前很多問題甚至都沒有被深思熟慮過，這個時候可以挖掘它們的商業價值，這就是人工智慧應該實現的一些功能。

因此對我來說，更好地實現人工智慧的價值，也就是讓我們的計算機科學更好地為人類造福。

因此也需要一些商業方面、經濟方面的人才共同跟科學家協作，讓人工智慧創造更多的商業價值，探索無限的可能性。在這個過程當中應當更加雄心勃勃地解決其他的問題。

主持人：剛才Michael Jordan談了很多如何用AI建立全新的市場和全新的價值。另外一個緯度，在AI裡面，AI產業和企業經常將產學研結合的特別好，有很多的AI企業都有自己的AI研究院，甚至有很多AI初創企業都有自己的AI Line，這是在AI領域特別常見的現象。

這個問題我想請教一下Yann LeCun，現在你在領導FaceBook的AI團隊，另外你在紐約大學依然有教授的職位，那麼公司的研究到底該如何開展呢？

Yann LeCun：四年半以前我們在FaceBook開始相應的研究，之前我在ATMT和貝爾實驗室工作過，開展一些研究可以提前進行這方面的鋪設。並不是說所有的公司都可以做到這一點，對於人工智慧而言，進展會受到很大的限制，有很多問題仍然沒有得到解決。

我們必須不斷的去進行研究，讓機器變的更加智能，可以更好地了解人的思想和思維方式。沒有任何一家公司或者個人能夠自行解決這樣一個問題。

另外，開源研究非常容易與大學進行合作。我認為對於學術界來說是不一樣的，學術界的研究並不是說彼此競爭、做的都是自己感興趣的研究。學術界的研究都是非常互補的，所以學術界與產業的結合是非常完美的。

大家會看到在北美、歐洲、亞洲會出現越來越多的情況，研究科學家他們會在企業或者在學術界都擔任職務，這樣可以更好的實現學術界和產業之間的交流，我覺得這是現在發生的非常重要的一種變化。

通過產業界開源的研究你可以吸引最好的科學家，你可以邀請一個科學家到你的公司來工作。但是如果你不告訴科學家你做的是什麼，實際上就扼殺了科學家的研究。

你必須告訴科學家你要做的是什麼、趨勢是什麼，只有這樣他才會願意到這裡來研究。科學家的職業發展，實際上也會影響到整個人工智慧研究的發展方向，所以你必須讓科學家知道公司正在做的是什麼，只有這樣科學家才可以更好的參與這樣的研究。

另外，像Google、FaceBook這樣的公司，他們投入了很大的精力做人工智慧的研發，對他們的品牌來說是好的，也可以吸引更多的工程師人才。這方面可以讓他們變的更有吸引力，這就是為什麼他們投入研究AI方面的原因，通過開源的行業可以吸引到更多的人才參與到這方面的研究。

文摘菌也注意到，Yann LeCun的房間里，牆上貼著幾張海報。其中一張寫著Through LOVE。他連線的視頻名（左下角）還寫著NYC - Optimal Brain Damage（之前的一篇論文中一種從MLP中去除權重而不顯著降低分類性能並提高網路計算性能的方法）。也許通過Love能減少一點腦損傷呢。

【今日機器學習概念】

Have a Great Definition

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 大數據文摘 的精彩文章:

※ResNet告訴我，我是不是世界上最美的人？

TAG:大數據文摘 |