邁克爾·喬丹採訪:人類對機器學習期待過高,不奢望、不局限
導語:邁克爾·喬丹對人工智慧的態度是,不奢望、不局限
本文作者:楊曉凡
雷鋒網 AI 科技評論按:2017年6月21日至22日,騰訊·雲+未來峰會在深圳舉行。在昨天主題為「機器學習:創新視角,直面挑戰」的演講 - 雷鋒網後,雷鋒網 AI 科技評論在內的多家媒體共同對演講者人工智慧泰斗邁克爾·歐文·喬丹(Michael I.Jordan)進行了採訪。
與演講中一樣,這位UC伯克利計算機系教授,美國科學院、工程院、美國藝術與科學院三院院士認為人工智慧/機器學習能幫助解決不少人類的問題,但是前路還有很多問題等待人類來解決。另一方面,對於現在火熱的神經網路/深度學習,邁克爾·喬丹教授認為機器學習的範疇很大,神經網路只是其中的一類方法;未來的人工智慧如果要更可靠、更強大,單獨只靠神經網路是遠遠不夠的。
以下為採訪現場實錄,雷鋒網(公眾號:雷鋒網) AI 科技評論聽譯。
記者提問:深度學習現在已經愈發火熱,有人認為深度學習已經在某些應用中取代了傳統的機器學習演算法。在您看來,在深度學習未來的訓練、演算法優化中,有哪些亟待解決的問題?
邁克爾·喬丹:深度學習只是一種方法,它沒法解決所有的問題。還有許多別的機器學習演算法,比如集群演算法、因果推理演算法、多重選擇演算法等等,機器學習範疇里有很多的方法可以用。當你有大量的帶標籤數據、想要得到一個輸出映射的時候,深度學習就很適合。但機器學習可以解決的問題有很多,並不局限於這一種。而且深度學習的解釋性很差,很難跟人解釋它在做什麼。它效果非常好的領域主要是模式識別,比如給計算機音頻視頻加上標籤,這個標籤就是我們要的結果。類似這樣的問題有很多,不一樣的問題也有很多。所以我覺得機器學習是那個更大的範圍,那麼深度學習,架構上看它有很多層,但是還有很多別的架構也有許多層的,比如決策樹、圖模型,用在其它的方面。所以我覺得未來我們還是會探索更大的空間,而不是僅僅關注一兩種方法。
記者提問:人工智慧的最新發展也從仿生學受到啟發,我們可以從人類和動物身上學到更好的解決方案。從您的研究看來,我們還能做更好嗎?
邁克爾·喬丹:我覺得我們的研究不是受仿生學啟發的,不是的。我覺得梯度下降,或者叫做反向傳播,是讓這些大型系統具有優秀表現的最重要的演算法。那麼梯度下降、反向傳播就跟大腦的工作方式很不一樣,它不是來自於大腦的啟發,而是來自於數學。所以我們要小心來自神經科學方面的限制,神經科學中研究的是具有複雜空間分布的神經細胞,它們可以有穿透或者非線性的行為,它們之間的連接方式無比複雜。我們對神經還沒有研究清楚呢,所以在我看來(說深度學習網路像動物神經細胞間的連接)只是一種比喻,除此之外的說法都有問題。如果真的是那樣的話,我們其實應該模仿動物的神經細胞才對,雖然也有人那樣做,但是沒有取得什麼進展。所以我們走到今天這一步靠的是數學、計算機等方面的原理,而不是靠仿生學。
記者提問:深度學習仍然是機器學習的主流工具,不過也有人覺得不應該過早孤注一擲。相比需要大量數據的深度學習,也有像概率編程這樣典型的使用少量數據的例子。那麼您怎麼看人工智慧研究目前的同質化現象,您對不斷出現的新方法是如何看待的?
邁克爾·喬丹:如果我們看看現代機器學習庫的話,比如基於Spark的機器學習庫,裡面有各種各樣的方法,它們都有各自的作用,比如用矩陣譜、集群演算法以一定方法建立推薦系統,比鄰的方法也可以用來解決一些問題,增強學習也經常可以轉換成一個大規模的樹搜索。所以確實,用到神經網路和反向傳播的稠密矩陣操作是非常有用的,比如NVIDIA就有各種需要的軟硬體可以支持各種不同的方法,它確實能支持深度學習,但是如果我要解決的問題範疇里標籤的數量很少,比如文本,我只是想要識別一段不帶標籤的文本的特徵,我可能用語言學分配方法就夠了,這就是一種人們在這個範疇中用來找到文字重點的方法。說這麼多你應該懂了,深度學習不是唯一可行的方法。雖然給它製造專用的GPU、TPU確實重要,可以支持很多種不同的應用。但是我們想要建立下一代的架構,它要能支持樹操作、搜索操作、約束下降操作和其它一些需要的語言學操作,而不僅僅是一層層的矩陣。
記者提問:您如何看待中國的AI潮流?您認為騰訊能在其中扮演怎樣的角色?
邁克爾·喬丹:我對騰訊的情況不太清楚,不太好評價,我只知道外界看來他們除了社交網路外還有很大一塊娛樂和遊戲業務。在現在這個階段,有遊戲和娛樂的環境,就可以模擬出一個虛擬世界,在裡面得到準確的事實,從而生成真實世界可能無法得到的標籤;而且可以在強化學習方面起到幫助,在虛擬世界裡面可以做海量的搜索;或者還有其它方法,都可以大規模地使用我們現有的機器學習技術。還可以在虛擬世界中嘗試一些真實世界中可能會傷害到人類的技術。利用內在的遊戲技術可以探索機器學習方面的新想法,這很重要,騰訊看起來似乎也有很大的自然優勢。
記者提問:大數據催生了很多工業應用,許多互聯網、金融證券巨頭都開始涉足AI。您看好AI的前景嗎?
邁克爾·喬丹:人們對AI的期待太高了。語言方面的期待是最高的,許多人都覺得聊天機器人會發展得像人差不多,不過我不太相信,我覺得聊天機器人對世界的理解是沒辦法跟人類相提並論的,比如理解上下文、理解語言的發展——以前是如何表達的、如何理解可能發生的事情——人類有對事情的預見,針對不同的環境可以建立不同的計劃、運用舉例類比比喻。我小孩今年5歲就可以做到所有這些事情,但是人工智慧很長一段時間都做不到這些。人們期待人工智慧的智力水平可以達到小孩的程度,但是小孩能做的事情也很多啊,所以這是做不到的。這方面的期待太高了。另外人們還期待AI系統可以在某些方面比人類更聰明,但是我們永遠都不會讓機器人成為決策者,比如做CEO、CTO之類的,它們沒有對世界的那種微妙的理解,沒辦法抽象地做推理,沒法面對不確定性的事情還做出優秀的決定,沒有好的直覺。所以我覺得人們期待人工智慧做這些,不是那麼理性。
記者提問:我們期待人工智慧除了做計算性的思考,還可以做推理和決策。您認為大數據在這些方面能發揮作用嗎?
邁克爾·喬丹:大數據是必須的,但是只有大數據還不夠。藉助大數據,很多以前做不對的細節現在可以做對了,但是這不代表你就能清楚地觀察全局、能理解抽象的概念、能做長期的推理、能改變事情發生的可能性、對事情做出預見。所以,其實推理是很難的,在多步驟的、具有不確定性的狀況下,人類能做得非常好,但是人工智慧系統就需要用大量的數據反覆訓練,然後才能在某些步驟中模仿人類,但這還是沒辦法達到人類的水平。
記者提問:那有沒有新的演算法可以達到更好的效果呢?
邁克爾·喬丹:沒有,據我所知還沒有什麼那樣的神奇演算法。肯定還需要幾十年的研究,要有更好的演算法、更好的工程技術做出的更好的模擬器、用正確的方式收集數據、建立起大型的合作機構比如企業,付出努力解決關鍵的問題。在這個過程中會有越來越好的演算法出現,有可能會有突破性的演算法出現,不過我也不確定會不會出現,我覺得都不是很必要。會有突破的是,新的組織數據、組織決策、組織以往信息的方式,然後與人類協作,讓人類成為其中一環,讓機器學習變得更好,達成人類的目標。你得明白,計算機視覺、語音識別這樣的技術就是在最近的30年里慢慢變得越來越好的。我們感覺到明顯變好了,但這都是基於以往的經驗一步步過來的。未來很多方面的發展也會是這樣。
記者提問:MIT科技評論有篇文章中提到過「AI內心的黑暗秘密」,他們的意思是,沒有人知道最先進的演算法工作的時候具體是怎麼工作的。美國國防部甚至認為可解釋性是AI發展的一大擋路石。您是怎麼看的?
邁克爾·喬丹:解釋性是眾多問題之一。還有魯棒性、安全性、語義性、抽象性等等許多問題,解釋性只是其中一個。如果某個領域內對神經網路最大的擔憂是它的解釋性的話,那也許就這時候就不應該用神經網路,而應該用決策樹,解釋性要強得多。決策樹是沿著路徑往下走的,人類可以理解路徑上的每一步,而且可以根據不同狀況做出不同決定,用事情發生的前後關係做判斷。不過它的性能就不如神經網路那麼好了,但是也不錯。還有一些領域如果有足夠的數據也可以用隨機森林-多選擇決策樹,它的效果和神經網路差不多,而且也可以用在對解釋性要求更好的場合里。對做決策來說,人類決策的解釋性比決策樹還要好得多,人類可以預見到應該考慮什麼、沒有考慮什麼,還能解釋出為什麼有東西不需要考慮。我們現有的學習模型都不擅長這些。所以這個確實是一個大問題,不會有一個全新的方法可以橫空出世來給神經網路解決這個問題,很難沿著某個路徑進行解釋,我們只能在神經網路的外圍設計別的東西。另外,我覺得總體的來說,單獨一個神經網路對大多數問題都不是合適的解決方案,它應該只是一部分,和其它的部分共同協作起來、考慮其它的情境、在周圍構建一些其它的架構,才是好的解決方案。
記者提問:您在演講中提到,我們需要建立一個在正常工作的同時還要能不給人添麻煩、不引發災難的系統,這樣的系統現在有沒有呢?
邁克爾·喬丹:這需要深厚的工程能力。比如資料庫,人們還沒有用機器學習的方法去做資料庫,但是銀行系統就能很好地工作,全世界的資料庫之間不停地進行聯絡和交易,不僅做到了即時性、還做到了協作性。當我自己全世界旅行的時候,我銀行賬戶里的錢不會跟著我來回交易,但是我和我妻子兩個人用同一個賬戶,一個人在美國取錢,一個人在中國取錢,賬戶餘額還是對的。這樣的系統服務著幾十億人,這是驚人的成就,僅僅靠來回發送數據。「這些數據是哪來的」、「在發生了這樣一系列事情以後應該如何應對」,資料庫系統做的就是這些事,它沒有什麼學習功能,但是它也需要有智能的基礎設施才能讓人感到信任、才能保證正確等等。如果把這樣的思路和機器學習結合在一起,那就能對什麼事情是能發生的、未來會發生什麼做出預測。所以,這應該不算是什麼突破,但是需要深入的工程研究才能設計出有多種防範能力的系統,然後就有了能判斷出相關的信息、能正確選取信息用來做預測的系統。這其中牽扯到很多選擇,如果知道在同樣的環境中採集到的數據有哪些是可用的,資料庫已經為你分析好了,那你就會更信任這樣的資料庫系統。這就是做預測困難的地方,你在環境中採集到的數據可能和資料庫中的不一樣,你沒辦法採集到所有的數據。在真實世界中,你需要知道哪些數據是有關係的,還要知道為什麼,然後才能用它們做出預測。所以能做好這個的系統需要多種組成部分,需要有工程化的思考。
採訪現場,邁克爾·喬丹教授對待記者們的問題表現得非常耐心和積極,在問答過程中與記者們保持著互動,他的回答熱情也越來越高,情緒越來越豐富,語速也越來越快。可惜因為邁克爾·喬丹教授的行程較緊,沒法抽出更多時間,採訪就匆匆結束了。
邁克爾·喬丹教授的回答中透露出他對機器學習的嚴謹和熱忱,雷鋒網 AI 科技評論也會繼續對相關信息保持關注。
雷鋒網原創文章,網站轉載請至雷鋒網官網申請授權。歡迎熱情討論,轉發分享~
※UC伯克利教授邁克爾·喬丹採訪:人類對機器學習期待過高,機器學習的發展還應當更廣闊
※人工智慧專家 Michael Jordan 談機器學習的未來
※必看!現代營銷人員機器學習演算法指南
※如何阻止採用社會工程學伎倆的網路攻擊?看人工智慧+機器學習出絕招!
※百億特徵維度、近萬億樣本量,微博基於Spark的大規模機器學習應用
TAG:機器學習 |
※邁克爾·喬丹:我討厭將機器學習稱為AI
※未來的科技,人類和機器人要融合,不得不服啊
※科爾:克萊就是台機器,攻守兼備
※奧尼爾和張伯倫體測數據對比,球迷:簡直就是上帝打造的機器
※如何與亞馬遜競爭?沃爾瑪新招:增加機器人和臨時工
※機器人都上平昌冬奧會了,高科技時代已經來臨,智能勢不可擋
※波波維奇:隊員們都是人類,不是機器人
※馬斯克預言:若再不控制人工智慧,機器人將取代人類的統治地位
※俄羅斯的時間機器
※追一科技首席科學家楊振宇:對話機器人里不能「耳聞目覽」卻又「無所不在」的 AI
※為什麼亞波人不用機器艾斯去打艾斯奧特曼,而是讓艾斯殺手去呢?
※騙過機器學習的對抗樣本,竟然連人也不放過
※未戰先怯?上港亞冠對手:胡爾克像機器 他和奧斯卡都是大場面球員
※未來學家認同馬斯克觀點:人類必須與機器人融合,才能阻止「機器獨裁者」消滅人類
※特斯拉的教訓:機器人沒有錯,只是還不夠智能
※理家理心:學會享受「內在時間」,你不是廉價的清潔機器人
※高科技太厲害,智能機器人將會超越人類?
※迪斯尼的特技機器人
※科技:美女機器人製造流程揭秘,高度智能、高度模擬、高度感應!讓你感到不可思議
※阿里巴巴王堅:機器智能時代到來 市長不是人乾的