當前位置:
首頁 > 知識 > 人工智慧專家 Michael Jordan 談機器學習的未來

人工智慧專家 Michael Jordan 談機器學習的未來

來源 | 機器之能 整理 | 高靜宜

近些年,由於在大規模標註數據基礎上的性能表現優良,深度學習演算法持續升溫,特別是在計算機視覺、語音識別等領域,部分業界巨頭企業以及初創公司已經開始加速從傳統的機器學習逐步邁向深度學習的布局。此次峰會邀請到加州大學伯克利分校教授教授 Michael Jordan,他發表了《機器學習:創新視角直面挑戰》的主題演講,分享他在人工智慧領域最前沿的探索和心得。而在隨後的採訪中,Michael Jordan 向機器之能談到「我們應該更理性地看待深度學習」。

Jordan 認為,雖然深度神經網路是目前比較常用的一種方法,但是在標註數據不足或解決某些特定問題的情況下,決策樹等機器學習演算法的能力也不能忽視。以決策樹為例,它利用概率和樹對決策中的不同方案進行比較從而尋求最優解,決策樹方法也可以在數據條件完備的條件下,通過多個決策樹組合的方式形成隨機森林,在某些情況下也可以實現較為理想的結果。而且,這種方法相較於深度神經網路可解釋性較強,而不可解釋性正是神經網路的一大難題。神經網路在現代神經科學研究成果的基礎上提出,而神經科學非常複雜,人們目前還沒有完全揭開其中的奧秘,「人們需要認識到神經科學的局限性,而且我認為將神經網路與其他演算法進行優化結合也是非常必要的。」

另一方面,對於當下大熱的聊天機器人,Michael Jordan 也有一些不同看法。他說:「我並不認為聊天機器人會發展具備和接近人的功能,人們可以理解對話中語義、背後已隱藏的含義,可這對機器來說並不簡單,人們對此期待過高;還有一點期待過高的就是希望機器比人聰明,比如機器就不可能幫助 CEO 或是 CTO 做決策。不過,隨著時間的推移,我相信無論是數據採集方式、優化演算法或是模擬器的研究都會有長足進步甚至是突破性進展,正如三十年里計算機視覺和語音識別方面質的飛躍一樣。」

以下為 Michael Jordan 演講內容:

Michael Jordan:我是一個研究者,我做關於統計學以及人工智慧方面的研究,今天我非常高興來到這裡。

首先我們要非常清晰地了解,什麼是可能出現的技術,哪些是不可能存在的,而哪些是我們現在所存在的問題,以及未來我們會看到什麼樣的技術發展,這就是我今天這個演講的主要所在,以及包括我們未來的洞見和挑戰。

首先我們簡單了解一下到底目前人工智慧行業發展是什麼樣的。在 60 年代剛剛出現了「智能」這個詞,也是剛剛出現了人工智慧這個說法,那時候我們說要建立一個機器人,讓它可以和人一樣具有思維能力,加入到人的世界當中來,那個時候大部分人工智慧的電影向大家展示的是機器人最終進入到人的世界中,以及包括我們的雲系統、視覺系統,還有我們的自然語言系統,能夠讓機器人越來越像一個人。

但是在 80 年代、90 年代出現了另外一個趨勢,這個趨勢對我們來說也是非常重要,我們叫做 IA,也就是智能增強技術,那時候我們提到搜索引擎,這也是我們的智能方面的應用,通過智能引擎,我們可以非常快的找到我們所要問的任何問題的答案,這些東西不需要存儲在人的大腦中,所以人的智能得到了引擎的支持,幫助我們能夠更好地用自然語言來進行增強,電腦可以幫助我通過自然語言的處理,增強我的自然語言的表現,所以我可以通過自然和科技的技術,以及智能技術說多種語言。我們可以看到目前這個技術正在發展,而機器幫助我們有了更好的存儲能力,更好的溝通、交流的能力。

還有一個部分是 IaaS,也就是智能基礎設施,這對我們來說是最重要的。我們的交通和金融行業,在我們身邊的每一個行業、每一個模塊,現在都出現了智能化的趨勢,我們也發現世界更了解我們了,能夠根據我們的需求提供服務,所以在我們前方是有一個系統的,如果你要說雲的話,這個系統就是雲,這個雲變得更加智能,所以它並不是機器人和我們溝通,而是這個雲的架構和雲的基礎設施在和我們溝通。

之前我們大部分的研發都是與機器人,以及包括智能領域的發展,它主要是制約與我們的技術發展,它和人的發展是非常相似的,但是智能是完全不同的。現在我們在這種所謂的智能設施的建立的時候,我們遇到了很多問題,在騰訊也是如此。比如說我們要對相關的大型的設施做出相應的決定,比如說我們要做一個金融、交通,以及包括對人類做出一些醫療決定的時候,作為一個單獨的機器,如果要能夠僅僅跟周圍的信息做決策,這是很不好的,有時候機器了解的信息是不夠的,一個機器做出的決策往往是不對的,它沒辦法意識到我們周圍環境的變化。特別是這樣的決策如果要影響到大部分人,它更是危險的。

從這個角度來說,我們應該如何分享數據呢?我們可以看到機器人的發展,會幫助我們更好地促進業務的發展,我們能夠幫助到公司,能夠幫助他們進行數據的傳輸,能夠幫助他們得到更多的競爭優勢,但是這並不是最好的說法。如果能把信息進行分享,比如說詐騙信息,每個公司都能看到這方面的危險,它們會不斷地集合,然後我們把問題進行更好的解決,同時大家也不會失去競爭力,每個人都可以從中獲益。我們從技術和思維的角度來說還沒有辦法完全解決,到底我們的知識在哪裡?知識是在每個地方不同重複的,在每個地方會出現不重疊性,以及在發展中不同的問題會得到不同的答案,所以我們如何通過數據在多重的維度當中,既包括在雲端,也包括在雲邊緣得到相應的解答,這是很難做到的。同時我們如何做到公正和多樣性,現在還很難做到,我們現在只能用一組系統處理一個數據,但是我們還沒辦法在多種情景下進行部署。還有一個問題是大多數的機器人出現了安全問題,在我們處理了之後,會出現一些系統的攻擊,這是比較大的問題,這是我們要重視的,我們不可能說這是小問題,這些都是大問題,這就是我對智能的一個想法。

下面回到機器人、智能發展,包括從人工智慧的角度來看,我們看看哪些是可能的,哪些是不可能的。

我們看到機器視覺,在過去幾年,我們通過攝像機對場景中的物體進行標識,但是它還是沒有辦法能夠像我們清晰的了解到所有的情況,就像我在這裡站在台上,大家在台下,我沒辦法了解到所有人的注意力在哪裡,通過人工智慧可以幫我們更好地了解語義,但是現在也沒辦法做到,語音識別也是如此,我們現在可以把語音轉化成文字,文字也可以轉換成語音,在各種語言上都可以實現,但是我們的機器人還沒辦法幫我們了解聽覺、視覺之後的真正的意義。

還有一點就是自然語言的處理,我們可以看到到目前為止,自然語言的處理得結果還沒有達到我們需要的發展,我們現在有大量的語言的翻譯,但是大部分的語言和語句因為沒有辦法得到有效的語義的闡述,沒辦法讓我們的受眾了解到這個語義的意思,有時候我們問問題僅僅能了解部分的答案,而不能了解全部的答案,對機器人學來說也是如此,我們看到世界上有很多工業可編程的機器人,他們也在和我們溝通,但是它們沒辦法了解到我們的環境、處境以及我們的情緒,我相信這對我們大家來說,如果我們都覺得機器智能將會無處不在的話,這是不太可能的。

對於我們來說,在過去幾年的發展,特別是在機器人的發展上,我們的機器人還只是一個雛形,之後可能會出現一些有效的對話,特別是像這樣一個自我導識的機器也會出現,但是智能方面它目前還是比較有限的。

我相信在未來,短期內不會出現太多的像人這樣的靈活性和可變化性。也許機器可以了解一些事實,它們看上去非常有知識,但是它們沒法真正得到人這樣一種高級智能,甚至像小孩一樣的高級智能,它沒有辦法了解抽象思維,沒有辦法進行抽象的處理,機器人還不能實現這方面的能力。這些機器人就像小孩一樣,他們知道一些非常棒的現實,他們知道每條河流、每個國家,但是它們仍然沒有很高的智能進行人的抗衡,所以在這方面,我們還是很難看到一個超人類的發展,我們相信這個技術可能要很多年的發展才能夠出現。我相信我們真正要關注的不僅僅只是這樣一種技術的發展,到目前為止,在我們這代人身上還看不到這種高水平的人工智慧的出現。

除此之外,我們即使沒有辦法進行抽象、識別語義,我們也是非常難接近人的發展,但是我們仍然要進行等待,讓我們了解到通過大量的數據的處理,比如說機器人以及人工智慧可以幫助我們大批次的處理數據,能夠通過數據了解未來一些事件的走向,同時能夠保證我們的數據結果不斷地提高,同時我們還可以用這個機器人做一些簡單的人工工作的處理,但是機器人永遠不可能像人這樣聰明,同時我們可以看到,我們的人工智慧的系統也會有很多的智能,它們知道這個現實,但它們不知道哪些現實是真的,哪些是有可能出現未來的一些顛覆式的發展,所以這個機器人並沒有辦法實現像人一樣的能力,它沒有辦法引領一個公司的發展,在我們這代人身上,在機器上沒法做出這樣一個前景化的決定。

我們到底應該關注什麼,應該擔心什麼呢?

如果我們擔心這種高度類人化的人工智慧的發現,我們應該關注,我們所謂的人工智慧看上去很智能,但是它並非如此。比如說在醫療行業中,我們讓機器做很多的醫學診斷,這是不太可能的,有很多人會因為這種不暢的診斷,可能會劑量出現問題,特別是某種競爭的情況下,如果出現任何問題,這個機器沒有辦法做出有效的診斷,我們的病人都有可能去世。與此同時,我們真正要關注的是機器人可能會造成大量的工作的流失,以及大多數人因為丟了工作沒有辦法得到收入。在過去我們可以看到工業的發展,在七八十年代都是如此,但是在過去 50 年中,人們在不斷地調整,現在我們可以看到未來 10 到 20 年,人們沒有機會更多的調整,機器人會取代更多的人,獲得更多的工作。同時它還可以幫助現有的智能設備的發展,在世界上也有很多人會惡意使用人工智慧的系統,如果出現人工智慧系統的誤用,我相信也會有問題。機器人本身是沒有任何惡意要傷害人類的,只是使用這些及其人的人本身含有惡意。

在這裡我特別要和大家談到我們近期對於機器學習的一些比較大的挑戰,我相信這些挑戰都是我們大家已經意識到的,但是現在還沒有解決,如果我們能夠確保未來要建立起一個人工智慧的系統,我們必須要解決這些問題,否則沒有辦法保證未來人工智慧的發展。

首先是我們必須要設計一個系統,這個系統可以帶來有意義的經過校準以後的信息,能夠應對一些不確定性,比如說在醫療行業,還有在策略規劃的角度,如果你是公司的 CEO,你必須要清楚地了解到,一種做法和另外一種做法之間的差別,你不可能只有一個做法。與此同時,我們還要保證我們的系統能夠真正地解釋它們自己所做出的決策,如果機器做出了一個決定,我們必須要讓機器向我們闡釋為什麼做這樣的決定,是否還有其它的潛在方法。還有我們要找到問題發生的原因。

另外我們要找到一個系統,這個系統可以實現長期目標的追溯,同時可以主動的收集在實現目標相關的數據。

還有一點是實時,我們可以看到很多的數據和機器需要花幾天、幾個小時來學習這些數據,但是到目前為止,我們的機器學習方面還沒有辦法能夠達到真正的實時操作。還有在意外情況下怎麼辦,還有在外部事件上的連接,包括數據和其他的要求,需要和政府的合作,和法律部門、和社會科學家的合作。

這是我們所面臨的技術挑戰,是需要我們關注的,我們只是做 AI,讓這個機器人能夠跨過去,或者做計算機視覺,我們需要像工程師一樣解決一些問題。

在更廣範圍的挑戰,我相信對我們來講是更難的,比如說在語義方面,在世界上未來會發生什麼,我需要了解什麼樣的概念,我們在機器學習上,我們講的更多的是表面的東西,我們需要了解真正的世界上需要什麼,了解我們所處的情景,但是它們並不知道我們之前發生了什麼,它們是了解我們的一些事實,但是它們並不真正知道我們,我們到底什麼時候覺得厭煩,我們不想要這樣的互動或者交互。

當然還有雲端的互動,這也是挑戰非常大的,如果把這個數據放到雲上,你需要關注隱私的問題,要看一下實施的問題,同時你還要考慮現實的情況,有時候它可能離我們太遠,它不一定是和事實一樣的,我們有可能會做出錯誤的決定,所以我們現在要有更好的方案。當然還有一個不確定性,這也是人類的一個非常重要的特點,圍棋的比賽其實並不是一個很好的例子,因為你知道棋盤上的東西,但是人的生活有很多不確定性,比如說我不知道今天會發生什麼事情,我不知道將來會發生什麼,這就是所謂人的一生,這和圍棋是不一樣的,所以我們需要解決更深層次的人工智慧方面的問題。

最後總結一下。我很高興來到這裡和大家講人工智慧,我也期待著看大家在 AI 方面會做什麼,看看其它企業會做什麼,我們需要一起合作,我覺得這相當於 3000 年以前,兩個人一起來建立合作,大家去建大橋、建房子,我們覺得很興奮,我們要帶來新的發展,同時也會面臨一些災難,大樓可能會倒閉等等,因為他們當時沒有什麼科學性。我們一起創建了土建工程,我們一起在世界上進行分享,我們看看周邊的建築物,世界上大家的想法是一樣的,因為這是可信任的,它不會再垮塌。但是人工智慧還沒有,這需要花幾十年努力,所以我們需要一起合作,我們要認真考慮怎麼解決這些挑戰。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

必看!現代營銷人員機器學習演算法指南
如何阻止採用社會工程學伎倆的網路攻擊?看人工智慧+機器學習出絕招!
百億特徵維度、近萬億樣本量,微博基於Spark的大規模機器學習應用
這位成功轉型機器學習的老炮,想把他多年的經驗分享給你
學了這些機器學習知識 沒有經驗也可以得到數據科學家這份工作

TAG:機器學習 |

您可能感興趣

微軟機器學習Machine Learning Studio學習筆記
Ethics for AI and Robotics 人工智慧與機器人的倫理學-筆記
機器學習基石-The Learning Problem
機器學習教父Tom Mitchell談未來10年的人工智慧趨勢
Machine Learning:十大機器學習演算法
特斯拉從Snap挖來機器學習專家Stuart Bowers,擔任負責Autopilot的工程副總裁
蘋果挖了谷歌 AI 負責人 John Giannandrea,任命其領導機器學習和人工智慧戰略
機器學習與Scikit Learn學習庫
機器學習的「hello,world」
Learning Memory Access Patterns,資料庫+機器學習探索
基於 Python Schema 的機器學習庫——Smart Fruit
機器學習基石-Noise and Error
機器學習技法-lecture5:Kernel Logistic Regression
機器學習特徵工程之皮爾森相關係數 pearson correlation of features
Facebook的Politibot機器人如何用技術重建媒體信任
機器學習為Photoshop和Premiere帶來智能化突破
谷歌發布機器學習規則 (Rules of Machine Learning):關於機器學習工程的最佳實踐(下)
谷歌發布機器學習規則 (Rules of Machine Learning):關於機器學習工程的最佳實踐(上)
scikit-learn機器學習初體驗
FAIR開源Tensor Comprehensions,讓機器學習與數學運算高性能銜接