當前位置:
首頁 > 最新 > 人工智慧離金融最近,強人工智慧離我們還很遠

人工智慧離金融最近,強人工智慧離我們還很遠

「儘管現在有各種各樣的演算法,但強人工智慧離我們還很遠」,在正略集團舉辦2018新年論壇的上,烏鎮智庫理事長、國家千人計劃專家張曉東給出了他對於人工智慧的認識和看法。

張曉東認為,強人工智慧離我們還很遠,儘管機器學習、深度學習現在如火如荼,但我們距離理想化的智能狀態還有非常廣域的空間等待開墾,眾多的問題需要攻克。

以下我們就演講精彩內容做了梳理。

何為智能?怎樣智能?

人工智慧這個詞「Artificial Intelligence」,大家都在講,這個詞是怎麼來的,很多人都說是1956年達特茅斯會議上麥卡錫提出來的。後來我考證了一下,麥卡錫在八十幾歲臨死前的一次採訪中,說過「『人工智慧』這個詞實際上也是從別的地方聽來的」。那麼到底是誰提出來「人工智慧」這個詞,現在已經沒辦法考證了,我的書里其實寫了一段這個段子。所以說人工智慧,我們最早還是要從自然的智能開始看。

神經元

自然智能大家最容易想到的就是:人跟動物有什麼區別?人們往往說人跟動物的區別就是人的大腦更發達。但大腦更發達是用什麼東西來度量,很多人說人的大腦最大,但是事實上並不是這樣。這個有證明:大象的腦子、鯨魚的腦子從體積和重量上都要比人的大腦要大。那肯定有人要說人大腦的質量要比大象大腦的質量要好,不是體積和重量的問題。這個問題大家認為是一個常識性的問題,但是這個問題一直沒有得到精確的回答,一直到幾年以前一個巴西的女生物學家做了大量的工作,最後她寫了一本書,這本書在國內好像翻譯成「超級人類或超級大腦」。她在這本書裡面,幾乎把她十年間的工作做了一個總結。她這十年幹什麼呢?她一直企圖解開「人的大腦是不是在質量上比其他動物的大腦質量高」。質量高低用什麼衡量呢?很多人說可以用腦子裡神經元的總數來衡量,所以2005年她在開始這個工作的時候,問過很多同行生物學家,問人的大腦裡面到底有多少神經元。她問過很多得諾貝爾獎的腦科學家,他們說大概一千億。但是她查了好多資料,這個一千億沒有出處。

所以她一直企圖揭開人大腦裡面到底有多少神經元。歷經千難萬險,為了把人的大腦和其他動物的大腦做對比,她跑到非洲去,把被獵殺的大象的大腦放到冰箱里,偷運回巴西,這期間發生了很多很好玩的故事。然後她對各種不同動物的腦子做了解剖,而且發明了一些獨特的標記手段,能夠測算出來不同動物的腦子裡面到底有多少神經元。最後她得到比較精確的答案——人腦實際上不是有一千億個神經元,而是大概有860億個神經元。大象的腦子有多少呢?大象的腦子有2570億個神經元,比人腦還要多。比人腦還要多,為什麼大象不如人聰明呢?她又做了更詳實的實驗,最後她得出這樣的結論:人和動物的腦子都有大腦和小腦之分,人的大腦比大象的大腦神經元多很多,而由於小腦驅動身體運動,大象身體龐大,它就需要比較大的小腦來協調它的身體運動。她在這方面做了大量工作,而且還在美國做了TED演講,這個演講後來造成很大的轟動。

如果用神經元來測度不同動物的智能水平的話,你會看到最低級的動物一直到最高級的動物的演化過程。人有更發達的神經系統是跟能量有關係的,人的大腦占人體重量的2%,卻消耗人每天攝入能量的25%。直立行走的動物比爬行的動物更消耗能量,這是一個進化的結果。人這個物種在某一個節點上發明了烹飪技術,烹飪技術可以把東西做的更好吃,那麼就有更強烈的動機去消耗攝入的更大能量。作為大象因為它太大了,所以它把它的能量都用在了協調身體不同的部位上。從進化的角度來講、從智能的測度上來看就是人通過消耗更多的能量來給大腦提供養料,人就變得越來越發達。

能量

再來看看能量,能量是很有意思的事情,我們先把智能放在一邊,來看一看能量在過去幾千年是怎麼發展起來的。關於這個也有一本很好玩的書,斯坦福的歷史學家幾年前寫過一本,也是暢銷書,實際上是比較學術的著作,但是他最後這個書賣的很好。我們過去一直說,我們有幾千年的文明。我們這幾千年的文明用什麼來衡量,最後他得出一個結論,他說在過去幾千年裡面,如果我們用人均能量的攝入來考核人類發展的話,西方實際上一直都要比東方發達。比方說公元前4000年開始一直算到現在,西方人均能源消耗都要超過東方,只有在很短的時間是例外的,羅馬帝國衰敗一直到工業革命開始,中間大概歷經900年,東方略微超過了西方。

但是工業革命之後,西方的人均能耗巨幅提高,亞洲國家的能耗則是鴉片戰爭之後才開始提高的。所以從某種意義上,鴉片戰爭之後的1840年到1850年,十年間西方打開了東方的大門,同時也教授了東方更好地、更有效地消耗或者攝取能源的方式。但是他的這個定義也有爭議,因為「東方西方」的分法不合常規。大家知道有一本很有名的書,叫做《文明的衝突》,大概十幾二十年前在國內有出版,它對人類文明做了三分法,不簡單是東方和西方,而是「西方、東方、穆斯林」。但是能量攝取研究裡面,他是把西方和穆斯林包含在一起考慮,就是西方和穆斯林統稱西方。他有他的考慮,比方說他有人種的考慮、有地域的考慮。但是如果說,我們用三分法來看,同時也用Morance的方法來看的話,我猜想可能西方領先中國、領先東方的程度要更大一些。

能量的來源是多樣化的。目前能量主要的來源還是碳能源——煤、石油、天然氣,然後關於核能可以看「藍曲線」,核能在一段時間有很快的增長,但是這幾十年核能並沒有很快的發展,因為安全等各種各樣的因素。如果把社會總的發達程度來做一個衡量的話,除了能源消耗,在現代社會我們還有新的手段來衡量,這就是學術的進步。學術的進步可以用學術出版物來衡量。從這個圖大家可以非常精確地看到,能量的增長几乎是一個線性的增長,但是學術的增長是指數性的增長,尤其在過去幾百年有了印刷術之後。

人工智慧的來源在哪兒?

谷歌曾經做過非常有意思的工作。在2000年,谷歌剛剛開始成立的時候,谷歌的創始人就一直有一個情懷,他想把全世界所有圖書館裡面的書都電子化。這個電子化不是說掃描出來做成PDF,而是做了所有語言的處理。後來因為出版社各方面跟他打官司,結果沒有公布。但是統計的結果公布了,谷歌在2008年之前,掃了大概有3000萬本書。這3000萬本書裡面所有詞出現的頻率他都做了統計,並且把這個統計做成一個產品發布了。

這個產品發布了之後,在學術界就非常有用。舉幾個例子,大家知道「美國」的英文「United States」,後面是複數,既然是複數,後面我應該說「are」還是「is」,谷歌掃了3000萬本書之後告訴你這個規律——南北戰爭之前主要的英文出版物都說「are」,到南北戰爭之後就變成了「is」。用谷歌等工具你可以做很多很有趣的發現。

既然咱們今天聊人工智慧,那我就做了一個很簡單的工作,谷歌這個工具丟進去,你會看到控制論是在40年代產生,50年代到達頂峰。人工智慧是50年代才出來,60年代、70年代、80年代,因為谷歌這個工作做到2008年就為止了。2008年之前有一段時間,人工智慧這個詞沒那麼熱,那個時候是人工智慧的低潮期。其實在2006年之後,由於深度學習的發現,人工智慧又有很大的提升。這些工具告訴我們人工智慧的歷史,實際上也是起伏變遷的。

人工智慧很吸金

除了能量、學術、算例,還有一個是錢——投資,整個在人工智慧產業的投融資的情況我們也做了一個對比。這個行業的投資,在過去幾年幾乎和摩爾定律是同步的。人工智慧到底是什麼在媒體上有兩派觀點,一派是人工智慧永遠超越不了人類;還有一派觀點是英國物理學家Hawking提出的,說人工智慧將來某一天要顛覆、取代人類。

人工智慧進階:超級智能與量子力學

超級智能有很多種說法,大家知道圖靈除了在計算理論、人工智慧方面是鼻祖之外,他還是二戰的時候英國破解德國密碼最重要的功臣之一。他提出了「奇點」,所謂奇點,就是機器超過人的時刻。谷歌有一個未來學家,谷歌裡面有很多程序員非常看不起他,他總是在那兒不斷的預測,他預測的結果就是奇點會什麼時候發生。有很多不同的時間點,有的人說2048,有的人說2049,他基本是說大概幾十年之後,這個奇點就會來了。

我剛才講了《未來簡史》和「超級智能」,那圖靈是怎麼定義計算的以及圖靈機是什麼東西。圖靈機是異常簡單的東西,兩張圖靈的照片下面,就是一個無限長的紙帶,上面有一個有限自動機,有限自動機可以打零或者打一,或者往左移,或者往右移,這是圖靈機,在數學上還沒有人想出比這個裝置更強有力的裝置。偉大的數學家哥德爾,想出來遞歸函數,他一直在問自己一個問題,遞歸函數是不是最強有力的表達手段?他自己沒有信心。但是他看到圖靈機之後就有了,遞歸函數跟圖靈機是等價的。目前人想出來所有的東西,都跟圖靈機等價有關,圖靈機又是這麼簡單的東西,就是無限長的紙帶,上面打零打一、左右移。這個東西在數學上可以證明等價於現在我們發現的所有計算裝置,所以在數學上我為什麼說你可以把圖靈機當做至少是一個智能方面的測量,因為你想不出別的更好的方式。

還有一個非常有意思的發現,有一個中國非常天才的數學家叫洪加維,他的結果在80年代的時候有很大的轟動性。因為這個結果已經被大家默認了,默認之後大家就不會再提起來洪加維這個人,他提出的相似性原理是在圖靈上面的一個結果,任何一種計算裝置都可以模仿,都可以被圖靈機來模仿,圖靈機也可以被其他的足夠強的計算裝置來模仿。洪加維提出「機器之間互相模仿的成本是多項式的」,從計算的複雜意義上說,多項式成本是很低很低的。別看圖靈機這麼簡單,如果用圖靈機來模仿我們現在最強的超級計算機的話,圖靈機的模仿成本只是多項式級別,不是指數級別,是很低成本的模仿。這個實際上也是一個很深刻的觀察,所以洪加維把這個叫相似性原則。有了相似性原則,我們就朝著智能定義的方向更進一步,如果說你想不出來比圖靈機還強的計算裝置的話,起點的來臨還真是有可能發生。

超越圖靈機的東西可能的話就是量子計算,量子計算可以變成一種通用的計算方式。量子計算是不是比我們常規意義上的計算機或者圖靈機更快,現在沒有嚴格意義上的數學證明。我想提到一個點非常有意思——素數分解。素數分解在圖靈機上是不是很難實現,現在沒有數學上的證明,但是素數分解在實踐當中被證明是很難很難的。所以現在大家在網路安全上面用到的最核心的演算法RSA的最頂層的東西就是素數分解。你給一個很大的數,你要把他分解成素數的話,需要的時間超級巨大,但是如果有量子計算的話那就不一樣了。1994年,有一個數學家提出來一種演算法,他說如果說我們能造出一台量子計算機,在這台量子計算機上做素數分解可以超級快。如果量子計算真能發生的話,我們現在所有的安全通信瞬間就變得不安全了。所以可以理解為什麼美國在此投入了巨大的資金,國內在量子計算方面也投入了巨大的資金。如果說大家可以證明素數分解很難,實際上量子計算從某種意義上突破了圖靈機,但是這個目前沒有嚴格的數學證明。

問答:

Q:您怎麼看人工智慧和大數據之間的關係?您提過主營收入50%以上是人工智慧公司,那麼百度是人工智慧公司嗎?

張曉東:人工智慧和大數據的關係,用學術一點的說法是:特定的人工智慧的演算法是需要大數據的,大數據給人工智慧提供了手段。擁有大數據的公司,比方說BAT任何一家公司,就會比別人有不公平的優勢。所以前幾天在人工智慧內部圈有一個爭論,南京大學的周治華老師說人工智慧的進步到底是數據、算例還是演算法的進步,其實我覺得工智能走到今天這三個方面都會有。

第二個問題是百度,人工智慧畢竟是一個手段,所以你說百度主營收入是廣告,反過來說谷歌、臉書主營收入也是廣告、這就要看你達到最優廣告用的是什麼手段。從國內來看,我內心覺得百度是最優秀的人工智慧企業之一,原因就是從人工智慧積累的人才,還有他現在在實施人工智慧的戰略。廣告收入我想BAT任何一家都是一樣的,不光是百度。

Q:在人工智慧未來的商業化或應用落地或者一些解決方案上,有哪些方向能真正給我們的企業或者個人創造一些明顯可見的價值?

張曉東:在幾個方面大家都已經看到,一是來錢最快的是金融。任何一個新技術,第一個接觸的都是金融,金融行業離錢最近。第二個是醫療,也就是說某一天會有機器醫生,並且是達到一定水準的機器醫生。可以這麼分析,有幾個行業,尤其是人臉識別這個行業,過去這兩三年有那麼幾家公司融了超級巨大的錢,而且這幾家公司都是中國的或者是基於中國的。融到的錢如此之大,以至於很多上市公司的市值都不如他融的錢多。

第二,從短期內我看到的方向,因為人臉識別和語音已經是相對成熟了,就是說在某些方面超過人現在的水平。比方說語音識別、人臉識別,人臉識現在識別的正確率在某些方面,某些維度上已經超過人。人工智慧在近期內有沒有新的領域湧出來,我想跟大家分享的就是,自然語言處理會是近期內一個有很大潛在應用的一個領域。目前我們還沒有看到什麼成熟的自然語言處理公司,人臉識別有很多了,語音處理有很多了,自然語言處理一個子分支就是機器翻譯,但是自然語言處理無論從研究還是從落地、還是從產業方面都是有很大潛力的。

Q:IBM醫療,醫療方面的人工智慧,在中國有可能實現嗎?機器人和人工智慧的關係?

張曉東:其實跟大家想像的相反,IBM醫療並沒有讀病例,讀的是論文。現在有八種還是有幾種,有重大的突破。它沒有用病例原因之一是數據質量問題,數據質量問題是這樣,我們研究過病例的質量這個領域,同一個病讓不同的醫生或者是同一個醫生診斷,寫出來的都是亂七八糟的,數據的質量沒法保證。而論文對這個病的描述,用藥有嚴格的格式,但是在病例裡面是不同的,這些東西就導致因為你的數據質量不行。至於在中國,在這個領域裡面有沒有可能突破,可以這樣說,中國在醫療信息化領域有很大的改進,而且我猜在這個領域,中國有可能做的比美國還要好。中國可以強行地規定一些東西,在美國定一個規矩,讓所有醫生都執行很難;中國你定一個東西,所有醫生執行,那可能真就執行。現在有很多試點醫院以及一些大的央企介入,國內也開始做創新,我們也期待有更好的數據,肯定智能的水平就會提高。這是第一個問題。

第二個問題,機器人跟人工智慧是什麼關係,機器人跟人工智慧之間的關係一直是一個動態的關係,比方說70年代、80年代,大家認為機器人都是工業機器人,比如說焊接手等是機器人,這些機器人現在在很多業內大家是不認同的。現在只能說越來越複雜的東西才是跟人工智慧有關係的,工業機器人大家認為這不是我們該乾的事,應該是機械系該乾的事。

機器人在這個領域裡面你要看幾個東西,一個是機器人應用場景,而且現在機器人的定義,除了工業機器人之外,對機器人的定義很寬泛的,服務機器人本質上要解決的技術問題就是我剛剛講的自然語言處理。聊天機器人面臨最大的問題是基本上聊不過五句話,五句話範圍內他是知道上下文的,但是超過五句話,你就不知道他在聊什麼。你要問他一些特別簡單的問題,他可以很快的回答,而且回答的會讓你驚艷,這個不是人可以具備的。你可以問他很複雜的問題,比方你可以問他很八卦的問題,比如說「梁啟超的兒媳婦是誰」,他馬上會告訴你是誰。這種問題很容易回答,因為他底層有很強大的智庫,但是你要給一個很長的對話就比較難。因為以下原因,一個現在很多研究,本身就是研究的課題;還有一些是工程方面。所以服務機器人目前要解決的問題就是我剛剛講的自然語言處理。

Q:人工智慧在防範系統性金融風險上有什麼用武之地,以什麼樣的方式存在於監管層面?

張曉東:人工智慧跟金融的結合有幾個方面。一個是在監管層面,監管層面其實不管是在國內還是在國外,比方說美國、歐洲、英國監管機構其實都有很強的手段,而且他的手段不斷地被完善。一個比較直接的是風控,風控這方面其實有各種各樣的人工智慧,從80年代有專家系統的時候,就用專家系統做這塊。現在又有一些新的手段,比方說知識圖譜,可以做各種各樣的關聯,還可以看到風險點在什麼地方。

這些不光是有研究也有實際的案例,我舉一個跟這個不是那麼直接,但是更普遍的例子探討一下,這個例子就是說因果性的分析,因果性的分析是在金融行業最多的。比方說,你要馬上知道台灣地震有什麼後果,可能一個後果是某手機公司的某款手機推出延遲,這個推理時間是非常短的,因為如果某個企業裡面兩款核心晶元廠子正好在台灣某個地方就會發生以上現象。這個例子就是說在金融方面也可以做一些事件的預測,除了風控之外,有的人講歷史數據和數據時間顆粒度,也是可以探討的。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 烏鎮智庫 的精彩文章:

TAG:烏鎮智庫 |