當前位置:
首頁 > 科技 > 港大人工智慧專家:雲計算、大數據讓每個人都享受到AI紅利

港大人工智慧專家:雲計算、大數據讓每個人都享受到AI紅利

人工智慧學家


來源:ZD至頂網


5月19日,第八屆中國雲計算大會進入第二日程,第四範式首席科學家、機器學習領域國際學術帶頭人、香港科技大學教授楊強在現場帶來了「AI For Everyone」的主題演講。

港大人工智慧專家:雲計算、大數據讓每個人都享受到AI紅利



楊強表示,「我們所說的強人工智慧和超級人工智慧,實際上並不是我們需要害怕的東西,我們需要害怕的東西是我們的技術,一定需要大數據,但是我們本身又沒有大數據這樣的紅利。相反我們要發展的技術是這樣的,把知識遷移到身上,短時間通過小數據能夠學習、能夠成長,如果我們有能力把大數據的模型遷移到我們每一個人身上,我們也使得我們每一個人都能夠享受到這樣的人工智慧紅利。」


以下是楊強演講實錄:

大家好,我是香港科技大學的。


今天我們有人工智慧的技術,我們大家都為它的成就歡呼,但是我們手邊,我們是不是人人已經享受到人工智慧的紅利呢?我們帶著這問題來回顧一下人工智慧的發展歷程。首先我們要看人工智慧的起始是要感謝這位思想的先驅圖靈,他問的一個問題就是機器可以思維嗎?我們今天的努力,也是跟很多前人的鋪墊是分不開的。有哪些努力呢?我們可以看一下,從50年代開始,大家就在做各種假設,提出各種問題,畢竟一開始的時候,大家總是非常的樂觀,認為一下子就可以解決,但還是提出了很多關鍵性的問題,比如說機器可以學習嗎?機器可以規劃嗎?機器可以推理嗎?等等。


比方說我們把老專家的一些思考、一些思維和知識給它遷移到計算機裡面。但是後來發現這個過程實際上是非常非常艱難的,因為把知識描述出來,把知識表達出來,把知識學習出來,並不是那麼簡單的事。


在這個過程當中呢,也有很多的努力,在不斷的積累,比方說IBM為首的伺服器的製造商,在1990年代就在象棋領域就把人類的冠軍給打敗了,這個也是一個里程碑。這說明什麼呢?說明要取得人工智慧是離不開計算能力,同時機器學習的研究者也取得了很大的進展,總而言之有很多的努力,這些努力被圈在實驗室里。這個就總結一下,在人工智慧就是AI For No One其實很強的原因是數據量的不足,也是因為當時並沒有這麼便利的雲計算,能夠幫助我們收集這麼大的數據,比方說利用群體智能、群體智慧、手機、網路等等之類來聚集大量的數據。到了今天人工智慧活起來,有幾個原因,第一個原因確實匯聚了很多的數據,可以想像谷歌公司,還有國內的互聯網公司,都匯聚了這樣很多大數據。今天的計算能力是突飛猛進的。第三是今天的演算法,有很大得逞就。像深度學習、像強化學習等等之類的。這樣我們有目共睹的成就,比方說可以做機器的同聲翻譯,我們可以做非常好的人臉識別,使得我們基於圖像的搜索就變的非常便利,這個也是感謝科學家的努力,我們對圖片還要進行標註,這還要發動廣大的群眾來進行標註,我們系統可以做的聰明一點,來識別哪些標註,所以這比賽最後就導致了深度學習演算法的非常大的成功,比方說就提高準確率方面,提高至少10%,從不能用的階段到可用的階段。


同時深度學習模型,作為一個辨別性的模型,它也可以轉化成一個生成模型,比方說現在我們看到這個圖,就是谷歌訓練好的圖片識別性轉化成生成器,這是像深度學習描繪那些印象最深得情景,機器潛意識怎麼回事。斯坦福的科學家就可以面對這樣的圖片去問一些自然語言的問題,用文字來問問題,在圖片裡面得到答案,再用文字來回答。我們可以拿一個著名畫家就是印象派,我們把這圖片變成印象派這也可以做,這就深度學習幫我們做了。我們看今年的阿爾法狗今年非常火,KGS讓網上對議圍棋的網站,經過十幾年的積累,它已經積累了非常非常多的棋譜,這個裡面通過可以產生3千萬的盤面來訓練,沒有這個也沒有阿爾法狗。所以呢我們說雲計算一定是人工智慧的前提,尤其在今天。第二個例子我們看到IBM我們知道在2011年擊敗了電視節目的世界冠軍,它應該鳴謝誰呢?就是在網上有很多的知識這個知識也是很多人積累努力的結果。

所以這裡不妨做一個比喻,人工智慧是怎麼產生的?這個能力要感謝兩個事,一個是生米一樣,還沒有變成熟飯,但是把它做熟是感謝人工智慧,從互聯網到人工智慧的轉變,我們看到這些成功還是集中在大公司提供了一個思考的起點,對於其他的領域,這些領域沒有大數據,我們應該怎麼辦呢?人工智慧是不是對他們就沒有作用了呢?他們是不是就沒有能夠享受到人工智慧的紅利呢?比方說在生物信息領域,我們知道可以獲得很大的一個數據,這個數據是單條的基因鏈,或者是蛋白質鏈。但是我們把它和人的行為對應起來,這樣的數據,確實是少之又少,往往在生物信息領域能夠得到幾千條樣本已經是相當不錯了。這個和圖像識別裡面上千萬個樣本,那簡直就沒法比的。所以深度學習到今天對於生物信息領域的大部分數據還是沒有用的。


再舉一個例子呢,是教育領域,到現在積累大量的數據,所以我們再回來看,剛剛講的這些紅利,實際上大部分的企業是沒有辦法享用,這就為我們帶來一個問題,我們應該怎麼辦?總結一下到今天的這些成就,也僅僅是AI For No One,對某些人,對某些富人、對某些具有大數據的人工智慧是有用,但是對於我們大部分的人,我們只能旁觀。當然我們的志向尤其是做研究,讓所有的人都能享受到這樣的紅利,因此我們在研究所,我們在學校,應該做什麼樣的工作?能夠使得這一件事發生呢?我們在講這些技術之前,我先來回顧一下,對人工智慧的恐懼,我們在過去我們是靠走路,現在變成騎馬,甚至有汽車,因此人工智慧為我們帶來的紅利也就使得我們人能夠能力變成擴大,我們人的能力變成更有能力。這樣的話,而使我們每一個人變的更加強大,基於這樣一個觀點,我們希望所有的人都能夠享受到人工智慧帶來的好處,每個人都有一匹馬,每一個人都有一輛車,這樣就是AI For No One。我們怎麼能夠讓這個事發展呢?結合我們自己的研究。機器越來越強讓每一個人都享受這樣的紅利。


所以總結起來我們看到18世紀發展了工業大革命,通過資本來使得某一些資本家變的越來越強大,窮的越來越窮,富的越來越富。我們不希望看到這樣的現象發展,今天這革命其實也有這樣的危險,就是智能革命,實際上數據是資本,數據是石油。有數據的人能夠提供越來越多的服務,他也就能夠得到更多的數據。會不會形成一些智能寡頭呢?這個我們認為才是對人類最大的危險,並不是人工智慧本身,而是這種數據的現象就像金融發生的一些,這裡我要特別提我們確實在做努力,其中一個努力是遷移學習,比方說右邊這裡是一個著名的心理學家,他做了一個實驗,使得新的領域學習效率大大提高,這為我們提了一個什麼啟發呢?如果我們在計算機也能做到遷移,就可以使得在數據少的情況下,數據一定的情況下,我們的效率能夠提高,並且在效果一定的情況下,我們用的數據就不用那麼多,也就是說我們遇到一個新的領域,我們如果有能力,把一個過去的模型遷移到新的領域,我們在新的領域並不需要那麼多的數據,所以小數據也可以享受人工智慧的福利。比方說我們在推薦的領域,像在剛才這一位講,京東、阿里,像國外的亞馬遜,大量的推薦任務,如果有一個新的領域,我們沒有很多新的數據,這個問題在推薦領域叫冷啟動問題,解決冷啟動的方法,就是過去大數據建好的模型,來把它遷移到一個新的領域,使得新的領域,只要得到少數的數據,也可以工作的很好,這些實驗我們都做過。


同時我們可以讓機器去讀一些文字,把這些知識給變成能夠對圖像有用的知識,這樣知識就可以在不同的表達之間做遷移。我們做了一個是研究說明也讓機器讀多少文字,它就可以來幫助你識別圖像足夠好呢,我們就發現其實就相當於我們經常說的那一句話,一幅圖片,相當於一千個字,所以這個我們也通過這實驗來加以證實,也就是說書並不需要無限的讀下去,這對於大部分學生來說這是一個好消息。


這裡我就要提到現在很熱的另外一個領域,就是穿戴式智能硬體,我們知道穿戴式是非常酷的,但是如果它不提供足夠的服務,有一天它也會敗落下去。這些服務來自於哪裡呢?來自於對數據的解釋,我們一個人戴了一個手環,我們這個人在走、還是在睡覺、還是在吃飯。如果這手環背後的雲沒有辦法來識別,它就不能夠提供對應的服務。但是如果需要來識別,它就需要有一個足夠好的模型,這個模型我們可以通過遷移學習來得到,比方說我們在一個領域,我們已經收集了很多女孩做咖啡的數據,我們就可以把這樣的數據給遷移到老人在做茶,不需要很多的做茶的數據,我們就可以做一個很好的模型,這實驗我們也做了通過MIT收集的數據,是相當的成功。

我們還做了一些比較有趣的比方說通過圖片能夠自動產生對應的詩歌,這個是公司做的一個,就是自學習的實驗,這是一個我們小的時候,可能玩過的遊戲,這個遊戲交給計算機,通過自學習,最後強化學習,能夠做到這一點,最近我們把遷移學習和強化學習相結合,也做了一個非常好的,使得不需要訓練很長的時間,我們就可以把新的遊戲給學會。


這裡我要說,遷移學習並不是僅僅在實驗室這些有趣的實驗裡面,它在工業上、尤其是在傳統工業上,也可以大批的應用。這裡我要舉一個例子就是千萬級微信公眾號上面,我們有很多這樣的數據,我們怎麼樣能夠利用這樣的數據來識別,針對最有可能性的客戶,怎麼做客戶識別呢?如果通過人來做,一個人也就能少於幾十個,最多一百個這樣。但是如果我們能夠通過大數據來做的話,這個就非常成功了,就可以對上億的人進行甄別,這個是非常成功。但是這些款項往往都是小額的貸款,但是大額貸款我們能不能做一個對應的模型,實際上用深度學習來做是非常難的?為什麼呢?因為大額貸款本身發生的事情就非常少,沒有足夠的樣本。


最近我們通過遷移學習把小額貸款的大量的數據產生的模型,遷移到少數數據大額貸款少數樣本這樣問題上,也取得了非常大的成功。這個也是讓我們覺得非常高興。對於小數據的人終於能夠享受到這樣的人工智慧紅利了。


我總結來說呢,就是我們所說的強人工智慧和超級人工智慧,實際上並不是我們需要害怕的東西,我們需要害怕的東西是我們的技術,一定需要大數據,但是我們本身又沒有大數據這樣的紅利,就好像我們大家都看過獅子王裡面的壞獅子,它就想把所有的資源集中在自己的身邊。這樣豪門更豪。相反呢我們要發展的技術是這樣的。辛巴這樣一個有很多的人幫助它,他們把知識遷移到辛巴身上,使得短時間通過小數據能夠學習、能夠成長,我們每一個人都是一個辛巴,如果我們有能力把大數據的模型遷移到我們每一個人身上,我們也使得我們每一個人都能夠享受到這樣的人工智慧紅利。

這個就是我今天要帶給大家的信息,謝謝大家。


人工智慧學家Aitists


人工智慧學家是權威的前沿科技媒體和研究機構,2016年2月成立人工智慧與互聯網進化實驗室(AIE Lab),重點研究互聯網,人工智慧,腦科學,虛擬現實,機器人,移動互聯網等領域的未來發展趨勢和重大科學問題。


長按上方二維碼關注微信號 Aitists


投稿郵箱:post@aitists.com

您可能感興趣

人工智慧、大數據、雲計算等有望成為行業下一個引擎?
IBM獨家分享:大數據時代下的認知計算與人工智慧
當人工智慧遇上大數據 第九屆中國雲計算大會——大數據與人工智慧應用論壇吸睛亮點集結
美團外賣增量的秘訣,是人工智慧、大數據和雲計算等技術的支撐
李彥宏:雲計算、大數據、人工智慧趨向「三位一體」
人工智慧的「腦洞」有多大?院士:目前太依賴計算
智慧計算將對AI起到多大助力?
大數據版圖:大數據、AI與雲計算結合已是大勢所趨
大數據和雲計算的10大影響
一文覽盡大數據、人工智慧、區塊鏈、雲計算在金融領域的全景應用
首屆人工智慧計算大會都說了什麼?
人工智慧的原型:用計算機模擬人類大腦
IBM沃森超級計算機CTO:計算機智力將會超過人類
AICC大會召開:推進「人工智慧規劃」應對三大計算挑戰
大數據24小時:特斯拉挖來計算機視覺專家任AI主管
計算機真的比人類大腦更強大嗎?
中科大、厲害了!浙大聯合攻關誕生的中國首台光量子計算機到底有多牛?
簡訊:物聯網、雲計算、大數據、人工智慧怎麼區分與彼此關係?等
DARPA發布「大腦晶元」,將允許人類接入計算機