當前位置:
首頁 > 新聞 > GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點

GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點


5 月 28 日,機器之心主辦的為期兩天的全球機器智能峰會(GMIS 2017)進入第二天,全天議程中最受關注的是多位重要嘉賓出席的領袖峰會,包括《人工智慧:一種現代方法》的作者 Stuart Russell、第四範式聯合創始人兼首席科學家楊強、科大訊飛執行總裁兼消費者事業群總裁胡郁、阿爾伯塔大學教授及計算機圍棋頂級專家Martin Müller、Element AI 聯合創始人 Jean-Sebastien Cournoyer 等。

上午,第四範式首席科學家、香港科大計算機科學與工程系主任楊強發表了主題為《遷移學習最新進展》的演講,他探討分享了機器學習,人工智慧到底有哪些最新的進展,以下是該演講的主要內容:

首先,楊強教授回顧而今日的圍棋大戰,而給楊強教授比較深印象是柯潔所說的:「AlphaGo 看上去像神一樣的存在,好像是無懈可擊。」而我們如果從機器學習的角度來看,其還是有弱點的,而且這個弱點還很嚴重。這個弱點即,AlphaGo 沒有遷移學習的能力。

機器的一個能力是能使用大量數據進行學習,所以數據的質量是非常重要的。但是,AlphaGo 不能在學會圍棋後,遷移到擁有下象棋的能力。因此,機器如今是沒有這種推廣能力的,這就是我們今天要探討的問題——遷移學習。

GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點

但是在說這個題目之前,我們先看看能從 AlphaGo 2.0 里學到的知識:

  • 今年的數據和去年的數據大有不同,數據的質量使得AlphaGo的性能得到大幅度提升,所以數據的質量是非常重要的。

  • 計算架構也很重要,去年 AlphaGo 用了上千塊 CPU和成百塊GPU,但今年只用了很少量的TPU。因此,今年的計算架構有了一種飛躍性的變化。

  • 演算法也是非常重要的,強化學習即讓計算機自我訓練、自我學習。如果我們賦予機器能夠自我學習的能力,它在某些方面將擁有超越人的能力,這種自我學習的演算法極其重要。

這三點對於商業活動其實也是非常重要的,我們可以了解到現有成功的人工智慧應用,都有高質量的數據、優良計算架構和自我學習的閉環的能力。

GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點

人類在學會自行車後,再學摩托車就非常容易了;看了一兩張圖片,就可以把它擴展到許多其他不同的景象。我們能把我們過去的經驗帶到不同的場景,這樣就有了一種能夠適應新環境的能力。

機器如何才能也具有這種能力呢?楊強教授表示人類有一個訣竅,而這個訣竅可以應用到機器學習中——即遷移學習的要素——就是發現共性,發現領域之間的共性。如果一旦發現了這種關鍵的共性(共同特徵)遷移學習就變得非常容易。

為什麼我們需要研究遷移學習?

  • 首先,生活上我們遇到更多的是小數據,而在小數據上學習的模型,才是真正的智能。

  • 第二,我們希望構建的系統不僅在那個領域能夠發揮作用,在其周邊也可以發揮作用。即我們希望系統是可靠的,其可以舉一反三和融會貫通,這也是我們賦予智慧的一種定義。

  • 第三,我們希望更重要的是如何能夠把一個通用的系統加上個人的小數據,而遷移到個人的場景當中去,因此我們可以向個性化方向發展。遷移學習就是一個必不可少的工具。

但遷移學習為什麼如此難以實現?因為即使是人類也很難發現這些共同點。

遷移學習的進展

楊強教授下面接著給大家介紹了一下,遷移學習最近有哪些進展。

GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點

第一個進展,即如果我們面臨一個機器學習問題,那麼可以通過把問題的結構和內容分離開來而發現不同問題之間的共性。雖然這種方式並不容易,但一旦能夠完成地話,系統舉一反三的能力就非常強了。

GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點

以上是2005年《Science》的一篇文章,有三個研究者在手寫字體識別上將結構和手寫的方式、斜體字等各種寫法區分開。他們發現,在學習結構這一方面,用一個例子就可以實現,這也稱之為單個例學習。

第二個進展,是因為過去我們在學習方面太注重發現共性本身,但是卻沒有注意在不同的層次之間發現這些共性。因此,如果我們把問題分解為不同層次,那麼層次化的系統就更容易幫助我們構建機器學習的遷移。

GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點

在圖像識別上,如果我們把分類改變,那麼傳統的機器學習就需要用大量數據重新訓練,花大量時間訓練一個新的模型。但是現在利用這種層次型的遷移學習,我們會發現,不同的層次具有不同的遷移能力,這樣遷移能力就有了一個定量的估計。所以,當出現新的問題時,我們就可以把某些層次給固定住,而將其他的區域用小數據訓練。這樣就能夠達到遷移學習的效果。

第三個進展,過去的遷移學習,往往是有一個領域已經做好了模型,而我們的目的是要把它遷移到一個新的領域,從舊領域遷移到新領域,從一個多數據的領域遷移到少數據的領域,這種叫單步的遷移。但是我們現在發現,很多場景是需要我們分階段來的。比如說我們分四年去上大學,因為我們需要把我們的知識進行分段學習,以一個課程為基礎轉到下一個課程。

GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點

用這個思想,我們也可以進行多步傳導式的遷移,比如說我們可以建立一個機器學習的深度網路,這個網路的中間層即能夠照顧目標問題領域,又能照顧原領域。

第四,學習如何遷移。這20年中,我們積累了甚至上百種遷移學習的演算法,但現在有一個問題,即當遇到一個新的機器學習問題時,我們不知道到底該用哪個演算法。其實,既然有了這麼多的演算法,有了這麼多的文章,我們可以把他們這些經驗總結起來,用來訓練一個新的演算法,這個演算法它的老師就是所有這些機器學習演算法和數據。所以,這種學習如何遷移,就像我們常說的學習如何學習,這個才是學習的最高境界,就是學習方法的獲取。

GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點

第五個進展,即把遷移學習本身作為一個元學習(Meta Learning),然後再賦予到不同學習的方式上。也就是在當前機器學習的問題或者是模型上面加一個遷移學習的模式,而變成一個遷移學習的模型。這種加一個模式的辦法就是元學習。假設我們有一個強化學習模型,我們在上面做一個「外套」,就能把它成功變成一個遷移學習模型。

GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點

最後一個的進展,就是用數據生成式的遷移學習-GAN

GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點

我們可以通過簡單的類比來理解生成對抗網路:即兩個人比賽,看是 A 的矛厲害,還是 B 的盾厲害。比如,我們有一些真實數據,同時也有一把亂七八糟的假數據。A 拚命地把隨手拿過來的假數據模仿成真實數據,並揉進真實數據里。B 則拚命地想把真實數據和假數據區分開。

這裡,A 就是一個生成模型,類似於賣假貨的,一個勁兒地學習如何騙過 B。而 B 則是一個判別模型,類似於警察,一個勁兒地學習如何分辨出 A 的騙人技巧。如此這般,隨著 B 的鑒別技巧的越來高超,A 的騙人技巧也就越來越純熟。一個造假一流的 A,就是我們想要的生成模型。

GMIS 2017 大會楊強演講:遷移學習的挑戰和六大突破點

最後楊強教授說,我們在深度學習上已經有了很大的成就, 而我們今天在努力進行各種嘗試,在強化學習,比如說AlphaGo,但是楊強教授認為機器學習的明天是在小數據、個性化、可靠性上面,就是遷移學習的發展。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

GMIS 2017大會圓桌論壇:機器智能時代的青年先鋒視野
GMIS 2017 大會吳思演講:視覺信息處理的動態法則
GMIS2017Schmidhuber演講:人工智慧改變一切

TAG:機器之心 |

您可能感興趣

Kubuntu 18.10 開發重點遷移至ARM與X64平台
IJCAI 2018國際廣告演算法大賽遷移學習奪冠,中國包攬冠亞季軍
macOS 10.15將迎來一波iPad應用大遷移
iOS11.3正式版推出時間曝光#iCloud中國99.9%同意遷移
ThinkPad X1加裝4G模塊、升級1TB固態、遷移系統
官方揭秘OpenAI Five打敗人類:遷移學習10個月訓練4.5萬年
官方揭秘OpenAI Five如何打敗人類:遷移學習+海量訓練,10個月訓練4.5萬年
100PB用時45天 史上最大數據遷移上雲
詳解iOS 12.4帶來的全新iPhone遷移功能
3000多隻羊進行大遷移
iOS 12.4 正式推送:新增 iPhone 數據遷移功能
iOS12.4發布正式版,新增iPhone遷移功能
CVPR 2018|雞尾酒網路DCTN:源分布結合律引導的遷移學習框架
iOS 12.4 正式版發布,新增數據遷移功能
IBM NeurIPS 2018 poster:把深度學習模型的表現遷移到傳統機器學習模型獲得高可解釋性
蘋果iOS12.4正式推送:新增數據遷移功能
2017年中國人口遷移所折射出的大轉折
蘋果發布iOS 12.4 推出全新iPhone遷移功能
CVPR 2018 | Spotlight 論文:北京大學計算機研究所提出深度跨媒體知識遷移方法
每年1.2億美元,Twitter計劃將全球最大Hadoop集群遷移到谷歌雲