當前位置:
首頁 > 新聞 > 在線元學習:通過持續元學習解決傳統機器學習方式的致命不足

在線元學習:通過持續元學習解決傳統機器學習方式的致命不足

新智元報道

來源:ZDNet

編輯:元子

【新智元導讀】傳統機器學習正在凸顯它的不足。為了解決此問題,伯克利大學人工智慧實驗室教授繼2017年提出元學習後,又提出在線元學習。不僅可以解決傳統學習的不足,同時也彌補了元學習缺乏持續學習的缺陷。

傳統機器學習正在凸顯它的不足。

傳統的機器學習研究模式需要獲取特定任務的大型數據集,然後利用這個數據集從頭開始訓練模型。面對數據量不足的新任務時,這種方式顯然無法勝任。

如何使神經網路不僅能夠從一個學習任務,概括到另一個學習任務?而且隨著時間的推移,不斷提高通用新任務的概括能力?

解決上述問題的新理論:在線元學習

最近,伯克利大學人工智慧實驗室,Sergey Levine教授和同事切爾西·芬恩博士、領先的機器學習理論專家Sham Kakade及其學生、華盛頓大學的Aravind Rajeswaran,進行了一些非常有趣的工作。

Levine教授多年來一直致力於將機器人技術,更多地轉向一種綜合「學習」方法:即讓機器人或智能體,學會「學習」(Learning to learn),即「元學習」。

元學習中,神經網路在某種意義上是對某些任務進行預先訓練的,然後允許它實現一種技能轉移,使用新的、不同於訓練好的數據進行測試。此舉的目標,是訓練計算機能夠處理前所未有的新任務。

要完成我們開頭描述的新挑戰,需要將所需的數據量儘可能的減少,以應對神經網路面臨的一些新任務,例如可能沒有大量可用的訓練數據,或者沒有大量已標記的訓練數據。

在arXiv的一篇「在線元學習」論文中,作者描述了實現的可能性。(鏈接地址在文末)。與在線元學習並行的是,計算機正在學習如何及時擴展其對實例的理解,從某種意義上提高其理解能力。

此項研究已經與Levine的其他工作相呼應,例如哪些更接近機器人技術本身的成果。

了解在線元學習

在線元學習的誕生之前,Levine和他的團隊在2017年開發了一個廣泛的系統,稱為「模型無關的元學習(MAML)」。

這種方法可以匹配任何使用梯度下降演算法訓練的模型,並能應用於各種不同的學習問題,如分類、回歸和強化學習等。

但MAML有一個弱點:它的概括能力在初始預訓練後基本停止,隨著時間的推移,失去了適應能力。

為了解決這個問題,作者借鑒了另一條長長的研究線索:在線學習。

在線學習中,神經網路通過比較每個新任務的參數中,不同的可能設置之間的差別,來進行不斷優化。

該神經網路尋求以這種方式找到其參數的解決方案,將任務的實際性能與最佳性能之間的差異,即最小化「regret」。

作者提出了「follow the meta-leader」演算法,這是一個將「元學習」這個術語與最成功的「在線學習」演算法相結合的辭彙。

值得一提的是,「follow the leader」的,最早是在20世紀50年代,Jim Hannan為博弈論領域。

智能體被賦予一系列任務,這些任務在一輪又一輪不斷的進行。例如經典MNIST數據集中的數字圖像,或者對場景中的對象執行「姿勢預測」,或對物體進行分類。

每輪結束之後,智能體試圖通過fine-tune,使得其隨時間發展的權重或參數,達成regret最小化的目的。

而所有這一切都通過經典的神經網路優化方法,隨機梯度下降來實現。作者將這些任務與先前的方法相比後,展示了了一些令人印象深刻的基準測試結果。

在線元學習的缺陷

論文最後得出的觀點是:這種方法在某種意義上說,是站在一種更偏自然過程的角度,來實現理想的現實世界學習過程,因為它包含「與不斷變化的環境相互作用的智能體」。

正如作者提到,這個事實「應該利用流演算法的經驗來掌握手頭的任務,並且在未來學習新任務時變得更加熟練。」

但是,萬事都不是完美的。在線元學習也有一些弱項,算力就是一個非常典型的例子。

將來需要進行一些改進以維護過去任務的數據,從而得出一些使用「更便宜算力」的演算法。

可擴展性也是一個非常大的問題。作者說雖然這種方法可以有效地按順序,學習近100項任務而不會對計算或內存造成重大負擔,但可擴展性仍然是一個問題。

而像mirroe下降這樣,不能存儲所有過去經驗的流演算法,是否能成功也是一個未知數

資源鏈接

在線元學習論文:

https://arxiv.org/abs/1902.08438

參考鏈接:

https://www.zdnet.com/article/a-berkeley-mash-up-of-ai-approaches-promises-continuous-learning/

【加入社群】

新智元AI技術 產業社群招募中,歡迎對AI技術 產業落地感興趣的同學,加小助手微信號:aiera2015_2入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

特朗普簽署美國AI國家計劃:凸顯「美國優先」,確保全球霸主地位
244頁機器翻譯學術論文寫作方法和技巧

TAG:新智元 |