當前位置:
首頁 > 新聞 > Twitter 又一力作:對Few-shot learning中的優化進行建模 | ICLR 2017

Twitter 又一力作:對Few-shot learning中的優化進行建模 | ICLR 2017

雷鋒網AI科技評論按:ICLR 2017 於4月24-26日在法國土倫舉行,雷鋒網AI科技評論的編輯們在法國帶來一線報道。在這個深度學習會議舉辦之際,雷鋒網也將圍繞會議議程及論文介紹展開一系列的覆蓋和專題報道,敬請期待。

Twitter 又一力作:對Few-shot learning中的優化進行建模 | ICLR 2017

據雷鋒網了解,這是一篇來自Twitter的研究員給ICLR 2017投遞的論文。目前論文已經被錄用而且還獲得了ICLR委員會的高度評價。想知道研究員在論文中又提出了什麼新的研究思路?或者ICLR委員會對這項工作的評價如何?那就趕緊跟隨小編來看看吧。

以下內容是AI科技評論根據論文內容進行的部分編譯。

論文摘要

雖然當下深度神經網路演算法在大規模數據集上取得了巨大的成功,但是這類演算法在少量學習(Few-shot Learning)任務中的表現卻往往不如人意,這是因為在少量學習任務中要求分類器能夠在經過每個類別的少量樣本訓練之後快速具備泛化能力。

現在大家通常都認為,要使得一個基於梯度下降優化演算法的分類器能具備較好的表現就需要在大量訓練樣本上進行多次訓練迭代。而在本次的論文工作中,來自Twitter的研究員推出了基於LSTM的元學習模型(LSTM-based meta-learner model),該模型可以學習到精確的優化演算法來訓練另外一個用於少量學習任務的神經網路分類器。

Twitter 又一力作:對Few-shot learning中的優化進行建模 | ICLR 2017

  • 圖1:該圖展示了元學習(Meta-learning)過程的一個示例。圖片分為兩大部分,上半部分的表示元訓練集(Meta-train set),記為Dmeta-train,其中包含有若干個灰色矩形框分別表示每一條樣本,而矩形框內部又被虛線劃分為左右兩個部分,虛線左側的包含有訓練集Dtrain,而虛線的右側包含有測試集Dtest。該示例所展示的是一個5種分類別的類任務,其中在每一條樣本的訓練集上都包含有5個類別的樣例(每一類分別被標註為1-5),然後測試集中則包含有2個樣例用於評估模型。圖片下半部分的表示元測試集(Meta-train set),記為Dmeta-test,它的定義方式與Dmeta-train完全一致,但是Dmeta-test包含有Dmeta-train中沒有覆蓋到的類別。此外,上圖中雖然沒有展示出來,但是數據集中還劃分了元驗證集(Meta-validation set)用於確定模型中的超參數。

基於LSTM的元學習模型的參數化特性允許它針對在需要一定量更新的特定場景下學習合適的參數更新方式,同時也可以學習到那些分類器網路參數的通用初始化方式,從而加速分類器的訓練和擬合過程。

並且在論文中,研究員們還證明了這種元學習模式與用於少量學習的深度度量學習技術相比具有很強的競爭力。

ICLR 委員會的定稿意見

該論文的作者提出了一種元學習模式來解決少量學習的問題。論文中提到的演算法非常有趣並且實驗結果也非常具有說服力。這是篇非常適合時宜的文章,它將在社區中受到廣泛的關注。三位評審員都給出了一致的意見——接受,而且其中兩位還顯得特別熱情。論文的作者也回復了其他一些對該論文持負面態度的審稿人所提出的疑問。不過該論文還需要繼續完善以便把其中的更多細節闡述清楚。總的來說,這篇論文已經被接受了。

匿名審稿人3

這項工作提出了一個基於LSTM的元學習框架,該框架可以學習到優化演算法以用於訓練其它的學習演算法(這裡是神經網路演算法)。本文通篇都寫得很好,並且主要材料的介紹也寫得很清楚。本文的核心:繪製Robbins Monroe更新規則和LSTM更新規則之間的並行,並利用它來滿足少量學習的兩個主要目標這一點非常有趣。

匿名審稿人2

這篇論文通過將隨機梯度下降法(SGD)的更新規則解釋為具有可訓練參數的門控循環模型(Gated recurrent model),從而提出了一種全新的元學習方法。這個創意對於遷移學習(Transfer learning)的研究具有重要意義。論文的結構清晰,但是在某些細節方面的描述還可以提升。

via Optimization as a Model for Few-Shot Learning

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

曠視科技如何推進人臉識別在安防領域的落地?
TED 2017,來見見機器人背後的七位「創造者」吧
從環視ADAS到自動駕駛,縱目科技是如何布局的?
2021年Window Phone就沒了?微軟花了152億美元換來了什麼

TAG:雷鋒網 |

您可能感興趣

谷歌 Open Images Challenge 2018 大賽正在進行中,為你送上更多信息
通過Google Expeditions和Virtual Tours進行
Telegram發布Telegram Passport,對ICO等數據進行加密
CVE-2018-8412:通過MS Office for Mac的Legacy Package進行提權
通過Google Expeditions和Virtual Tours進行沉浸式教育
bcftools進行SNP calling
通過Google Expeditions和Virtual Tours進行沉浸式教育
OnePlus5安卓8.1Oreo現在通過 Open Beta 6進行測試
為Dr.Martens加上綁帶?Engineered Garments進行大膽的嘗試
Snapchat推出3D Friendmojis進行社交互動
Getting in shape this Summer夏日塑身進行時
2018 UOD舉行Epic Games創始人Tim Sweeney進行主題演講
The Weeknd x BAPE 聯名曝光,教宗簽名版 Lamborghini Huracán 將進行義拍
三星將停止對Galaxy Note 5和S6 Edge +進行系統更新
SpringBoot中如何進行Bean配置
S.Moro和T.Lunger進行Pik Pobeda峰冬季首攀
德國 Fostla為Mercedes-AMG GT S 進行改裝強化 馬力達 613ps!
沃爾沃Polestar公司推Polestar Engineered 將電氣化進行到底
Altair發布新的Inspire 2018軟體,針對3D列印進行了優化!
Google試圖僱用Vitalik Buterin進行秘密加密項目