當前位置:
首頁 > 新聞 > 谷歌大腦研發出通用永久記憶模塊,神經網路首次實現終身學習

谷歌大腦研發出通用永久記憶模塊,神經網路首次實現終身學習

谷歌大腦研發出通用永久記憶模塊,神經網路首次實現終身學習

新智元編譯

谷歌大腦研發出通用永久記憶模塊,神經網路首次實現終身學習

帶記憶的增強型神經網路是最近的研究熱點。許多研究設計了一個記憶組件,用於標準遞歸神經網路的記憶泛化。在遞歸網路中,從一個時間點傳遞到下一個的狀態可以被解釋為當前樣本的網路記憶表徵。從記憶的固定長度向量表徵移到更大更多樣化的形式,是這些研究採用的核心方法。而自從Santoro等人在2016年的研究中在基於記憶的模型和一次性學習(one-shot learning)之間構建了聯繫,許多針對一次性學習的研究也湧現了出來。

儘管最近取得了一些進展,經過記憶強化的深層神經網路在終身學習和一次性學習(one-shotlearning)方面仍然是有限的,尤其是在記住罕見事件方面。我們今天為大家介紹的這篇論文提出了一個在深度學習過程中使用的大規模的終身記憶模塊,該模塊利用快速最近鄰演算法來提高效率,從而擴展到大型記憶的規模。除了最近鄰查詢之外,模塊是完全可微分的,並且在沒有額外監督的情況下可以端對端地訓練。它是終身的,也就是說,不需要在訓練期間重置它。

谷歌大腦研發出通用永久記憶模塊,神經網路首次實現終身學習

這一記憶模塊可以很容易地添加到有監督神經網路的任何部分。為了顯示其靈活性,研究者把它加到了許多網路中,從簡單的、用圖像分類進行測試的卷積網路,到深度的、序列到序列的遞歸卷積模型。在各種情況下,經過加強的網路都獲得了一次性終身學習的能力。模塊記住了過去幾千步的訓練樣本,並可以從中泛化。研究者在Omniglot數據集上進行了目前最先進的一次性學習,並首次展示了大規模機器翻譯任務中遞歸神經網路的終身學習和一次性學習。

論文要解決的問題——罕見事件的學習

從計算機視覺到語音識別再到機器翻譯,機器學習系統在許多領域都獲得了成功。神經機器翻譯是如此成功,以至於對某些語言「組」來說,它已經接近了人類翻譯的平均水平。但此處平均辭彙是一個關鍵因素。當一個句子和豐富的訓練數據中的某一句很類似時,翻譯會很準確。然而,當遇到一個罕見的辭彙,比如Dostoevsky(德語中是Dostojewski)時,許多模型會處理失敗。Dostoevsky的正確德語翻譯在模型的訓練數據中出現的次數不夠,模型無法學習其譯文。

也許和這位著名俄國作家相關的例句最終會被加入到訓練集中,但還有許多其他種類的其他罕見辭彙或罕見事件。這給現有的深度學習模型帶來了一個問題:必須擴展訓練數據,並且重新訓練模型來應付這些罕見詞或事件。與此不同的是,人類則可以從一個例子中進行學習,終身不忘。

論文提出的辦法——終身記憶模塊

這篇論文的作者提出了一個可以在多種神經網路中實現一次性學習的終身記憶模塊。這一模塊包括多個鍵值對。鍵是神經網路特定層的激活信息,值則是對於給定樣本的ground-truth的目標。這樣,隨著網路被訓練,它的記憶就會增加,同時變得更有用。最終它能基於過於具有相似激活信息的知識給出預測。當面對一個新樣本時,網路將其寫入記憶,以供以後使用,即使這一樣本只出現了一次。

擁有長期記憶具有很多優勢。一次性學習本身就很有價值,在一些任務中更是不可或缺。即使是擁有大量訓練集的真實世界的任務,比如翻譯,也可以從長期記憶中獲益。最後,因為從記憶可以回溯到訓練樣本,這就有可能對模型所做決策進行解釋,由此可以更有針對性的改進模型。

終身記憶模塊的評估

如何評估一次性終身學習模型的性能,這一點還不十分清楚,因為大多數深度學習評估都聚焦於平均性能,沒有一次性學習的組件。論文作者嘗試用多種方法進行了評估,以證明其記憶模塊確實有效:

1.作者在眾所周知的一次性學習任務Omniglot進行評估,這是唯一一個帶有明確一次性學習評估的數據集。評估結果顯示,加入記憶模塊後,超越了此前的最好結果;

谷歌大腦研發出通用永久記憶模塊,神經網路首次實現終身學習

Omniglot數據集上的結果。雖然只使用了一個簡單的卷積神經網路,記憶模塊的增加仍然使模型在1-shot和multi-shot學習任務中的表現接近複雜得多的模型。

2.作者人為設計了一個要求一次性終身學習的任務。在這一任務中,標準模型表現較差,而作者的模型表現較好;

3.最後,作者訓練了一個帶有一次性終身學習模塊的英語-德語翻譯模型。它仍然保持了非常好的平均性能,且可以進行一次性學習。定性來看,模型可以翻譯像Dostoevsky這樣的罕見辭彙。定量來看,如果模型在評估前可以看到相關的翻譯,它在評估時獲得的BLEU分數就會顯著增加。

論文作者指出,終身記憶模塊可以添加到不同的深度學習模型中,並且可以在不同層上給網路一次性學習的能力。記憶模塊中有一些部分還可以再調整,並進行更細緻的研究。用正確的鍵達到查詢平均值的更新規則應該被參數化。較之僅僅返回單一近鄰,我們也可以返回多個近鄰來讓網路的其他層去處理。論文作者將這些問題留待未來的研究。

論文地址:https://arxiv.org/pdf/1703.03129v1.pdf

谷歌大腦研發出通用永久記憶模塊,神經網路首次實現終身學習

3月27日,新智元開源·生態AI技術峰會暨新智元2017創業大賽頒獎盛典隆重召開,包括「BAT」在內的中國主流 AI 公司、600多名行業精英齊聚,共同為2017中國人工智慧的發展畫上了濃墨重彩的一筆。

點擊閱讀原文,查閱文字版大會實錄

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

第一個手機端分布式深度學習系統,設計自動化頂會 DATE 最佳論文
宋繼強詳解英特爾AI戰略布局,三大引以為豪的技術優勢|新智元峰會演講PPT
「獨家」百度朱凱華:智能搜索和對話式OS最新技術全面解讀(65PPT)

TAG:新智元 |

您可能感興趣

可以為發育中大腦的神經網路建模啦
如何用自動機器學習實現神經網路進化
這個大工程又一次震撼全球,將完善空中網路,實現三大網路貫通
用 C 語言實現神經網路需要幾步?
實現網路邊緣人工神經網路應用
兩岸青年網路文學大賽結果揭曉,頻繁交流是發展大勢
網路文學與當代現實生活
卡巴斯基實驗室開發了用於遠程收集網路攻擊後的證據
亞馬遜在智能家居上領先 現在又在開發社交網路
神經科學學會期刊:大腦通信網路研究的最新進展
研究人員發現神經網路系統也有後門
曾被認為不存在的「算珠」,正在重新發明神經網路
「新智元專訪」神經元本身也能編程,神經網路學習能力遠超預期
大熱劇《矽谷》啟發谷歌:用神經網路壓縮文件
孿生網路實現小數據學習!看神經網路如何找出兩張圖片的相似點
讓神經網路替你編程:如何用深度學習實現程序自動合成
高通推出網狀網路平台:智能家庭的終極形態
戰爭已經爆發了,在網路上
中國五冶大學 成本會計在網路經濟下的發展狀況