當前位置:
首頁 > 新聞 > 谷歌大腦實習一周年:50 篇論文看機器學習、計算機視覺趨勢

谷歌大腦實習一周年:50 篇論文看機器學習、計算機視覺趨勢

【新智元導讀】谷歌大腦實習項目(Google Brain Residency Program)一周年,碩果累累,在 ICML、ICLR、CVPR 等頂會上發文 30 多篇,還有十幾篇正在 NIPS,ICCV 審核中。從機器學習理論到機器人技術到音樂生成,本文摘選介紹首屆谷歌大腦實習的10個研究。

新智元報道來源:Google 作者:聞菲

2015 年 10 月,谷歌大腦宣布推出「谷歌大腦實習計劃」(Google Brain Residency Program),為期一年,為關注機器學習和深度學習的人開始職業生涯做準備。實習生能夠利用谷歌得天獨厚的基礎設施,與領域裡最頂尖的研究人員一起工作。

2016 年 6 月,第一屆谷歌大腦實習計劃正式開始。從計算機科學到物理、數學、生物和神經科學,成員背景不一。有的人博士剛畢業,也有人已經有多年的工作經驗。他們研究的課題也從自然語言理解,機器人,到神經科學再到遺傳學,覆蓋廣泛。

據悉,迄今為止,第一批谷歌大腦實習生已在 ICLR(15),ICML(11),CVPR(3),EMNLP(2),RSS,GECCO,ISMIR,ISMB 和 Cosyne 等領先的機器學習會議及刊物發表了 30 多篇論文(括弧里的數字表明在相關會議發表的論文數量)。另外,還有 18 篇論文在 NIPS,ICCV,BMVC 和《自然-方法》審核中。

谷歌大腦實習計劃一周年成果摘選

那麼,下面我們就來看看這些成果(排名不分先後)。

先來看兩篇發表在「互動式期刊」 Distill 的工作:

1. 「看見」神經網路如何生成手寫字元

GIF/1.2M

用互動式的方法探索了神經網路如何生成手寫字元。相關論文:《用神經網路生成手寫字元的 4 個實驗》(Four Experiments in Handwriting with a Neural Network)。作者:Carter, et al., "Experiments in Handwriting with a Neural Network", Distill, 2016. http://doi.org/10.23915/distill.000

2. 探索機器人如何從觀察中學習模仿人類運動的系統

GIF/1.8M

論文《時間對比網路:多觀察觀察中的自監督學習》(Time-Contrastive Networks: Self-Supervised Learning from Multi-View Observation)。作者:Pierre Sermanet, Corey Lynch, Jasmine Hsu, Sergey Levine,CVPR Workshop (2017)

3. 用強化學習訓練大規模分布式深度學習系統

通過優化計算到硬體設備分配,這個模型能夠使用強化學習對大規模分布式深度學習網路進行訓練。論文:《通過強化學習進行設備布局優化》(Device Placement Optimization with Reinforcement Learning)。作者:Azalia Mirhoseini, Hieu Pham, Quoc Le, Mohammad Norouzi, Samy Bengio, Benoit Steiner, Yuefeng Zhou, Naveen Kumar, Rasmus Larsen, Jeff Dean,ICML (2017)

4. 自動發現優化方法

提出了一種將方法優化方法自動化的方法,尤其是自動優化深度學習框架。論文:《用強化學習搜索神經網路優化器》(Neural Optimizer Search with Reinforcement Learning)。作者:Irwan Bello, Barret Zoph, Vijay Vasudevan, Quoc Le,ICML (2017)

5. 使用神經網路生成全新 RNN 架構,在許多任務上超越 LSTM 架構

設計神經網路十分繁瑣困難。利用這種新技術,能夠自動生成性能卓越的 RNN 架構。上圖左邊是一個 LSTM 架構,右邊是使用神經網路生成的新型 RNN 架構。後者在各種不同任務上優於廣泛使用的 LSTM。論文:《用強化學習搜索神經網路架構》(Neural Architecture Search with Reinforcement Learning)。作者:Barret Zoph, Quoc V. Le,ICLR (2017)

6. 理論計算能否取代大規模的超參數搜索?

顏色表示了神經網路的訓練準確性,從黑(隨機)到紅(高精度)以此升高。白色虛線表示可訓練和不可訓練網路之間的理論邊界。在上面的 4 幅圖中,(a)表示沒有 dropout 的網路,餘下 3 個依次表示 dropout 率為 0.01, 0.02, 0.06 的網路。論文:《深度信息傳播》(Deep Information Propagation)。作者:Samuel S. Schoenholz, Justin Gilmer, Surya Ganguli, Jascha Sohl-Dickstein,ICLR (2017)

7. 提升 GAN 合成圖像的訓練效果

上圖展示了作者提出的 AC-GAN 與其他幾種常用 GAN 的對比,從左到右依次是條件 GAN、半監督 GAN、InfoGAN。論文:《用帶有輔助分類器的 GAN 做條件圖像合成》(Conditional Image Synthesis With Auxiliary Classifier GANs)。作者:Augustus Odena, Christopher Olah & Jonathon Shlens,ICML(2017)

8. 使用神經網路為其他網路生成超參數

HyperNetwork 是生成另一個網路權重的網路。作者使用 HyperNetwork 生成 RNN 的權重,發現能為 LSTM 生成非共享權重,並在字元級語言建模、手寫字元生成和神經機器翻譯等序列建模任務上實現最先進的結果。上圖顯示了 HyperLSTM 模型生成的文本。四色方塊是每個生成字元下方的變化範圍,代表主 RNN 的 4 個權重矩陣(分別用紅、綠、藍、黃表示)。密度越高,代表主 RNN 權重變化越大。論文:《超網路》(HyperNetworks)。作者:David Ha, Andrew Dai, Quoc V. Le,ICLR (2017)

9. 用神經網路生成不同樂器的聲音

提出了一種類似 WaveNet 的自編碼器模型,讓這個模型學習了一系列嵌入,通過插入元素,讓生成在聲音聽上去像是由不同的樂器發出的。上圖展示了這種模型的結構,能從原始音頻波形中學習時間碼,對自回歸解碼器進行調節。作者還介紹了一個高質量的大規模音符數據集 NSynth。論文:《WaveNet 自編碼器合成音樂》(Neural Audio Synthesis of Musical Notes with WaveNet Autoencoders)。作者:Jesse Engel, Cinjon Resnick, Adam Roberts, Sander Dieleman, Douglas Eck, Karen Simonyan, Mohammad Norouzi,ICML (2017)

10. 有效利用噪音標籤,提升分類精度

研究提出了一項利用噪音標籤的方法。噪音標籤就是那些有很多專家對一幅圖像給出了不同標記的標籤。作者使用一個神經網路對每個專家的標籤都給出一組輸出,然後學習平均權重來組合其預測。通過這種方法,知道哪位專家說了什麼,對數據有了更好的標記,從而提高分類精度。上圖是實驗中對糖尿病視網膜病變嚴重程度的標記。論文:《誰說了什麼:為單個標記者建模提升分類質量》(Who Said What: Modeling Individual Labelers Improves Classification)。作者:Melody Y. Guan, Varun Gulshan, Andrew M. Dai, Geoffrey Hinton,CVPR Workshop (2017)

谷歌大腦實習計劃:畢業生去向及新一屆招生

據悉,本屆谷歌大腦實習計劃的畢業生,有很多都留在谷歌大腦全職工作。其他人則進入斯坦福、伯克利、康奈爾、多倫多和 CMU 等頂級機器學習博士項目深造。

現在,第二屆實習計劃即將開始。同時,第三屆招生計劃 9 月開放。了解更多可以訪問:g.co/brainresidency

了解其他研究工作,可以訪問:https://research.google.com/pubs/BrainResidency.html

點擊閱讀原文查看新智元招聘信息

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

機器學習(4)之線性判別式(附Python源碼)
機器學習演算法在自動駕駛汽車中扮演怎樣的角色
機器學習產品寶典:這是谷歌內部總結的七大要點
谷歌瞄準 AI 交互,開源兩大機器學習可視化數據工具
「機器學習」未必就是「人工智慧」……

TAG:機器學習 |

您可能感興趣

谷歌機器學習43條規則:機器學習工程的最佳實踐經驗
谷歌機器學習43條規則:機器學習工程的最佳實踐經驗
機器學習的最佳學習路線原來只有四步
計算機佔領美國十佳工作榜,機器學習工程師年入13萬美元
大白話——機器學習
穿越千年,在古畫里學習高端植物設計 (附54分鐘講解視頻)
一文看懂機器學習流程
雲計算「戀上」機器學習
聊天機器人:音頻,AI和機器學習
專註於計算機視覺與機器學習,泛化智能獲千萬級Pre-A輪融資
最實用的 50 篇文章,教你搭建機器學習 APP
機器學習演算法總覽
機器學習第一課:決策樹學習概述與實現
機器學習1:什麼是機器學習?
良心推薦:一份20周學習計算機科學的經驗貼(附資源)
計算機學習——介面大全
機器學習開發者應該收藏的 DIY 計算機視覺和深度學習項目
機器學習5年大躍進,可能是個錯覺
日語學習——五十音複習及濁音
資料庫50年:能藉機器學習再造一個黃金期嗎?