16篇論文、70多頁PPT幫你優化深度學習模型，免費下載

科技 12-15

乾明發自凹非寺

量子位報道 | 公眾號 QbitAI

在沒有改變計算複雜度的情況下，只是使用「調整學習率」和「修改特定卷積層的步幅大小」等方法，就將ResNet- 50在ImageNet上的top-1驗證準確率從75.3%提高到79.29%。

這個成果來自於亞馬遜近期發表的一篇論文《Bag of Tricks for Image Classification with Convolutional Neural Networks》，作者為李沐帶領的AWS研究團隊。

論文摘要中表示，這篇論文的中的方法和結論也能適用於其他任務，比如目標檢測、語義分割等等。

最近，Reddit機器學習版塊有人發帖稱，自己也整理了各種各樣調整改善深度學習模型的方法，比亞馬遜的論文中提到的方法還要多。

他將這些內容做成了PPT，一共70多頁，涵蓋了16篇經典論文和兩篇博客文章。

目前，這個帖子在Reddit上的分數已經超過了150，GitHub上的Star也超過了400。

PPT裡面講的是啥？

這份PPT，主要有7個主題，分別是：

調整學習率

調整小批量的規模

調整優化器和權值衰減

調整特徵和標籤

調整特徵和標籤（mixup）

調整初始條件

Shake-shake正則化

每一個主題，都基於相對前沿以及效果較好的論文來進行分析。比如調整學習率這一主題，作者就選擇了《Cyclical Learning Rates for Training Neural Networks》等3篇論文。

這篇論文最後的修訂日期為2017年4月4日，這篇論文的主要就是從學習率的角度來談怎麼訓練深度學習網路，並提出了一種名為循環學習率（cyclical learning rates）的新方法。

PPT中，作者對論文中的方法與思路進行了梳理，並給出了注釋。

最後，作者也對亞馬遜的論文《Bag of Tricks for Image Classification with Convolutional Neural Networks》進行了梳理與總結。

寫這份資源的是誰？

PPT上的信息顯示，這個PPT的作者是Krzysztof Kolasiński，來自一家名為FORNAX.ai的公司。

Linkedin上的介紹稱，Krzysztof Kolasiński是這家公司的機器學習工程師，波蘭人。他是一位物理學博士，專門研究計算物理學中的量子傳輸問題。

傳送門：

PPT傳送門：

https://github.com/kmkolasinski/deep-learning-notes/blob/master/seminars/2018-12-Improving-DL-with-tricks/Improving_deep_learning_models_with_bag_of_tricks.pptx

在量子位公眾號（QbitAI）對話界面回復「70頁報告」，也可直接下載PPT~

—完—

活動報名

加入社群

量子位AI社群開始招募啦，歡迎對AI感興趣的同學，在量子位公眾號（QbitAI）對話界面回復關鍵字「交流群」，獲取入群方式；

此外，量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募，面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號（QbitAI）對話界面回復關鍵字「專業群」，獲取入群方式。（專業群審核較嚴，敬請諒解）

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話界面，回復「招聘」兩個字。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 量子位 的精彩文章:

※李飛飛新論文「AI醫生」診斷抑鬱症，準確率超過80％，可移植到手機端

TAG:量子位 |