DeepMind深度學習高級課程，視頻已全部放出

科技 11-24

痴栗子發自麥蒿寺

量子位報道 | 公眾號 QbitAI

昨天，DeepMind興奮地發推宣告：

我們在倫敦大學學院 (UCL) 講授的課程，現在全部課堂視頻都放出來了。

課號COMPGI22，名叫高級深度學習和強化學習(Advanced Deep Learning and Reinforcement Learning) ，是今年早些時候結課的。

面對這一喜訊，推特上的小夥伴們紛紛馬克，奔走相告。

DeepMind發布研究成果的推特，幾條加起來可能也不及這一條資源的關注度。

兩個部分，合體進化

一個學期18節課，老師是DeepMind研究負責人兼UCL教授Thore Graepel，與他率領的一眾DM研究員。

課程分為兩個部分，互有交叉，在學期的結尾正式匯合：

一個部分，是用深度神經網路做機器學習；

另一部分，是用強化學習做預測和控制。

兩股溪流，終會以「深度強化學習」之名，合為一體：

在強化學習環境里，深度神經網路會以函數逼近器(Function Approximators) 的形象出現。

深度學習部分

開始，是簡要介紹神經網路和監督學習，用的是TensorFlow。

後面，是卷積神經網路(CNN) ；

遞歸神經網路(RNN) ；

端到端(End-to-End) 以及基於能量(Energy-Based) 的學習；

優化方法(Optimization Methods) ；

無監督學習(Unsupervised Learning) ；

當然，還會講到注意力(Attention) 和記憶(Memory) 。

課堂要討論的應用方向，包括物體識別，以及自然語言處理。

強化學習部分

這一部分，會涉及馬爾可夫決策過程(Markov Decision Process) ；

動態規劃/動態編程(Dynamic Programming) ；

無模型預測和控制(Model-Free Prediction and Control) ；

價值函數(Value Function) ；

近似(Approximation) ；

策略梯度方法(Policy Gradient Methods) ；

學習與規劃的整合(Integration of Learning and Planning) ；

以及強化學習里最重要的，探索未知與利用已知之間的兩難抉擇。

應用層面的討論，包括學打經典遊戲，和桌游。

最終，兩個部分完成合體。

友情提示：以上兩部分是穿插進行，同學們可提前做好心理建設。

祝您成功

這裡，是每一節課的主題。

前三節是深度學習，又三節是強化學習。不過再往後，就是一節深度學習、一節強化學習，這樣的高頻切換了。

如果各位剛才沒注意，DeepMind宣布課程喜訊的那條推特，最後一句話是：

課程視頻傳送門 (梯子必要) ：

https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs

—完—

年度評選申請

加入社群

量子位AI社群開始招募啦，歡迎對AI感興趣的同學，在量子位公眾號（QbitAI）對話界面回復關鍵字「交流群」，獲取入群方式；

此外，量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募，面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號（QbitAI）對話界面回復關鍵字「專業群」，獲取入群方式。（專業群審核較嚴，敬請諒解）

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話界面，回復「招聘」兩個字。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 量子位 的精彩文章:

※全面超越人類！Google稱霸SQuAD，BERT橫掃11大NLP測試
※科大訊飛回應「同傳造假」：承認轉寫人類同傳，溝通不足造成誤解

TAG:量子位 |