DeepMind深度學習高級課程,視頻已全部放出
痴栗子 發自 麥蒿寺
量子位 報道 | 公眾號 QbitAI
昨天,DeepMind興奮地發推宣告:
我們在倫敦大學學院 (UCL) 講授的課程,現在全部課堂視頻都放出來了。
課號COMPGI22,名叫高級深度學習和強化學習(Advanced Deep Learning and Reinforcement Learning) ,是今年早些時候結課的。
面對這一喜訊,推特上的小夥伴們紛紛馬克,奔走相告。
DeepMind發布研究成果的推特,幾條加起來可能也不及這一條資源的關注度。
兩個部分,合體進化
一個學期18節課,老師是DeepMind研究負責人兼UCL教授Thore Graepel,與他率領的一眾DM研究員。
課程分為兩個部分,互有交叉,在學期的結尾正式匯合:
一個部分,是用深度神經網路做機器學習;
另一部分,是用強化學習做預測和控制。
兩股溪流,終會以「深度強化學習」之名,合為一體:
在強化學習環境里,深度神經網路會以函數逼近器(Function Approximators) 的形象出現。
深度學習部分
開始,是簡要介紹神經網路和監督學習,用的是TensorFlow。
後面,是卷積神經網路(CNN) ;
遞歸神經網路(RNN) ;
端到端(End-to-End) 以及基於能量(Energy-Based) 的學習;
優化方法(Optimization Methods) ;
無監督學習(Unsupervised Learning) ;
當然,還會講到注意力(Attention) 和記憶(Memory) 。
課堂要討論的應用方向,包括物體識別,以及自然語言處理。
強化學習部分
這一部分,會涉及馬爾可夫決策過程(Markov Decision Process) ;
動態規劃/動態編程(Dynamic Programming) ;
無模型預測和控制(Model-Free Prediction and Control) ;
價值函數(Value Function) ;
近似(Approximation) ;
策略梯度方法(Policy Gradient Methods) ;
學習與規劃的整合(Integration of Learning and Planning) ;
以及強化學習里最重要的,探索未知與利用已知之間的兩難抉擇。
應用層面的討論,包括學打經典遊戲,和桌游。
最終,兩個部分完成合體。
友情提示:以上兩部分是穿插進行,同學們可提前做好心理建設。
祝您成功
這裡,是每一節課的主題。
前三節是深度學習,又三節是強化學習。不過再往後,就是一節深度學習、一節強化學習,這樣的高頻切換了。
如果各位剛才沒注意,DeepMind宣布課程喜訊的那條推特,最後一句話是:
課程視頻傳送門 (梯子必要) :
https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs
—完—
年度評選申請
加入社群
量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
![](https://pic.pimg.tw/zzuyanan/1488615166-1259157397.png)
![](https://pic.pimg.tw/zzuyanan/1482887990-2595557020.jpg)
※全面超越人類!Google稱霸SQuAD,BERT橫掃11大NLP測試
※科大訊飛回應「同傳造假」:承認轉寫人類同傳,溝通不足造成誤解
TAG:量子位 |