當前位置:
首頁 > 科技 > DeepMind深度學習高級課程,視頻已全部放出

DeepMind深度學習高級課程,視頻已全部放出

痴栗子 發自 麥蒿寺

量子位 報道 | 公眾號 QbitAI

昨天,DeepMind興奮地發推宣告:

我們在倫敦大學學院 (UCL) 講授的課程,現在全部課堂視頻都放出來了。

課號COMPGI22,名叫高級深度學習和強化學習(Advanced Deep Learning and Reinforcement Learning) ,是今年早些時候結課的。

面對這一喜訊,推特上的小夥伴們紛紛馬克,奔走相告。

DeepMind發布研究成果的推特,幾條加起來可能也不及這一條資源的關注度。

兩個部分,合體進化

一個學期18節課,老師是DeepMind研究負責人兼UCL教授Thore Graepel,與他率領的一眾DM研究員。

課程分為兩個部分,互有交叉,在學期的結尾正式匯合:

一個部分,是用深度神經網路做機器學習;

另一部分,是用強化學習做預測和控制。

兩股溪流,終會以「深度強化學習」之名,合為一體:

在強化學習環境里,深度神經網路會以函數逼近器(Function Approximators) 的形象出現。


深度學習部分

開始,是簡要介紹神經網路監督學習,用的是TensorFlow。

後面,是卷積神經網路(CNN) ;

遞歸神經網路(RNN) ;

端到端(End-to-End) 以及基於能量(Energy-Based) 的學習

優化方法(Optimization Methods) ;

無監督學習(Unsupervised Learning) ;

當然,還會講到注意力(Attention) 和記憶(Memory) 。

課堂要討論的應用方向,包括物體識別,以及自然語言處理


強化學習部分

這一部分,會涉及馬爾可夫決策過程(Markov Decision Process) ;

動態規劃/動態編程(Dynamic Programming) ;

無模型預測和控制(Model-Free Prediction and Control) ;

價值函數(Value Function) ;

近似(Approximation) ;

策略梯度方法(Policy Gradient Methods) ;

學習與規劃的整合(Integration of Learning and Planning) ;

以及強化學習里最重要的,探索未知利用已知之間的兩難抉擇。

應用層面的討論,包括學打經典遊戲,和桌游。

最終,兩個部分完成合體。

友情提示:以上兩部分是穿插進行,同學們可提前做好心理建設。

祝您成功

這裡,是每一節課的主題。

前三節是深度學習,又三節是強化學習。不過再往後,就是一節深度學習、一節強化學習,這樣的高頻切換了。

如果各位剛才沒注意,DeepMind宣布課程喜訊的那條推特,最後一句話是:

課程視頻傳送門 (梯子必要) :

https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs

年度評選申請

加入社群

量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

全面超越人類!Google稱霸SQuAD,BERT橫掃11大NLP測試
科大訊飛回應「同傳造假」:承認轉寫人類同傳,溝通不足造成誤解

TAG:量子位 |