當前位置:
首頁 > 新聞 > 2018 秋季伯克利大學 CS 294-112 《深度強化學習》學習小組成員招募

2018 秋季伯克利大學 CS 294-112 《深度強化學習》學習小組成員招募

AI 研習社又有新的學習小組啦!趕快加入我們吧!

課程開始後,小組成員可免費觀看課程視頻~

AI 研習社獲得官方授權,漢化翻譯伯克利大學 CS 294-112 《深度強化學習》,於本周四(2018 年 12 月 20 日)正式上線中文字幕版。

伯克利大學 CS 294-112 《深度強化學習》為官方開源最新版本,由伯克利大學該門課程授課講師 Sergey Levine 授權 AI 研習社翻譯。

觀看網址:https://ai.yanxishe.com/page/groupDetail/30(加入小組後即可直接觀看)

課程主頁:http://rail.eecs.berkeley.edu/deeprlcourse/

油管鏈接:https://www.youtube.com/playlist?list=PLkFD6_40KJIxJMR-j5A1mkxK26gh_qg37

12 月 20 日開始正式同步更新在 AI 研習社,大約1到2周更新一次。

該課程主題選擇深度增強學習,即緊跟當前人工智慧研究的熱點,又可作為深度學習的後續方向,值得推薦。


  先修要求

想要學習伯克利大學 CS 294-112 《深度強化學習》這門課程,學生需要先學習 CS189 或者其他同等學力課程。本課程將假定學生掌握強化學習、數值優化和機器學習的相關背景知識。雷鋒網雷鋒網雷鋒網

如果你對上述主題不是非常了解,那麼需要自主學習補充以下知識點:

增強學習和馬爾科夫決策過程(MDPs)

MDPs的定義

具體演算法:策略迭代和價值迭代

搜索演算法

數值最優化方法

梯度下降和隨機梯度下降

反向傳播演算法

機器學習

分類和回歸問題:用什麼樣的損失函數,如何擬合線性或非線性模型

訓練/測試誤差,過擬合

視頻截圖


  課程大綱

第一講:課程介紹和概覽

第二講:監督學習和模仿學習

第三講:TensorFlow 和神經網路簡述

第四講:強化學習簡介

第五講:策略梯度簡介

第六講:Actor-Critic 演算法簡介

第七講:價值函數介紹

第八講:高級 Q-學習演算法

第九講:高級策略梯度

第十講:最優控制和規劃

第十一講:基於模型的強化學習

第十二講:高級強化學習和圖像處理應用

第十三講:利用模仿優化控制器學習策略

第十四講:概率和變分推斷入門

第十五講:推斷和控制之間的聯繫

第十六講:逆向強化學習

第十七講:探索(上)

第十八講:探索(下)

第十九講:遷移學習與多任務學習

第二十講:元學習

第二十一講:平行結構和強化學習系統設計

第二十二講:進階模仿學習和開放性問題

第二十三講:客座講師:Craig Boutilier

第二十四講:客座講師:Gregory Kahn

第二十五講:客座講師:Quoc Le & Barret Zoph

第二十六講:客座講師:Karol Hausman

快來加入學習小組吧!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

激光雷達技術再進化!識別人類肢體語言不再是夢
Project Fi 更名為 Google Fi,支持多數 Android 機型和 iPhone

TAG:雷鋒網 |