深入淺出理解A3C強化學習

科技 01-04

卷積神經網路在近幾年獲得了跨越式的發展，雖然它們在諸如圖像識別任務上的效果越來越好，但是隨之而來的則是模型複雜度的不斷提升。越來越深、越來越複雜的卷積神經網路在訓練階段需要大量存儲與計算資源，因此設計高效的卷積神經網路是非常重要和基礎的問題，而消除卷積核的冗餘性是該問題主要的解決方案。

如何消除消除卷積核的冗餘性？AI科技大本營邀請到微軟亞洲研究院視覺計算組資深研究員王井東，他將在 31 號的直播公開課中為大家講解發表在 ICCV 2017 和 CVPR2018 上基於交錯組卷積的方法，這種方法優於 ResNet 和 MobileNet。

感興趣的讀者可以在直播前自行查閱論文或者下載代碼，自己動手嘗試，加深理解。

▌課程信息

主題：深入淺出理解A3C強化學習

時間：1 月 10 日 20：00-21：00

地點：免費線上直播

掃碼報名，免費聽課

▌分享嘉賓

高揚，珠海金山軟體AI工程組技術負責人，前重慶工商大學研究生導師。曾任歡聚時代、金山軟體西山居遊戲工作室人工智慧、大數據相關部門技術負責人，技術暢銷書《白話大數據與機器學習》、《白話深度學習與Tensorflow》、《數據科學家養成手冊》著書人。專註於人工智慧產品的落地與實現。

▌適合對象

1、對強化學習感興趣的工程師

2、有基本的機器學習演算法理解的工程師

▌課程大綱

1、貫序決策（窮舉搜索、蒙特卡羅方法）

2、DQN原理（時間差分法和Q-Learning、Deep Q-Learning Network）

3、A3C原理（非同步方法的好處）

4、小恐龍網頁遊戲的訓練方法

5、進階資源推薦

▌課程安排

19:45—20:00 學員提前入場

20:00—20:50 講師課程分享

20:50—21:00 講師答疑環節

▌溫馨提醒

1、開課前會有簡訊提醒或者郵件提醒，請報名的時候填寫正確的手機號碼及郵箱地址。

2、開課後 2-3 個工作日內會上傳本節課的視頻回放，報名後回放視頻不限時觀看。

▌加入社群

掃碼添加小助手，回復：強化學習，加入 AI 科技大本營公開課分享交流群，嘉賓 PPT 及整理筆記將在直播結束後在群內公開。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI科技大本營 的精彩文章: