當前位置:
首頁 > 科技 > 深入淺出理解A3C強化學習

深入淺出理解A3C強化學習

卷積神經網路在近幾年獲得了跨越式的發展,雖然它們在諸如圖像識別任務上的效果越來越好,但是隨之而來的則是模型複雜度的不斷提升。越來越深、越來越複雜的卷積神經網路在訓練階段需要大量存儲與計算資源,因此設計高效的卷積神經網路是非常重要和基礎的問題,而消除卷積核的冗餘性是該問題主要的解決方案。

如何消除消除卷積核的冗餘性?AI科技大本營邀請到微軟亞洲研究院視覺計算組資深研究員王井東,他將在 31 號的直播公開課中為大家講解發表在 ICCV 2017 和 CVPR2018 上基於交錯組卷積的方法,這種方法優於 ResNet 和 MobileNet。

感興趣的讀者可以在直播前自行查閱論文或者下載代碼,自己動手嘗試,加深理解。

課程信息

主題:深入淺出理解A3C強化學習

時間:1 月 10 日 20:00-21:00

地點:免費線上直播

掃碼報名,免費聽課

分享嘉賓

高揚,珠海金山軟體AI工程組技術負責人,前重慶工商大學研究生導師。曾任歡聚時代、金山軟體西山居遊戲工作室人工智慧、大數據相關部門技術負責人,技術暢銷書《白話大數據與機器學習》、《白話深度學習與Tensorflow》、《數據科學家養成手冊》著書人。專註於人工智慧產品的落地與實現。

適合對象

1、對強化學習感興趣的工程師

2、有基本的機器學習演算法理解的工程師

課程大綱

1、貫序決策(窮舉搜索、蒙特卡羅方法)

2、DQN原理(時間差分法和Q-Learning、Deep Q-Learning Network)

3、A3C原理(非同步方法的好處)

4、小恐龍網頁遊戲的訓練方法

5、進階資源推薦

課程安排

19:45—20:00 學員提前入場

20:00—20:50 講師課程分享

20:50—21:00 講師答疑環節

溫馨提醒

1、開課前會有簡訊提醒或者郵件提醒,請報名的時候填寫正確的手機號碼及郵箱地址。

2、開課後 2-3 個工作日內會上傳本節課的視頻回放,報名後回放視頻不限時觀看。

加入社群

掃碼添加小助手,回復:強化學習,加入 AI 科技大本營公開課分享交流群,嘉賓 PPT 及整理筆記將在直播結束後在群內公開。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI科技大本營 的精彩文章:

TensorFlow支持Unicode,中文NLP終於省心了
順豐科技如何利用深度學習賦能智慧物流?

TAG:AI科技大本營 |