深入淺出理解A3C強化學習
卷積神經網路在近幾年獲得了跨越式的發展,雖然它們在諸如圖像識別任務上的效果越來越好,但是隨之而來的則是模型複雜度的不斷提升。越來越深、越來越複雜的卷積神經網路在訓練階段需要大量存儲與計算資源,因此設計高效的卷積神經網路是非常重要和基礎的問題,而消除卷積核的冗餘性是該問題主要的解決方案。
如何消除消除卷積核的冗餘性?AI科技大本營邀請到微軟亞洲研究院視覺計算組資深研究員王井東,他將在 31 號的直播公開課中為大家講解發表在 ICCV 2017 和 CVPR2018 上基於交錯組卷積的方法,這種方法優於 ResNet 和 MobileNet。
感興趣的讀者可以在直播前自行查閱論文或者下載代碼,自己動手嘗試,加深理解。
▌課程信息
主題:深入淺出理解A3C強化學習
時間:1 月 10 日 20:00-21:00
地點:免費線上直播
掃碼報名,免費聽課
▌分享嘉賓
高揚,珠海金山軟體AI工程組技術負責人,前重慶工商大學研究生導師。曾任歡聚時代、金山軟體西山居遊戲工作室人工智慧、大數據相關部門技術負責人,技術暢銷書《白話大數據與機器學習》、《白話深度學習與Tensorflow》、《數據科學家養成手冊》著書人。專註於人工智慧產品的落地與實現。
▌適合對象
1、對強化學習感興趣的工程師
2、有基本的機器學習演算法理解的工程師
▌課程大綱
1、貫序決策(窮舉搜索、蒙特卡羅方法)
2、DQN原理(時間差分法和Q-Learning、Deep Q-Learning Network)
3、A3C原理(非同步方法的好處)
4、小恐龍網頁遊戲的訓練方法
5、進階資源推薦
▌課程安排
19:45—20:00 學員提前入場
20:00—20:50 講師課程分享
20:50—21:00 講師答疑環節
▌溫馨提醒
1、開課前會有簡訊提醒或者郵件提醒,請報名的時候填寫正確的手機號碼及郵箱地址。
2、開課後 2-3 個工作日內會上傳本節課的視頻回放,報名後回放視頻不限時觀看。
▌加入社群
掃碼添加小助手,回復:強化學習,加入 AI 科技大本營公開課分享交流群,嘉賓 PPT 及整理筆記將在直播結束後在群內公開。
※TensorFlow支持Unicode,中文NLP終於省心了
※順豐科技如何利用深度學習賦能智慧物流?
TAG:AI科技大本營 |