當前位置:
首頁 > 知識 > 548頁MIT強化學習教程,收藏備用【PDF下載】

548頁MIT強化學習教程,收藏備用【PDF下載】

本書分為三個部分。




  • 第一部分根據馬爾可夫決策過程定義強化學習問題。



  • 第二部分提供了基本的解決方案:動態規劃,蒙特卡羅方法和時差學習。



  • 第三部分提出了解決方法的統一視圖,並結合了人工神經網路,資格跟蹤和規劃。


最後兩章介紹了案例研究,並考慮了強化學習的未來。




第二版的網站:


//incompleteideas.net/book/the-book-2nd.html



python實現的代碼:


https://github.com/ShangtongZhang/reinforcement-learning-an-introduction




課程資料:

//incompleteideas.net/609%20dropbox/




完整教程下載


關注公眾號,後台回復

20181011







今日推薦

《強化學習》


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!

TAG: |