新鮮開源：基於TF2.0的深度強化學習平台

科技 02-24

整理 | Jane

出品 | AI科技大本營（公眾號id：rgznai100）

近日，Github 一位開發者 danaugrs 開源了一個新項目——Huskarl，一個專註研究和快速原型的深度強化學習框架。

此框架基於 TensorFlow 2.0 構建，使用了 tf.keras API，保證了其簡潔性和可讀性。Huskarl 可以使多環境的並行計算變得很容易，這將對加速策略學習演算法（比如 A2C 和 PPO）非常有用。此外，Huskarl 還可以與 OpenAI Gym 環境無縫結合，並將計劃支持多代理環境和 Unity3D 環境。

OpenAI Gym：2016 年 OpenAI 發布的一個可以開發、對比強化學習演算法的工具包，提供了各種環境、模擬任務等，任何人都可以在上面訓練自己的演算法。

Unity3D：一個全面整合的專業遊戲引擎，由 Unity Technologies 開發的一款可以讓玩家輕鬆創建三維視頻遊戲、實時三維動畫等類型互動內容的多平台綜合型遊戲開發工具。

目前，Huskarl 已經支持了 DQN（Deep Q-Learning Network）、Multi-step DQN、Double DQN、A2C（Advantage Actor-Critic）等演算法，還有 DDPG（Deep Deterministic Policy Gradient）、PPO（Proximal Policy Optimization）、Curiosity-Driven Exploration 等演算法在計劃中。

最重要的是，TF 2.0 的 nightly 已經發布，這個開源工具也是基於 TF2.0 開發的，所以大家要先安裝一下 tf 2.0 nighty 版本。除此之外，還需要安裝以下工具和環境：

這個工具還是新鮮出爐燙手的呢，大家趕緊來嘗鮮試一下~

地址：

https://github.com/danaugrs/huskarl

群招募

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI科技大本營 的精彩文章:

※如何讓AI教機器自己玩俄羅斯方塊？
※匯聚6年思想變遷：知識圖譜報告幻燈片大全

TAG:AI科技大本營 |