新鮮開源:基於TF2.0的深度強化學習平台
整理 | Jane
出品 | AI科技大本營(公眾號id:rgznai100)
近日,Github 一位開發者 danaugrs 開源了一個新項目——Huskarl,一個專註研究和快速原型的深度強化學習框架。
此框架基於 TensorFlow 2.0 構建,使用了 tf.keras API,保證了其簡潔性和可讀性。Huskarl 可以使多環境的並行計算變得很容易,這將對加速策略學習演算法(比如 A2C 和 PPO)非常有用。此外,Huskarl 還可以與 OpenAI Gym 環境無縫結合,並將計劃支持多代理環境和 Unity3D 環境。
OpenAI Gym:2016 年 OpenAI 發布的一個可以開發、對比強化學習演算法的工具包,提供了各種環境、模擬任務等,任何人都可以在上面訓練自己的演算法。
Unity3D:一個全面整合的專業遊戲引擎,由 Unity Technologies 開發的一款可以讓玩家輕鬆創建三維視頻遊戲、實時三維動畫等類型互動內容的多平台綜合型遊戲開發工具。
目前,Huskarl 已經支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(Advantage Actor-Critic)等演算法,還有 DDPG(Deep Deterministic Policy Gradient)、PPO(Proximal Policy Optimization)、Curiosity-Driven Exploration 等演算法在計劃中。
最重要的是,TF 2.0 的 nightly 已經發布,這個開源工具也是基於 TF2.0 開發的,所以大家要先安裝一下 tf 2.0 nighty 版本。除此之外,還需要安裝以下工具和環境:
這個工具還是新鮮出爐燙手的呢,大家趕緊來嘗鮮試一下~
地址:
https://github.com/danaugrs/huskarl
群招募
※如何讓AI教機器自己玩俄羅斯方塊?
※匯聚6年思想變遷:知識圖譜報告幻燈片大全
TAG:AI科技大本營 |