當前位置:
首頁 > 科技 > 新鮮開源:基於TF2.0的深度強化學習平台

新鮮開源:基於TF2.0的深度強化學習平台

整理 | Jane

出品 | AI科技大本營(公眾號id:rgznai100)

近日,Github 一位開發者 danaugrs 開源了一個新項目——Huskarl,一個專註研究和快速原型的深度強化學習框架。

此框架基於 TensorFlow 2.0 構建,使用了 tf.keras API,保證了其簡潔性和可讀性。Huskarl 可以使多環境的並行計算變得很容易,這將對加速策略學習演算法(比如 A2C 和 PPO)非常有用。此外,Huskarl 還可以與 OpenAI Gym 環境無縫結合,並將計劃支持多代理環境和 Unity3D 環境。

OpenAI Gym:2016 年 OpenAI 發布的一個可以開發、對比強化學習演算法的工具包,提供了各種環境、模擬任務等,任何人都可以在上面訓練自己的演算法。

Unity3D:一個全面整合的專業遊戲引擎,由 Unity Technologies 開發的一款可以讓玩家輕鬆創建三維視頻遊戲、實時三維動畫等類型互動內容的多平台綜合型遊戲開發工具。

目前,Huskarl 已經支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(Advantage Actor-Critic)等演算法,還有 DDPG(Deep Deterministic Policy Gradient)、PPO(Proximal Policy Optimization)、Curiosity-Driven Exploration 等演算法在計劃中。

最重要的是,TF 2.0 的 nightly 已經發布,這個開源工具也是基於 TF2.0 開發的,所以大家要先安裝一下 tf 2.0 nighty 版本。除此之外,還需要安裝以下工具和環境:

這個工具還是新鮮出爐燙手的呢,大家趕緊來嘗鮮試一下~

地址:

https://github.com/danaugrs/huskarl

群招募

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI科技大本營 的精彩文章:

如何讓AI教機器自己玩俄羅斯方塊?
匯聚6年思想變遷:知識圖譜報告幻燈片大全

TAG:AI科技大本營 |