Google發布最新開源強化學習框架

知識 09-20

據 VentureBeat 報道，強化學習是一種人工智慧(AI)技術，它利用獎賞(或懲罰)來驅動代理朝著特定的目標前進。DeepMind 就是利用這種學習方式 AlphaGo。但是強化學習框架存在一些問題，比如需要花很多時間來掌握一個目標，而且總是不靈活，也不穩定。

針對真箇問題，Google 提出一個替代方案：基於其機器學習庫 TensorFlow 的開源強化學習框架。該強化學習框架基於靈活性、穩定性和重現性三個基本原則開發，目前已發布在 GitHub 上。

除了該開源框架外，Google 還推出了一個網站，允許開發人員能快速將針對多個代理的培訓運行進行可視化。它還提供經過訓練的模型、原始統計日誌和 TensorFlow 事件文件，用於與 TensorBoard 一起繪圖，TensorBoard 是 Google 開發的用於 TensorFlow 程序的可視化工具套件。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 Linux資訊速推 的精彩文章:

※眾目睽睽下，開源安全性更好嗎？
※德國國家計劃將Linux切換回Windows

TAG:Linux資訊速推 |