Google發布最新開源強化學習框架
知識
09-20
據 VentureBeat 報道,強化學習是一種人工智慧(AI)技術,它利用獎賞(或懲罰)來驅動代理朝著特定的目標前進。DeepMind 就是利用這種學習方式 AlphaGo。但是強化學習框架存在一些問題,比如需要花很多時間來掌握一個目標,而且總是不靈活,也不穩定。
針對真箇問題,Google 提出一個替代方案:基於其機器學習庫 TensorFlow 的開源強化學習框架。該強化學習框架基於靈活性、穩定性和重現性三個基本原則開發,目前已發布在 GitHub 上。
除了該開源框架外,Google 還推出了一個網站,允許開發人員能快速將針對多個代理的培訓運行進行可視化。它還提供經過訓練的模型、原始統計日誌和 TensorFlow 事件文件,用於與 TensorBoard 一起繪圖,TensorBoard 是 Google 開發的用於 TensorFlow 程序的可視化工具套件。
※眾目睽睽下,開源安全性更好嗎?
※德國國家計劃將Linux切換回Windows
TAG:Linux資訊速推 |