多Agent 學習 AI 炸彈人遊戲挑戰賽——Playground
知識
02-19
Playground 的 Pommerman 是專門為 AI 研究用的炸彈人遊戲比賽,已經有來自世界各地的開發者提交了經過訓練的 Agent。它由一群機器學習研究者舉辦,主辦方會在他們的伺服器上定期舉辦比賽來展示訓練的結果。
該領域的大多數開源研究工具都是為單一的 Agent 而設計,而該項目的主辦方專註於開發標準化的面向多 Agent 學習工具。同時,主辦方還在 train_with_tensorforce.py 里提供了多訓練腳本示例,這些示例能幫助開發者包裝 Pommerman 環境,使開發者能夠使用 TensorForce 這樣的流行的庫來訓練。
開發者提交的 Agent 可以有三種比賽方式:
FAA:四人競爭,一人獲勝,用於測試計劃和策略能力
團隊:2 V 2,兩隊 Agent 競爭,一隊獲勝,用於測試 Agent 間的合作能力
團隊無線電:和團隊模式一樣,不過每個 Agent 都有一個無線電,可以每步從大小為 8 的字典里發送兩個字。
詳細信息請參閱網站:
https://www.pommerman.com/
Github 地址:
https://github.com/MultiAgentLearning/playground
春節 AI 學習狂歡,精品課程 豪華特輯
優惠折上折,福利搶不停!
※如何上手使用 Facebook 的開源平台 Detectron?
※谷歌 2018 技術實習生正式開放申請!還有這些 AI 職位虛左以待!
TAG:AI研習社 |