多Agent 學習 AI 炸彈人遊戲挑戰賽——Playground

知識 02-19

Playground 的 Pommerman 是專門為 AI 研究用的炸彈人遊戲比賽，已經有來自世界各地的開發者提交了經過訓練的 Agent。它由一群機器學習研究者舉辦，主辦方會在他們的伺服器上定期舉辦比賽來展示訓練的結果。

該領域的大多數開源研究工具都是為單一的 Agent 而設計，而該項目的主辦方專註於開發標準化的面向多 Agent 學習工具。同時，主辦方還在 train_with_tensorforce.py 里提供了多訓練腳本示例，這些示例能幫助開發者包裝 Pommerman 環境，使開發者能夠使用 TensorForce 這樣的流行的庫來訓練。

開發者提交的 Agent 可以有三種比賽方式：

FAA：四人競爭，一人獲勝，用於測試計劃和策略能力

團隊：2 V 2，兩隊 Agent 競爭，一隊獲勝，用於測試 Agent 間的合作能力

團隊無線電：和團隊模式一樣，不過每個 Agent 都有一個無線電，可以每步從大小為 8 的字典里發送兩個字。

詳細信息請參閱網站：

https://www.pommerman.com/

Github 地址：

https://github.com/MultiAgentLearning/playground