當前位置:
首頁 > 新聞 > OpenAI 宣布將對戰 DOTA2 世界冠軍 OG,最終決戰!

OpenAI 宣布將對戰 DOTA2 世界冠軍 OG,最終決戰!

雷鋒網 AI 科技評論按,OPenAI 26 日宣布,在美國時間 4 月 13 日上午 11:30(北京時間 3 月 14 日凌晨 2:30),OPenAI 將挑戰第八屆 DoTa2 國際邀請賽世界冠軍 OG 團隊,比賽將在 Twitch 上進行直播!

OPenAI 官方稱此次比賽為「OpenAI Five Finals」,意為最終之戰!

OG 是由前「monkey」成員組成的新團隊。通過贏得 2017 年的 Kiev Major 比賽,OG 成為 Dota 2中第一支贏得四場 Dota 少年錦標賽的團隊。在去年 8 月的第八屆 DoTa2 國際邀請賽上,OG 團隊獲得冠軍,實力強勁。

OpenAI 宣布將對戰 DOTA2 世界冠軍 OG,最終決戰!

OG 團隊的五名成員

OG 團隊將代表人類能力極限和 OpenAI Five進行最終決戰。同時,和 OPenAI 對戰的人類選手還有 Blitz、Capitalist、ODPixel、Purge 以及 Sheever ,遊戲規則與 2018 年 DoTa2 國際公開賽的五場比賽相似。

OPenAI 認為此次比賽可以說明人類和人工智慧在未來將如何進行互動。OpenAI Five 戰隊將全方位演示人工智慧的能力、可擴展性以及它如何提高人類的能力,而 OPenAI 相信人工智慧對世界的影響正是由這些方面驅動的。OPenAI 表示,他們希望這次直播能幫助人們更好地理解人工智慧的進步以及它將如何影響世界。

OpenAI 宣布將對戰 DOTA2 世界冠軍 OG,最終決戰!

OpenAI Five 比賽的示例

在 OPenAI 看來,dota 2 是開發通用人工智慧技術的一個好的試驗項目,此外,它也是幫助人們體驗人工智慧的一條很好的途徑。OPenAI 希望從自動駕駛汽車等系統開始,人工智慧將成為人們未來生活中的一個重要組成部分。

如何觀看比賽?

本次決賽將於 4 月 13 日在灣區舉行,暫定比賽時間為上午 11:30 至下午 4 點(具體結束時間取決於比賽時間)。

OpenAI 宣布將對戰 DOTA2 世界冠軍 OG,最終決戰!

想親自到現場觀看比賽的童鞋們,請於 3 月 29 日星期五下午 9:00 前提出申請,邀請函將於 3 月 31 日星期日結束前發出。由於場地座位有限,OPenAI 將根據申請者回答相關問題的情況確定可以入場觀看的人員名單。

如果你不能親自到現場觀看比賽,也可以在 Twitch 上觀看直播!

OpenAI 的 DoTa 之路

2017 年,OpenAI 的人工智慧進軍 DoTa2,影魔 solo 輕鬆擊敗頂級選手 Dendi 和 Sumail。隨後,OpenAI 宣布要在 5v5 的 DoTa 比賽中擊敗人類。

OpenAI 對於 DoTa AI 的最終目標是開發出能夠打敗人類職業選手的 AI。然而,5v5 AI(OpenAI Five)相比之前來說是一個新的台階,它保留了諸多限制,遊戲環境和玩家們所熟悉的樣子有諸多不同。OpenAI Five 在這個環境里做了多次迭代更新。

去年 4 月 23 日,OPenAI 首次打敗了自己編寫的基於腳本的基準模型,5 月 15 日的版本與 OpenAI 員工隊伍(天梯分段 2500,高於 46% 的玩家)打了一勝一負;而 6 月 6 日的版本則在與業餘戰隊(天梯分段 4200,高於 93% 的玩家)和半職業戰隊(天梯分段 5500,高於 99% 的玩家)的比賽中都贏得了三局中的前兩局。

但由於當時 OpenAI Five 在遊戲中設定了諸多限制,極大地降低了遊戲的複雜度,比如隱身、肉山之類的禁用也縮小了戰略戰術的選擇空間,至於 5 個無敵的信使就更像是對 5 個 AI 之間(也許並不理想的)協作能力的妥協。

不過,能打敗業餘和半職業戰隊的表現,在三局中贏得前兩局也說明了 AI 的策略選擇與執行的效果。即便遊戲中有一些限制,但 OPenAI Five 還是有足夠的複雜度。

OpenAI 使用了256 個 V100 GPU 和 128000 個 CPU 訓練模型,不使用人類數據,80% 的時間自我對弈,20% 的時間和過去的版本對弈。訓練中每天進行的遊戲數量時長相當於大約 180 年。

另一方面,OpenAI Five 中使用的模型架構也出人意料地簡單。每一個英雄由一個單獨的 LSTM 模型控制,而它只是一個單層的、含有 1024 個單元的 LSTM 網路。網路從 Value (DoTa2 製作公司)提供的 BOT API 獲取數據,然後通過多個不同的動作輸出介面進行控制。

OpenAI 宣布將對戰 DOTA2 世界冠軍 OG,最終決戰!

OpenAI Five 的網路架構圖

在反饋的設計上,OPenAI 除了輸贏之外也選用了人類選手常用的指標:總財產、擊殺數、死亡數、助攻數、補刀數等等。但是為了避免 AI 過於關注這些偏向於短期策略的數據,他們的反饋設計只鼓勵 AI 在這些方面做到人類玩家的平均水平。

經過大半年的研究,今年,5v5 AI 能否戰勝人類冠軍?期待這次精彩的比賽!

via:https://openai.com/blog/openai-five-finals/

雷鋒網雷鋒網

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

勒索、挖礦同時下手,這個Satan變種病毒有點「牛」
機器學習研究結果準確性普遍堪虞,可能正在導致一場「科學危機」

TAG:雷鋒網 |