人類全面潰敗!AI訓練4.5萬年,DOTA 2人機大戰大結局
OpenAI Five在Dota 2中以2:0擊敗了世界冠軍團隊,人機大戰人類最終不敵AI。OpenAI Five在去年輸掉比賽後進行了優化,訓練時間相當於人類玩了4.5萬年。
OpenAI可以宣布自己是世界第一了。
今天凌晨,OpenAI Five在Dota 2中以2:0擊敗了世界冠軍團隊OG,再次顯示出了AI的強大威力,也正式宣告人類在Dota這種高難度遊戲中成為AI的手下敗將。
這次比賽,OpenAI Five的表現出是迄今為止展示出的最高水平:人類對手去年贏得了世界上最令人垂涎的電子競技賽事TI8的冠軍;OpenAI Five在去年輸掉比賽後進行了優化,訓練時間相當於人類玩了4.5萬年,贏得比賽也並不出乎意料。
人類對手OG團隊
2:0,AI戰勝人類
在這場人機大戰中,每隊只有17個英雄可供選擇。OpenAI還選擇了所謂的「Captain"s Draft」遊戲模式。與之前的比賽一樣,OpenAI也禁用了召喚和幻覺功能,這兩項功能都涉及以英雄副本的形式引入其他變數,以及OpenAI訓練系統時未考慮的一些特殊因素和單位。
除此之外,這場比賽與正常的Dota 2比賽一樣,其最終目標是摧毀敵方隊伍的「基地」,即每個團隊領土末端的大型塔樓,在敵人的隊伍成功摧毀其他小型塔後,基地是很脆弱的,整個比賽過程的中心是對塔的攻防,以及英雄與英雄之間的團戰。
在第一場比賽中,OpenAI Five讓對手OG大吃一驚,通過一系列激進戰術獲得了勝利,其中包括對遊戲中獲取的金幣的花費方式,在本方英雄死亡時立即買活,即使在比賽初期也是如此。
對此,OpenAI首席技術官Greg Brockman指出,OpenAI喜歡有利於短期收益的戰略,說明在長期規划上不如人類,而且DOTA2這種遊戲通常要依賴於長期規劃才能獲勝。然而,在這場比賽中,這種早期的買活策略得到了回報,OpenAI Five獲得了優勢,當比賽拖入30分鐘時,OG頂不住了。
在第二場比賽中,OpenAI表現更好,在最初的幾分鐘內即獲得了對OG的早期優勢,然後無情碾壓了人類玩家,在第一場比賽時間剛剛過半的時間點上即取得勝利。
值得注意的是,OpenAI Five在第二場比賽中開始玩得異常激進,以及OG在AI全圖範圍內的推進時有些無力對抗。OpenAI Five能夠利用其特定的英雄選擇帶來的優勢。
飛速進化的OpenAI Five:已經訓練4.5萬年
去年8月,OpenAI Five曾以3:2擊敗半職業人類玩家,不過當面對職業對手時,OpenAI便輸給了paiN Gaming戰隊,帥不過三秒。
根據OpenAI聯合創始人兼主席Greg Brockman(也是該組織的CTO)的說法,在輸掉比賽之後,OpenAI Five是通過在加速的虛擬環境中進行自我改進而變得更加強大的。
OpenAI Five由深度強化學習提供支持,也就是說它的編碼目的不是「如何遊戲」,而是「如何學習」。Brockman在比賽開始前表示。,AI在10個月中,已經玩了45000年的Dota 2遊戲,而且,玩了這麼長時間也沒有覺得無聊。
這場比賽採用三局兩勝制,所有bot都使用相同的深度強化學習技術進行訓練,並由同一OpenAI系統的不同層獨立控制。
OpenAI向公眾開放與AI對決,終極目標是實現通用人工智慧
對於OpenAI來說,值得慶祝的不僅僅是這次勝利,還因為其證明了對強化學習的態度及其關於AI的普適哲學樹立的里程碑。
研究團隊將不再公開展示其AI 遊戲bot,而是致力於開發軟體,讓人類與OpenAI Five軟體實時協作,與機器人一起玩遊戲,並學習他們獨特的前所未有的戰略和行為。
OpenAI Five還發布了一個平台,供公眾與OpenAI Five對戰,這種模式稱為「競技場」模式,將於4月18日起開放三天。OpenAI表示,協作軟體可能永遠不會向公眾開放,不過大家可以在活動中親自嘗試一下。
OpenAI的聯合創始人兼首席執行官Sam Altman還表示,此類工作證明了與AI智能體的合作可能會在未來帶來巨大的利益。
Altman說:「對於世界如何運作,如何訓練這些智能體,令其實現協作上,這次活動是重要的一課。實現人類與AI的合作,是我們對未來世界更積極的願景之一,人工智慧與人類共同努力,使人類變得更好、更有趣、更有影響力。」
OpenAI可能會繼續涉足Dota 2和其他視頻遊戲,主要是因為這些遊戲是人工智慧的良好測試平台,也是衡量AI技術進步的良好基準測試工具。
現在可能還沒有一個遊戲像OpenAI Five這樣,AI系統最終無法具備超出人類能力的水平。對於更廣泛的AI行業而言,精通視頻遊戲可能很快就會變得過時,我們需要簡單的方式來證明AI系統可以快速學習,並能夠更快速高效地的解決現實世界的困難任務,獲得更有意義的好處。
最終,OpenAI希望將其Dota 2學習並擴展到遊戲之外的新領域,並最終擴展到現實世界中。為此,OpenAI正致力於使用強化學習和其他技術,為機器人手提供更靈巧、更精細、更人性化的動作。
「OpenAI正在努力的方向建立通用人工智慧(AGI),並與世界分享這些好處,同時確保其安全性。」Altman說的是建立一個能夠執行任何人類任務的多功能AI系統。「我們的目標不是戰勝電子遊戲,雖然這很有趣。我們的目標是揭開實現AGI道路上的秘密。」
參考鏈接:https://www.theverge.com/2019/4/13/18309459/openai-five-dota-2-finals-ai-bot-competition-og-e-sports-the-international-champion
轉載請在公眾號中,回復「轉載」
版權歸原作者所有,轉載僅供學習使用,不用於任何商業用途
如有侵權請留言聯繫刪除,感謝合作。
選購數學科普正版讀物
嚴選「數學思維好物」
送給孩子的閱讀禮物|辦公室神器
有益孩子一生的玩具|居家高科技
走進數學:人物、趣談、科技、發展史
※富豪卧底清潔員:再也說不出「有鬥志就能改變命運」
※Nature重磅:復活死亡大腦
TAG:超級數學建模 |