當前位置:
首頁 > 新聞 > 硬核!繼DeepMind之後,首個中國AI挑戰《星際爭霸II》

硬核!繼DeepMind之後,首個中國AI挑戰《星際爭霸II》

新智元推薦

來源:啟元世界

整理編輯:張佳

【新智元導讀】《星際爭霸II》作為遊戲玩家心目中即時戰略遊戲的經典之作,它的「即時」和「戰略」特性,使其成為深度強化學習和博弈決策智能演算法研究的重要平台。通過遊戲研究AGI技術,英國有DeepMind,美國有OpenAI,那麼中國呢?

「二十年後,伴你遨遊太空、探索星際的是人?還是AI?

或許是這位星際指揮官。

《星際爭霸II》作為遊戲玩家心目中即時戰略遊戲的經典之作,它的「即時」和「戰略」特性,使其成為深度強化學習和博弈決策智能演算法研究的重要平台。

包括DeepMind在內的世界頂尖AI團隊也在攻堅《星際爭霸II》。其背後擁有一個共同的終極目標——進一步拓展AI邊界,並為最終達到通用人工智慧(AGI)探索道路。

AI打星際有多「硬核」?

星際是有史以來電子競技領域最經典的遊戲之一,也被認為是最有挑戰的即時戰略(RTS)遊戲。今天,之所以成為AI研究的主要平台和工具,是因為其蘊含了下述多方面的挑戰,一旦取得技術突破,將擁有廣泛的應用場景。

那麼,用AI打星際有多「硬核」?難點和挑戰在哪?

挑戰一:層次化的體系博弈

星際實質上蘊含了一套層次化的博弈體系,它包括宏觀經濟實力的比拼、科技與兵種的相互克制、戰役戰術上的指揮對戰、各編隊單位的微觀操控等。如何能讓AI學會並進行上述多層次的決策,而不是在某一層級上進行學習,是個非常大的挑戰。

挑戰二:決策空間複雜度巨大

圍棋的決策動作空間不超過361,而星際的決策動作空間是10的26次方,由決策時機、決策指令、決策主體、決策目標等多維度的決策因素組合而成。

挑戰三:非完全信息動態博弈

對比圍棋或者象棋等完全信息下的博弈,星際擁有「戰爭迷霧」機制,你無法在任意時刻得知對手完整的信息,必須通過主動偵察和對手建模來推測對手策略。相對於德撲的非完全信息博弈,星際又體現了動態性,上一時刻偵察所獲取的信息,下一時刻又可能變化了。

挑戰四:大規模多單位協作

星際的戰鬥部分需要指揮多兵種上百個單位進行協作配合。相對來講,《DOTA2》、《王者榮耀》遊戲AI只需要5個單位進行協作配合。

挑戰五:毫秒級實時決策

星際作為即時戰略遊戲,要和職業選手(平均每分鐘300次操作)進行對抗,要求AI能夠在一秒鐘之內做出多次快速決策,這對AI演算法模型的性能、工程實現的效率帶來非常大的挑戰。

中國的「星際之王」是誰?

通過遊戲研究AGI技術,英國有DeepMind,美國有OpenAI,中國呢?

啟元世界希望是一個答案。

啟元世界自2017年成立,便開始基於《星際爭霸II》研究決策智能、開發智能體,探索AGI之路。

繼2018年5月在北大ACM總決賽期間發布基於星際的人機協作對抗賽、11月在加拿大AIIDE策略博弈研討會展示自學習戰術指揮官、12月獲得NeurIPS多智能體競賽Learning組冠軍之後,2019年以來啟元星際指揮官又實現了重要突破。

目前啟元「星際指揮官」(簡稱「星指」),已能夠在全場遊戲(full game)中與業餘高手過招較量,從宏觀到微觀博弈上展現出若干智能行為:如因地制宜地發展經濟與科技、有條不紊地安排建造與布局、審時度勢地進行偵察和攻擊、指揮上百個單位進行協同作戰等。

啟元與星際指揮官成長曆程

簡要回顧星際指揮官成長曆程後,再和大家分享「星際指揮官」的幾個精彩片段:

"星指"鏡頭一:建築布局大師

「星際指揮官」(綠方)正在採集資源進行建造,在合適的時機合適的位置建造房屋、造兵廠、飛機廠等,並在合適的時機開出第二基地進行擴張。

"星指"鏡頭二:迅捷突擊手

「星際指揮官」(綠方)抓住時機派出死神進行騷擾(Reaper Rush),打對手一個措手不及,多個死神利用高台地形騰挪跳躍,攻擊陣型靈活多變。

"星指"鏡頭三:隔山打牛陣

「星際指揮官」(綠方)展示「隔山打牛」戰術,先將山上的巨石擊落堵路,在山後方架上坦克陣,同時派出解放者誘敵深入,雷神進入坦克射程後被殲滅。

這位「星際指揮官」是不是很厲害?

「星指」要挑戰職業玩家,你敢不敢來?

實現高水平的《星際爭霸II》對弈,代表了AI在複雜電子遊戲中取得的重大突破。但對於啟元世界來說,星際AI的作用遠不止於打打遊戲如此簡單,最終的目標是將其中研發的技術應用到現實世界,從博弈決策到網路調度,從數字娛樂到機器人控制,都不乏應用場景。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

2019計算機體系結構最高獎Eckert-Mauchly獎公布,Mark D.Hill獲獎
暴力解剖GAN!MIT、港中文團隊GANpaint,一筆成畫不是夢

TAG:新智元 |