AI 玩DOTA2想虐人類!它一天等於180年
當你玩遊戲遇到不可抗衡的對手時,它很有可能不是大神,而是人工智慧。
AI玩棋牌遊戲虐人類,已經不是新鮮事了。目前,世界頂尖學院與科技巨頭,想研究出更厲害的人工智慧,在其他電子遊戲中虐我們。這不,素有「矽谷鋼鐵俠」之稱的Elon Musk和Sam Altman,研究出了OpenAI。近日,他們宣布了這個研究的最新里程碑:一支人工智慧隊伍,在大型電子競技遊戲Dota2中,目前能打敗世界上1%的業餘玩家。
OpenAI 實驗室的 5 個機器人打敗了人類團隊
要知道,OpenAI在去年8月在Dota2登場,卻已經能單挑打敗人類頂尖選手Dendi。然而,單挑對於人工智慧而言其實難度不大,OpenAI目前已經更新了內核,可以與人類進行5黑匹配的對戰,團隊對戰要求高度配合以及運用戰術。雖然目前還不能挑戰最頂尖的玩家,但他們已經把視線,投向接下來的Dota2年度錦標賽。
▌研究動力
研究的初衷很簡單:如果我們能讓AI掌握玩大型電子遊戲的技巧,我們就能用它們解決現實中更複雜的挑戰。在現實中某些方面,是與大型遊戲有點類似的,比如城市的交通運輸系統。
大型電子遊戲中遇到的某些問題,是棋牌遊戲根本無法比擬的。AI們無法體會遊戲中,玩家們的隱藏信息,以及無法計算最佳的下一步。大型競技遊戲中有更多需要處理的信息,以及數以億計的操作可能性。OpenAI反饋得知,遊戲過程中的每1秒,需要在1000個不同行為中選擇一個,以及處理20,000個數據節點,而這一切僅僅由它的2個機器人完成。
▌OpenAI戰勝人類的秘密
為了創造他們的機器人,科研組換了一種方法強化它們的學習能力。這種方法看著很簡單,但實際上能引發它們更複雜的行為。操作人員將機器人投進去一個虛擬環境,在裡面通過試驗與修正錯誤,最終讓它們達到目標。程序員會設置獎勵機制(比如殺一個敵人能有一分),然後讓AI機器人自己一遍又一遍地玩遊戲。
這批新的Dota機器人,出來的結果是驚人的,在加速模式下,它們每天相當於人類玩了180年的遊戲時間。它們在這種速度之下,玩了整整一個月。「剛開始的時候它們就只是亂走,幾個小時之後,它們開始掌握基本操作」Brockman這麼說道。他還說,假如一個人類需要用12,000至20,000個小時達到專業水準,那OpenAI就相當於每天要經歷100倍人類的遊戲生涯時間。
雖然,這證明了當代機器可以自我學習,以及最新電腦晶元能處理海量數據。但從側面來看這些機器人本質上也是笨笨噠,因為沒有人會花幾千年的時間,學習怎麼玩一款遊戲。
(譯者話:幾千年時間不也是你們自己設置的么= =,況且在現實中還是只過了一個月)
▌不足與挑戰
雖然OpenAI機器人現在可以玩5v5匹配,但他們還是沒能完全觸碰到Dota2的複雜性。而且還有很多限制,例如115個英雄它們只會用5個(死靈法師、狙擊手、冥界亞龍、水晶室女和巫妖),每個的玩法都不一樣。當然它們的一些遊戲操作的代碼,也是寫死的,也就是hard-code。比如在商店買什麼物品,升級的時候點哪個技能。遊戲裡面更微妙的部分它們是完全不會的,包括隱身、傳送、或者布置守衛(如毒蛇守衛)、插眼或者其他更高級的玩法。(一位高玩曾經說過「新手通常都不知道插眼的重要性」)
然而OpenAI機器人也有著所有你能想到的計算機優點:他們反應速度一定比人類快,他們不會手滑,還有它們能夠迅速且精確地訪問一些數據。比如商品、生命值、地圖上每一個目標的信息,以至於正確使用一些重要的符咒。這些所有的信息都要人類反覆確認,以及憑感覺經驗判斷。
這些種種跡象似乎會讓人懷疑這只是一個普通的機器人,但Brockman反駁這是不存在的。他說Dota2裡面平均每局45分鐘的時間,才是機器人的最大挑戰。這種需要一定程度的長遠計劃,是很難甚至無法通過優化學習功能解決的。但OpenAI則不一樣,它會成功的主要原因很簡單,就是它集合了更大規模的計算機運算能力解決問題。
通過電子遊戲學習團隊合作,是一位名叫Andreas Theodorou的英國巴斯大學AI研究人員提出的,他在最近的5v5遊戲中有了很多重要的發現,最具有象徵意義的是OpenAI可以通過計算機視覺對自己進行調試。Theodorou在自己的博客中提到「這種技術預示著無論是自我提升學習能力,還是計算機學習系統,在最後將會變得更直觀,使得這種系統的價值大大提高,特別是在教育領域」
Theodorou說道:「採用獎勵機制,鼓勵機器人們一起工作也是值得注意的,這種獎勵機制代表著一種團隊精神,而且會貫穿於每一局比賽。它們開始在每一局遊戲中追求個人得分,比如人頭數,但隨著時間的推移,它們會慢慢把焦點放到集體利益上。」
Brockman說:「與人類玩家有區別的是,這代表著絕對的零英雄主義,機器人完全願意讓人頭。有趣的是,我們曾經讓一個人類玩家加入機器人團隊,我們也沒有特意設置它們什麼。但這位人類玩家覺得它們是很好的隊友,他想要什麼它們都會讓出來。」
OpenAI的機器人隊伍目前與業餘和半職業選手對抗戰績是,5局能贏4局。但它們最大的挑戰會在今年的國際比賽,這些機器人是否能以無縫的配合挑戰職業選手的直覺呢?從這點上來看,這是全人類的比賽。
原文:https://www.theverge.com/2018/6/25/17492918/openai-dota-2-bot-ai-five-5v5-matches
作者:James Vincent
譯者:Roy
TAG:北大青鳥廣州網耀 |