當前位置:
首頁 > 新聞 > 「冷撲大師」強勢戰贏人類牌手,博弈論落地商業應用有幾分可能

「冷撲大師」強勢戰贏人類牌手,博弈論落地商業應用有幾分可能

機器之心原創

作者:小琳哥哥



昨日,備受矚目的「冷撲大師V.S.中國龍之隊—人機撲克巔峰表演賽」,經過五天激烈博弈的賽事完成最後一局,最終冷撲大師以792,327總記分牌的戰績獲勝,此次人機撲克巔峰表演賽的200萬獎勵榮歸冷撲大師。

「冷撲大師」強勢戰贏人類牌手,博弈論落地商業應用有幾分可能



不完美信息AI技術獲得驗證

眾所周知,此次冷撲大師背後的AI技術不是 AlphaGo 中的深度學習,而是博弈論,更準確說是納什平衡的理論。

納什均衡,又稱為非合作博弈均衡,是博弈論的一個重要術語。是一種策略組合,使得同一時間內每個參與人的策略是對其他參與人策略的最優反應。

「冷撲大師之父」 Tuomas Sandholm 教授比賽結束接受機器之心等媒體採訪時提到,「納什平衡告訴我,這裡有一個戰略是不可以被打敗的,它是完美戰略。對手用什麼樣的戰略都是不可勝的,我們就開始計算這個戰略,問題是很多的遊戲空間太大了,比如德州撲克一對一,它的原子比宇宙還要多,我們肯定需要找一些辦法去模擬接近於它,這也是AI進來的地方,AI給我們一個戰略模擬這個平衡。其中一個好處就是,這個演算法不僅限於德州,它可以運用在任何信息不平衡的遊戲之間,德撲剛好是一個非常好的標杆。」

「冷撲大師」強勢戰贏人類牌手,博弈論落地商業應用有幾分可能

AI 處理人機對弈的信息模式可大致分為完美信息、不完美信息兩類。人機棋牌對弈中的圍棋和撲克正是這兩類的代表,就在冷撲大師剛剛戰贏人類的時候,升級版 AlphaGo 來華向柯潔發出挑戰,但結果一定是毫無懸念。

此次人機大戰的發起人李開復說到,「當信息不完美的時候,有對方看不到的底牌甚至有詐胡機會的時候,感到這是人做的事情,那機器能做嗎?機器不僅能做,還在比賽中還贏了人類。」

李開復表示,德扑打敗人類是AI發展中的一個里程碑,是不完美信息AI技術獲得驗證,也讓人類看到在遊戲領域,人機對戰是沒有任何懸念的了。


「以我之不敗戰人類之可勝」

人族代表中國龍之隊隊長杜悅,在比賽結束後以實戰經驗分析冷撲大師策略的特點。

基於納什均衡最優級的,機器人總是玩的是納什均衡的一方策略,這個策略就是不敗,對它長遠來講只可能是打平不可能打輸,這是理論上最精確的解讀。

「冷撲大師」強勢戰贏人類牌手,博弈論落地商業應用有幾分可能

而對人類選手很難保證一直打最優級,任何其他的策略對冷撲大師的策略而言,就是做次優,它的期望值就是負,表現在打法上的話,冷撲大師的特點就是在它該贏的地方一定想辦法多贏點,在它該輸的地方會盡量。人類選手贏的時候是小贏,輸的時候是多輸。

杜悅強調,冷撲大師的策略就是,「以我之不敗戰人類之可勝。」

杜悅作為資深德撲玩家,試圖糾正人們的常規想法。他說,以前主流社會對德州撲克的理解,就覺得好像是一個賭博遊戲,賭性非常強。他認為,通過這次人機比賽,當一個高手技術水平非常高的時候,採取機制把運氣成分儘可能的去掉,長此以往德州撲克的高手對於德州撲克的菜鳥而言還是有很大的優勢,德撲在本質上還是技術含量非常高的競技運動。

而此次龍之隊雖然惜敗,但卻是打出了非常高的水平。



冷撲大師獲勝,商業價值幾何

冷撲大師目前的對戰形式一對一,而現實生活中德撲是多人遊戲,多人遊戲在計算上的複雜程度是目前冷撲大師所無法勝任的。這也讓很多人思考,機器戰勝了人類,但是在現實生活中能夠有哪些落地應用?

冷撲大師背後的人工智慧技術如何發揮其商業價值,李開復認為有三大條件要滿足:海量的數據、數據有標註、單一領域。例如在金融領域,金融是虛擬的、由人創造的,數據量龐大且天生帶有標註,譬如股票的漲停、小額貸款是否還錢、買了保險後是否出事都是一種標註,這使得AI在放貸、銀行、投資、保險方面具有潛力。

李開復曾說,「如果 AlphaGo 是考驗機器的智商,那冷撲大師則考驗的是機器的情商。」這次人機比賽,讓大家看到機器已經開始具備EQ、詐騙、詐胡,這些過去 AI 不見得具備的能力,顯然是一個好的開始。

李開復舉例子,你買房子,賣家賣 700 萬,人家出800萬,該從600萬排還是一分都不加了,還是說贈一個精裝修,談判的過程與冷撲大師是一樣的,其他的商業洽談,甚至推出外交的各種博弈也都類似,他判斷未來的可擴張性很樂觀。

不可否認,在實際應用層面,人工智慧仍有很長的路要走。中國的人工智慧技術也要不斷地前進發展。對教育有著很強使命感的李開復,希望能夠通過創新工場的橋樑,能夠把外國最前沿的人才和技術帶回中國來,儘快讓AI達到一個井噴的狀態。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

基於TensorFlow的簡單故事生成案例:帶你了解LSTM
業界:開源硬體挑戰 GPU 計算極限

TAG:機器之心 |

您可能感興趣

智能手機廠商繼續博弈,單手操作或受用戶追捧
順豐與菜鳥掐架,背後是大佬博弈,也事關你我利益
為何任天堂終能強勢回歸?論遊戲性與硬體的博弈
中美戰略博弈出現新動向,兩種情況可能引發意外
戰略博弈不能意氣用事,任何國家別指望中國會拿核心利益做交易!
吳亦凡參加節目就是個錯,背後充斥商業博弈,導師和選手背鍋不少
腫瘤治療是與高智商對手的博弈,如何才能制服它?
倫敦雙雄大戰 一場輸不起的博弈 拼准成拼速度誰將更勝一籌?
這國妄圖利用大國博弈獲取好處,最終卻挖坑把自己給活埋了
誰是一開始就贏的人?互聯網巨頭牽手四大行的博弈
ISIS尚在各方卻忙搶地盤 敘戰機遭擊落背後的利益博弈
高通與三星博弈,究竟哪家能搶先搞定屏下指紋技術?
敘利亞局勢亂象生!戰爭還未結束 搶地盤博弈已經開始
真人實事:變態殺人狂與食人魔博弈,最後……
重磅利好:A股潛力龍頭股脫穎而出,多家機構暗中博弈,第一妖王板上釘釘!
大國博弈,武器的競爭就佔到了很大一部分。
解放軍少將:大國博弈如果一味退縮,帶來的絕不是和平而是災難!
有「死亡販子」之稱,他落網後兩個大國相互博弈,都要搶著引渡他
金一南少將:大國博弈手中須有棋子,光搞好關係對方不會放我一馬