AI在撲克上戰勝了人類，所以什麼時候統治世界呢？

知識 03-18

（本文由 Nautilus 授權轉載，譯/Tzy）在今年年初的20天間，人工智慧面對了一場在現實世界處理問題的重大能力測驗。在賓夕法尼亞州匹茲堡的瑞弗斯賭場，一個名為Libratus的程序挑戰了美國國內頂尖的四位撲克選手。他們玩的撲克遊戲類型為一對一無限注德州撲克，遊戲中兩個玩家相互對決，通常在線比賽，在一系列的牌局中測試對方的策略，改善自己的戰術，並且瘋狂地唬牌。在12萬手比賽後，Libratus完勝全部四個對手，贏取了1776250美元的模擬賭金，更重要的是，贏得了吹噓自己是世界上最好的撲克玩家的資格。賽程過半的時候，和機器對戰記錄最好的人類玩家Dong Kim也已經差不多要認輸了。「今天之前我都沒有認識到它那麼強。我覺得我好像在和一個作弊的人打牌，好像它能看到我的牌一樣，」他對《連線》雜誌說，「我不是在指控它作弊。它就是那麼厲害。「

Dong Kim是挑戰Libratus的四個撲克玩家之一。圖片來源：www.pocketfives.com

Libratus在撲克上的勝利只是人工智慧戰勝它們創造者的又一個例子。當計算機掌握了諸如井字棋和西洋跳棋等相對微不足道的小遊戲時，除了計算機科學家之外沒有人給予太多的關注。但是在1997年，I.B.M的深藍在國際象棋上擊敗了國際特級大師加里·卡斯帕羅夫。國際象棋可是許多天才畢生致力的目標，因此湧起了一波關於計算機將變得多麼智能的興趣和擔憂。近期人工智慧領域的進步更快了：2011年I.B.M開發的Watson打敗了綜藝節目Jeopardy!史上最強人類冠軍，而在去年，一個名為AlphaGo的程序擊敗了世界上頂尖的圍棋手李世乭。在這個極端複雜的遊戲上，人類失去統治地位的時間點，比研究人員預測的早了10年。

AI在撲克上戰勝了人類，所以什麼時候統治世界呢？

I.B.M開發的Watson打敗了綜藝節目Jeopardy!史上最強人類冠軍。圖片來源：bigthink.com

不完全信息遊戲——與現實中的決策更加貼近

撲克看起來只是人工智慧前進的又一步（通向反烏托邦全球統治，如果你相信科幻小說的話），但是這可能會是最意味深長的一步。和別的遊戲不同的是，撲克是一個不完全信息遊戲。在國際象棋和圍棋中，你知道你和你對手的棋子都落在了哪裡，並從這個完全確定的狀態作出進一步預測；在撲克中，你不知道你的對手手中的面朝下的牌是什麼，而且你必須在這個不確定的漩渦中作出決定。研究人員表示這場勝利更困難，並且或許更重要，因為現實中有如此之多決策都是建立在不完全信息上的。醫生問診病人，儘可能收集證據，做出事關生死的決策，但這些經常都是在不知道病人體內到底都發生了些什麼的情況下完成的。外交官，商務談判者和軍事戰略家不知道他們對手的真實狀態和意圖，但必須依據複雜的行動和後果的網路制定戰略。

對於人工智慧的研究專家而言，撲克程序不僅僅是贏得紙牌遊戲的更好手段：它們是針對計算機如何基於不完全信息作出決策的實驗。數十年以來，他們一直在改進他們的程序，試圖追趕當今的頂尖標準——也就是我們人類。托馬斯·桑德霍姆（Tuomas Sandholm）是Libratus的研發者，也是卡內基梅隆大學的計算機科學家，他已經專註於撲克12年了。他的上一個作品Claudico在2015年一場類似的比賽中敗給了四個撲克專業玩家。來自阿爾伯塔大學的一個團隊最近宣稱他們研發的DeepStack是第一個在一對一無限制德州撲克上擊敗專業玩家的程序，雖然該賭場比賽的參與者表示那場比賽並沒有那麼激烈。既然計算機展示了它們的撲克牌比人類玩得更好，它們就有可能利用這項技能在現實生活中作出比我們更好的決策。

AI在撲克上戰勝了人類，所以什麼時候統治世界呢？

來自卡內基梅隆大學的托馬斯·桑德霍姆是Libratus的研發者圖片來源：post-gazette.com

強化學習讓計算機生成自己獨有的策略

開發一個足夠聰明到可以贏得比賽的程序，需要有巧妙的方法；桑德霍姆依靠一種稱為強化學習的技巧。他和他的學生教給Libratus遊戲規則，並給它簡單的小目標——也就是贏錢，之後讓它和自己開展數萬億手的對決，試著使用擊敗自己的步法。程序觀察了怎樣的玩法會成功，怎樣的玩法會失敗，並利用那些結果制定戰略。這種方法的一個明顯優點是Libratus不會局限於別的撲克玩家的策略，它有時會創造出自己的違反直覺的步法。例如，當Libratus手持弱牌，而對手提高了賭注，程序有時也會跟著提高賭注。這可能看起來很魯莽，畢竟這增大了慘敗的幾率——要是對方是因為手持好牌而提高賭注，那可就輸慘了。「如果我10歲的女兒這樣玩撲克，我會告訴她別這麼干。」桑德霍姆對華盛頓郵報說。「但是從結果來看，這其實是一招好棋。它可以幫忙辨識唬牌。「也就是說，如果提升賭注的對方是在唬牌，他們可能被Libratus對應提升賭注的舉措所嚇到，認為程序可能拿著一手好牌，並因此認輸。Libratus發現，對付唬牌，可以靠一手更大的唬牌。

許多近期在人工智慧領域的著名進展——例如無人駕駛車，人臉識別，和自然語言處理——依賴於一種不同的方法：「機器學習」。機器學習中，計算機讀取巨量的數據集並根據它們觀測到的模式作出結論。對比而言，強化學習在讓計算機生成自己的有創造性的策略方面可能更勝一籌。如果這是真的，那麼Libratus和AlphaGo都採用強化學習來培養它們遠超人類的技能就不是一個巧合了。

AI在撲克上戰勝了人類，所以什麼時候統治世界呢？

戰勝李世乭的AlphaGo也採用了強化學習方法。圖片來源：tastehit.com

Libratus給了我們十分誘人的想法：計算機在處理複雜和重要的問題上可能終將遠遠強於人類。但由於技術進步飛速，我們很難確定這樣的技術在未來什麼時候，或是否會被成功應用。從短期來看，這個程序甚至在它自己的領域裡也算不上多大的威脅。Libratus在一對一的撲克遊戲中的確優勢盡顯；但當它轉到更多玩家的比賽時，要進行的運算將更加複雜，這將超出Libratus的能力範圍。即便是一對一的線上遊戲，Libratus對於運算的要求也非常之高（它在超級計算機上運行，使用的處理能力和內存分別是一台高端筆記本電腦的7000倍和17000倍），把它用在研究之外的領域並不現實。目前而言，這個程序正在通過另一種方式改變撲克遊戲世界——訓練人類玩家。「我們真的在學習這台電腦的想法，」被機器打敗的撲克玩家之一Jason Les說。「我認為我會通過這件事成為一個更優秀的撲克玩家。」（編輯：Ent）

AI在撲克上戰勝了人類，所以什麼時候統治世界呢？

本文由Nautilus授權果殼網（guokr.com）編譯發表，嚴禁轉載。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 果殼網 的精彩文章:

※你是什麼血型？有了這張試紙，30秒就可以知道答案
※動圖：看塑料滴管如何變身小火箭！
※你知道嗎？以前的汽車裝的都是自行車輪
※彷彿漂浮在魔法世界的飛艇，它們都是紙做的！
※噴了！當孔雀跳蛛拿起光劍

TAG:果殼網 |

您可能感興趣

※薛之謙的挑戰：什麼時候我們不再與這個世界為敵？
※那些世界上最成功的人，25歲的時候在做什麼？
※人類歷史上最接近滅絕的四次危機，下一次什麼時候？
※人們在上廁所的時候，都在幹什麼？
※庫頁島是什麼時候丟的？鴉片戰爭之前，就已不歸中國管
※家裡沒人的時候，喵星人會對主人水杯做些什麼？
※EXM？是時候挑戰一下臉盲症了！
※你一個人在家的時候做過什麼蠢事？
※什麼？男人在這種時候只用一個手不行？
※什麼時候，是女人最容易「攻破」的時刻？
※史上中日9次大戰是什麼時候？最後一次鮮為人知！
※當喵星人站起來的時候，它的內心OS到底在想些什麼？
※你上一次看書，是在什麼時候？
※目前世界上最富的國家，在貧窮的時候是什麼樣？對比太震撼了！
※人類什麼時候能重返月球旅行？回看人類歷史上6次登月的震撼景象
※圍棋AI連勝人類50場，是時候認真思考如何應對人工智慧了
※當你還在遛狗的時候，看看人家戰鬥種族已經……
※世界末日究竟什麼時候會到來人類會走上那一天嗎
※你在什麼時候，愛上了一座城？