AlphaGo的謎之第37手：人類曾經最艱難的一戰

天下 01-04

李世石

我本可以拿出更好的成績，帶來更好的結局。

2016年12月，美國著名的科普網站，科學新聞（ScienceNew.org）在評選十大新聞中，名列第一的是「AlphaGo戰勝李世石」。

「AlphaGo在克服複雜問題上爬過了一座陡峭的山峰，在最複雜的智力遊戲中戰勝了人類」，在回顧中，科學新聞評價道，「現實世界的複雜程度遠超這些遊戲，但AlphaGo的進步讓大家看到了電腦解決複雜問題的曙光。」

是的，由於AlphaGo的出現，人類作為一個整體應該意識到，世界不一樣了，另一種文明，已經嶄露頭角。

「我代表人類」

AlphaGo的謎之第37手：人類曾經最艱難的一戰

李世石

時間倒回到2016年3月10日，首爾光化門的四季酒店，這裡正在進行圍棋「人機大戰」第二局。在9日進行的第一局比賽中，谷歌的程序AlphaGo擊敗了李世石，取得了歷史性的突破。在第二局的比賽中，AlphaGo下出的第37手，一個簡單的肩沖，又讓李世石進入了難局。

觀戰室里還有一名職業圍棋選手，他是三屆歐洲圍棋冠軍樊麾(Fan Hui)。一開始，第37手也令他感到困惑。但他和AlphaGo很熟悉，有五個月時間，樊麾與這台機器進行過成百上千局對弈。樊麾經常輸給AlphaGo，但他也漸漸比任何人都明白它。在樊麾眼裡，那一步肩沖不像是人類會下的一步棋。思索了十秒後，樊麾才恍然大悟。「這步太漂亮了，」他又重複了一遍，「太漂亮了。」

日後這一手不斷被職業棋手所模仿，包括世界排名第一的柯潔，棋迷們也將這手稱為「阿狗流」，與圍棋戰法中著名的「秀策流」、「中國流」並列。在李世石眼中，37手的阿狗流，表現出了圍棋棋手所說的「直覺」——一種讓它能以像人類一樣的方式，甚至超越人類的方式下出優美棋局的能力。

在決定與谷歌的AlphaGo對決前，李世石對他的對手幾乎一無所知，雖然AlphaGo已經以5:0戰勝了歐洲冠軍樊麾，但五盤棋譜尚未公布，李世石並不知道AlphaGo有多厲害，甚至沒過問獎金一事。直到簽完保密合同後才知道，獎金為100萬美元。李世石說，「這個比賽本身的意義，比獎金大得多。這是因為，我代表人類同計算機對戰。」

人類的代表李世石，在第37手面前陷入沉默。一分鐘過去，又一分鐘過去——整整15分鐘過去了，最終，李世石拿起了一枚棋子放在了棋盤上，在對方肩沖的黑子上貼了一手，事後證明，這一手是本局的敗招，4小時20分鐘後，李世石選擇認輸。

第一滴血

AlphaGo的謎之第37手：人類曾經最艱難的一戰

谷歌雖然是一個美國公司，但AlphaGo的創造者是兩個英國人，大衛·席爾瓦(David Silver)和戴米斯·哈薩比斯(Demis Hassabis)，他們是劍橋同學，專業都是計算神經科學。1998年畢業後，兩人合開了一家電子遊戲公司。

哈薩比斯經常和一名同事下圍棋，席爾瓦在他的影響下也開始自學圍棋。他們還加入了當地圍棋俱樂部，和二三段棋手對弈，這是圍棋中非常低的水平，兩個高智商的傢伙並不滿足於此。他們忍不住思考，為什麼電腦可以打敗西洋跳棋、國際象棋的選手，卻從未破解圍棋。

對人工智慧來說，圍棋遊戲的難度在於，決策空間實在太大。決策(Decision Making)是人工智慧的關鍵要素，使得機器能夠在人類的世界中發揮作用。在圍棋以及任何遊戲中，一次決策往往使得遊戲更新到一個新局面，於是影響到接下來的決策，一直影響到最終遊戲的勝負。人工智慧的關鍵就是在決策空間中搜索達到最大效益的路徑，最終體現在當前決策中。圍棋棋盤上棋子可能的組合方式的數量就有10的170次方之多，超過宇宙原子總數。在近乎無窮的決策空間中，去暴力搜索出當前棋盤的下一步最優定子是絕對不可能的事情。

2010年，哈薩比斯在倫敦成立了一個名為DeepMind的人工智慧公司，席爾瓦隨後而來，在這裡他們開始了真正的人工智慧之旅。這家公司之後又被谷歌公司收購，這也解決了他們的資金問題。

在倫敦國王十字車站附近的DeepMind辦公室中，這支團隊將3000萬步人類下出的圍棋步法輸入到一個深度神經網路中，這個網路的硬體和軟體能大致模擬人腦中的神經網。

神經網路其實很常見，Facebook用它給照片中的人臉加上標籤，谷歌則用它來識別安卓手機收到的語音命令——給它輸入足夠的話語，它就能識別你所說的話。輸入3000萬步圍棋步法，它就能學會下圍棋。在經過五年的進化之後，AlphaGo取得了重大突破，成為第一位擊敗職業棋手的程序，而第一滴血，就是觀戰室的樊麾二段。

AlphaGo的謎之第37手：人類曾經最艱難的一戰

樊麾與AlphaGo對戰

樊麾是西安人，職業二段，2000年移居法國，隨後成為歐洲最強棋手。2015年9月底，樊麾第一次去Deepmind公司參觀，純粹抱著旅遊的心態。雙方確定了比賽時間、比賽方式等等。樊麾發現他們對於人工智慧方面可能很擅長，但對於這個比賽要怎麼弄，一點經驗都沒有。最讓他驚訝的是對方詢問：「萬一機器贏了，下圍棋的人會不會恨我們？會不會因此傷害到很多人的利益？」

樊麾和AlphaGo的比賽定在了2015年10月5日至9日，共5天。比賽是一天兩場，一共10盤。5盤正式的，還有5盤非正式的快棋。正式的比賽樊麾0：5敗，非正式的快棋樊麾2勝3負。2016年1月，哈薩比斯等人在英國《自然》雜誌上發文說，在英國圍棋協會見證下，AlphaGo以5：0戰勝歐洲圍棋冠軍、前中國職業棋手樊麾，成為第一個擊敗人類職業棋手的電腦程序。

在圍棋界，職業棋手第一次輸給電腦是個非常令人震驚的「意外事件」，在AlphaGo戰勝樊麾之前，最好的電腦圍棋也要被頂級棋手讓四五子。職業圍棋選手紛紛對這個結果表示震驚，他們不願意接受這個消息，甚至開始懷疑樊麾的水平只有業餘五段左右。但隨即，AlphaGo團隊向李世石發起了挑戰，人類和人工智慧的重要對決終於到來。

強人工智慧紀元

AlphaGo的謎之第37手：人類曾經最艱難的一戰

在與李世石進行的五場比賽中，兩位解說員都稱AlphaGo為「他」，而不是「它」。李世石剛出場時，還向那個看不見摸不著的對手——不知疲倦亦無憂懼的AlphaGo君鞠了一個躬。

比賽之前，誰也沒有想到AlphaGo會強到如此地步。世界冠軍常昊預計正常情況下李世石是一盤都不會輸，如果AlphaGo贏一盤已經是非常大的突破了。在職業圍棋界，99%的人都和常昊做出同樣的預測。只有一些計算機領域專家，審慎認為AlphaGo能贏一到兩局，比如李開復。但結果，AlphaGo第一局就贏了。圍棋界一片驚呼不說，韓國的媒體甚至將這一局的意義和人類登月相提並論。

從第二局開始，形勢已經發生了逆轉。在此之前，是AlphaGo挑戰李世石，但在此之後，已經是李世石在挑戰AlphaGo了。韓國報紙上開始稱AlphaGo為「阿爾法十段」。在韓國，圍棋九段與中國古代的一品一樣，稱為「入神」，十段差不多就是「神」的意思了。

李世石緊接著輸掉了第三局，AlphaGo在五局三勝中取得了勝利。在後來的新聞發布會上，李世石坐在哈薩比斯旁邊，因為讓人類失望而道歉：「我本可以拿出更好的成績，帶來更好的結局。」

李世石發言時，一種意料之外的感覺開始啃食哈薩比斯的內心。作為AlphaGo的創造人之一，看著這台機器實現了人們認為其不能實現的成績，他感到驕傲，甚至飄飄然，但他同時也因為自己是人類的一員而感到不甘。他開始希望李世石能夠贏下一局。

第四局下了2個小時。李世石這局下得咄咄逼人，對棋盤上的特定區域發起猛攻。但是AlphaGo採取了更加豪邁的風格，以著眼整體的方式對整局局勢進行衡量。

AlphaGo已經贏得了整場比賽。李世石不再為了勝利下棋，而是為了人類。他用右手的前兩個手指執起一枚白棋，放在了緊挨著棋盤中心的地方。這是這局棋的第78手，一步「挖」步，即在兩片大範圍緊密的地區中間插入一棋。在AlphaGo的控制室，運行機器的人們都停下了手裡的工作，盯著他們的顯示屏看。在李世石下出那絕妙的第78手前，AlphaGo計算自己的勝算為70%。八步之後，這一數字變得不值一提。李世石的78手被古力稱為「神之一手」，這手棋讓AlphaGo崩潰，讓人類棋手保留了最後一絲希望。

五局比賽的最終結果是四比一，AlphaGo也憑藉這五局棋一直排在世界第二的位置，威脅著世界第一人，中國棋手柯潔。8月份，DeepMind團隊在波士頓宣布，AlphaGo已經從李世石對戰的第18個版本進化到了V25，現在這個版本可以讓頂尖職業棋手兩子。隨後，中國棋聖聶衛平宣布柯潔將不會與AlphaGo進行比賽，為職業棋手保全最後一絲顏面。

然而，人工智慧的大門已經打開，一個新時代，已經到來了。「2016年是人工智慧走向主流的元年」，微軟亞太研發集團前主席、百度公司總裁張亞勤接受媒體採訪時說。這一年，除了AlphaGo與李世石的「人機大戰」，IBM、微軟、Facebook等互聯網巨頭，都投入巨大的人力、財力和精力在人工智慧平台。Facebook創始人扎克伯格甚至預言，「人類基本的聽、說、讀、寫等核心感知力，在未來5-10年，計算機一定能做得比人類自己更好。」

到那時，人們或許才會更真切理解這嘲人機大戰」的意義，也才會更清楚，公元2016年3月10日，AlphaGo下出37手的那一刻，對人類到底意味著什麼。

看天下370期封面故事

《Vista看天下》團隊出品

做最好看的新聞故事

您的贊是小編持續努力的最大動力，動動手指贊一下吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊下面的「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 Vista看天下 的精彩文章:

※《Vista看天下》雜誌招聘文化記者、財經時政新聞實習生
※55比0！當聶衛平都被Master幹掉，講段子成了人類智慧最後的尊嚴
※2017年第一個網紅段子手出爐啦！快來圍觀這個吃喝嫖賭樣樣精通的75歲老才子
※郝景芳：在小說中摺疊北京，在現實中打開摺疊

TAG:Vista看天下 |

您可能感興趣

※Master真身是AlphaGo！豪取60連勝，李世石也許是最後一個贏過AlphaGo的人類。
※這是AlphaGo的最後一次比賽了，AlphaGo將退出江湖
※4.5小時鏖戰，柯潔四分之一子惜敗AlphaGo
※1：0！AlphaGo戰勝柯潔贏下人機大戰第一局
※柯潔 VS AlphaGo 人機大戰2.0最大贏家卻是第三者
※DeepMind團隊：發明AlphaGo不是為了戰勝人類
※AlphaGo之父：關於圍棋，人類3000年來犯了一個錯
※AlphaGo VS 柯潔，人類為了「尊嚴」的最終之戰
※新版 AlphaGo 遭遇「首敗」，但卻輕鬆戰勝了五位人類高手的圍攻
※AlphaGo戰勝五人棋手團隊
※8GB運存Nokia 9再度曝光人類完敗AlphaGo
※人機大戰第一局：AlphaGo戰勝柯潔
※0:3輸給AlphaGo柯潔和人下了一盤
※科客晚報：8GB運存Nokia 9再度曝光人類完敗AlphaGo
※柯潔首戰失利AlphaGo，但這只是Google的又一場科技秀
※賽後哽咽的柯潔儘力了，DeepMind AlphaGo 拿下人機大戰三盤全勝
※柯潔首戰 AlphaGo，輸了
※AlphaGo兇猛來襲：Intel、NVIDIA危險了
※AlphaGo單挑五虎將獲勝，連笑配對AlphaGo笑到最後