AlphaGo的謎之第37手:人類曾經最艱難的一戰
李世石
我本可以拿出更好的成績,帶來更好的結局。
2016年12月,美國著名的科普網站,科學新聞(ScienceNew.org)在評選十大新聞中,名列第一的是「AlphaGo戰勝李世石」。
「AlphaGo在克服複雜問題上爬過了一座陡峭的山峰,在最複雜的智力遊戲中戰勝了人類」,在回顧中,科學新聞評價道,「現實世界的複雜程度遠超這些遊戲,但AlphaGo的進步讓大家看到了電腦解決複雜問題的曙光。」
是的,由於AlphaGo的出現,人類作為一個整體應該意識到,世界不一樣了,另一種文明,已經嶄露頭角。
「我代表人類」
李世石
時間倒回到2016年3月10日,首爾光化門的四季酒店,這裡正在進行圍棋「人機大戰」第二局。在9日進行的第一局比賽中,谷歌的程序AlphaGo擊敗了李世石,取得了歷史性的突破。在第二局的比賽中,AlphaGo下出的第37手,一個簡單的肩沖,又讓李世石進入了難局。
觀戰室里還有一名職業圍棋選手,他是三屆歐洲圍棋冠軍樊麾(Fan Hui)。一開始,第37手也令他感到困惑。但他和AlphaGo很熟悉,有五個月時間,樊麾與這台機器進行過成百上千局對弈。樊麾經常輸給AlphaGo,但他也漸漸比任何人都明白它。在樊麾眼裡,那一步肩沖不像是人類會下的一步棋。思索了十秒後,樊麾才恍然大悟。「這步太漂亮了,」他又重複了一遍,「太漂亮了。」
日後這一手不斷被職業棋手所模仿,包括世界排名第一的柯潔,棋迷們也將這手稱為「阿狗流」,與圍棋戰法中著名的「秀策流」、「中國流」並列。在李世石眼中,37手的阿狗流,表現出了圍棋棋手所說的「直覺」——一種讓它能以像人類一樣的方式,甚至超越人類的方式下出優美棋局的能力。
在決定與谷歌的AlphaGo對決前,李世石對他的對手幾乎一無所知,雖然AlphaGo已經以5:0戰勝了歐洲冠軍樊麾,但五盤棋譜尚未公布,李世石並不知道AlphaGo有多厲害,甚至沒過問獎金一事。直到簽完保密合同後才知道,獎金為100萬美元。李世石說,「這個比賽本身的意義,比獎金大得多。這是因為,我代表人類同計算機對戰。」
人類的代表李世石,在第37手面前陷入沉默。一分鐘過去,又一分鐘過去——整整15分鐘過去了,最終,李世石拿起了一枚棋子放在了棋盤上,在對方肩沖的黑子上貼了一手,事後證明,這一手是本局的敗招,4小時20分鐘後,李世石選擇認輸。
第一滴血
谷歌雖然是一個美國公司,但AlphaGo的創造者是兩個英國人,大衛·席爾瓦(David Silver)和戴米斯·哈薩比斯(Demis Hassabis),他們是劍橋同學,專業都是計算神經科學。1998年畢業後,兩人合開了一家電子遊戲公司。
哈薩比斯經常和一名同事下圍棋,席爾瓦在他的影響下也開始自學圍棋。他們還加入了當地圍棋俱樂部,和二三段棋手對弈,這是圍棋中非常低的水平,兩個高智商的傢伙並不滿足於此。他們忍不住思考,為什麼電腦可以打敗西洋跳棋、國際象棋的選手,卻從未破解圍棋。
對人工智慧來說,圍棋遊戲的難度在於,決策空間實在太大。決策(Decision Making)是人工智慧的關鍵要素,使得機器能夠在人類的世界中發揮作用。在圍棋以及任何遊戲中,一次決策往往使得遊戲更新到一個新局面,於是影響到接下來的決策,一直影響到最終遊戲的勝負。人工智慧的關鍵就是在決策空間中搜索達到最大效益的路徑,最終體現在當前決策中。圍棋棋盤上棋子可能的組合方式的數量就有10的170次方之多,超過宇宙原子總數。在近乎無窮的決策空間中,去暴力搜索出當前棋盤的下一步最優定子是絕對不可能的事情。
2010年,哈薩比斯在倫敦成立了一個名為DeepMind的人工智慧公司,席爾瓦隨後而來,在這裡他們開始了真正的人工智慧之旅。這家公司之後又被谷歌公司收購,這也解決了他們的資金問題。
在倫敦國王十字車站附近的DeepMind辦公室中,這支團隊將3000萬步人類下出的圍棋步法輸入到一個深度神經網路中,這個網路的硬體和軟體能大致模擬人腦中的神經網。
神經網路其實很常見,Facebook用它給照片中的人臉加上標籤,谷歌則用它來識別安卓手機收到的語音命令——給它輸入足夠的話語,它就能識別你所說的話。輸入3000萬步圍棋步法,它就能學會下圍棋。在經過五年的進化之後,AlphaGo取得了重大突破,成為第一位擊敗職業棋手的程序,而第一滴血,就是觀戰室的樊麾二段。
樊麾與AlphaGo對戰
樊麾是西安人,職業二段,2000年移居法國,隨後成為歐洲最強棋手。2015年9月底,樊麾第一次去Deepmind公司參觀,純粹抱著旅遊的心態。雙方確定了比賽時間、比賽方式等等。樊麾發現他們對於人工智慧方面可能很擅長,但對於這個比賽要怎麼弄,一點經驗都沒有。最讓他驚訝的是對方詢問:「萬一機器贏了,下圍棋的人會不會恨我們?會不會因此傷害到很多人的利益?」
樊麾和AlphaGo的比賽定在了2015年10月5日至9日,共5天。比賽是一天兩場,一共10盤。5盤正式的,還有5盤非正式的快棋。正式的比賽樊麾0:5敗,非正式的快棋樊麾2勝3負。2016年1月,哈薩比斯等人在英國《自然》雜誌上發文說,在英國圍棋協會見證下,AlphaGo以5:0戰勝歐洲圍棋冠軍、前中國職業棋手樊麾,成為第一個擊敗人類職業棋手的電腦程序。
在圍棋界,職業棋手第一次輸給電腦是個非常令人震驚的 「意外事件」,在AlphaGo戰勝樊麾之前,最好的電腦圍棋也要被頂級棋手讓四五子。職業圍棋選手紛紛對這個結果表示震驚,他們不願意接受這個消息,甚至開始懷疑樊麾的水平只有業餘五段左右。但隨即,AlphaGo團隊向李世石發起了挑戰,人類和人工智慧的重要對決終於到來。
強人工智慧紀元
在與李世石進行的五場比賽中,兩位解說員都稱AlphaGo為「他」,而不是「它」。李世石剛出場時,還向那個看不見摸不著的對手——不知疲倦亦無憂懼的AlphaGo君鞠了一個躬。
比賽之前,誰也沒有想到AlphaGo會強到如此地步。世界冠軍常昊預計正常情況下李世石是一盤都不會輸,如果AlphaGo贏一盤已經是非常大的突破了。在職業圍棋界,99%的人都和常昊做出同樣的預測。只有一些計算機領域專家,審慎認為AlphaGo能贏一到兩局,比如李開復。但結果,AlphaGo第一局就贏了。圍棋界一片驚呼不說,韓國的媒體甚至將這一局的意義和人類登月相提並論。
從第二局開始,形勢已經發生了逆轉。在此之前,是AlphaGo挑戰李世石,但在此之後,已經是李世石在挑戰AlphaGo了。韓國報紙上開始稱AlphaGo為「阿爾法十段」。在韓國,圍棋九段與中國古代的一品一樣,稱為「入神」,十段差不多就是「神」的意思了。
李世石緊接著輸掉了第三局,AlphaGo在五局三勝中取得了勝利。在後來的新聞發布會上,李世石坐在哈薩比斯旁邊,因為讓人類失望而道歉:「我本可以拿出更好的成績,帶來更好的結局。」
李世石發言時,一種意料之外的感覺開始啃食哈薩比斯的內心。作為AlphaGo的創造人之一,看著這台機器實現了人們認為其不能實現的成績,他感到驕傲,甚至飄飄然,但他同時也因為自己是人類的一員而感到不甘。他開始希望李世石能夠贏下一局。
第四局下了2個小時。李世石這局下得咄咄逼人,對棋盤上的特定區域發起猛攻。但是AlphaGo採取了更加豪邁的風格,以著眼整體的方式對整局局勢進行衡量。
AlphaGo已經贏得了整場比賽。李世石不再為了勝利下棋,而是為了人類。他用右手的前兩個手指執起一枚白棋,放在了緊挨著棋盤中心的地方。這是這局棋的第78手,一步「挖」步,即在兩片大範圍緊密的地區中間插入一棋。在AlphaGo的控制室,運行機器的人們都停下了手裡的工作,盯著他們的顯示屏看。在李世石下出那絕妙的第78手前,AlphaGo計算自己的勝算為70%。八步之後,這一數字變得不值一提。李世石的78手被古力稱為「神之一手」,這手棋讓AlphaGo崩潰,讓人類棋手保留了最後一絲希望。
五局比賽的最終結果是四比一,AlphaGo也憑藉這五局棋一直排在世界第二的位置,威脅著世界第一人,中國棋手柯潔。8月份,DeepMind團隊在波士頓宣布,AlphaGo已經從李世石對戰的第18個版本進化到了V25,現在這個版本可以讓頂尖職業棋手兩子。隨後,中國棋聖聶衛平宣布柯潔將不會與AlphaGo進行比賽,為職業棋手保全最後一絲顏面。
然而,人工智慧的大門已經打開,一個新時代,已經到來了。「2016年是人工智慧走向主流的元年」,微軟亞太研發集團前主席、百度公司總裁張亞勤接受媒體採訪時說。這一年,除了AlphaGo與李世石的「人機大戰」,IBM、微軟、Facebook等互聯網巨頭,都投入巨大的人力、財力和精力在人工智慧平台。Facebook創始人扎克伯格甚至預言,「人類基本的聽、說、讀、寫等核心感知力,在未來5-10年,計算機一定能做得比人類自己更好。」
到那時,人們或許才會更真切理解這嘲人機大戰」的意義,也才會更清楚,公元2016年3月10日,AlphaGo下出37手的那一刻,對人類到底意味著什麼。
看天下370期封面故事
《Vista看天下》團隊出品
做最好看的新聞故事
※《Vista看天下》雜誌招聘文化記者、財經時政新聞實習生
※55比0!當聶衛平都被Master幹掉,講段子成了人類智慧最後的尊嚴
※2017年第一個網紅段子手出爐啦!快來圍觀這個吃喝嫖賭樣樣精通的75歲老才子
※郝景芳:在小說中摺疊北京,在現實中打開摺疊
TAG:Vista看天下 |
※Master真身是AlphaGo!豪取60連勝,李世石也許是最後一個贏過AlphaGo的人類。
※這是AlphaGo的最後一次比賽了,AlphaGo將退出江湖
※4.5小時鏖戰,柯潔四分之一子惜敗AlphaGo
※1:0!AlphaGo戰勝柯潔 贏下人機大戰第一局
※柯潔 VS AlphaGo 人機大戰2.0最大贏家卻是第三者
※DeepMind團隊:發明AlphaGo不是為了戰勝人類
※AlphaGo之父:關於圍棋,人類3000年來犯了一個錯
※AlphaGo VS 柯潔,人類為了「尊嚴」的最終之戰
※新版 AlphaGo 遭遇「首敗」,但卻輕鬆戰勝了五位人類高手的圍攻
※AlphaGo戰勝五人棋手團隊
※8GB運存Nokia 9再度曝光 人類完敗AlphaGo
※人機大戰第一局:AlphaGo戰勝柯潔
※0:3輸給AlphaGo柯潔和人下了一盤
※科客晚報:8GB運存Nokia 9再度曝光 人類完敗AlphaGo
※柯潔首戰失利AlphaGo,但這只是Google的又一場科技秀
※賽後哽咽的柯潔儘力了,DeepMind AlphaGo 拿下人機大戰三盤全勝
※柯潔首戰 AlphaGo,輸了
※AlphaGo兇猛來襲:Intel、NVIDIA危險了
※AlphaGo單挑五虎將獲勝,連笑配對AlphaGo笑到最後