認慫了柯潔稱這次遇上「圍棋上帝」了

最新 05-24

柯潔首局落敗並不太出人意料，賽後的新聞發布會上他也非常坦率，一反去年的狂傲，發表了「感覺AlphaGo像圍棋上帝」這樣的感言。

他說，AlphaGo確實下得很精彩，很多地方都值得我們學習、探討，它改變了我們對棋的最初的看法，沒有什麼棋是不可以下的，可以大膽去創新，開拓自己的思維，去自由地下一盤棋。在我印象中，AlphaGo非常貪戀實地，所以今天我也一直貫徹「先撈後洗」的戰術，先把實地撈到手。但在角部還是被它掏到了實地，打破了我的戰術，一下子就進入了它的步調。感覺AlphaGo和去年判若兩人，當時覺得它的棋很接近人類棋手，現在感覺越來越像「圍棋上帝」。

AlphaGo已給我們展現了很多精彩的實戰，弱點暫時還沒有看到。我覺得以前它還有，但現在它對棋的理解和判斷遠勝於我們。所以，想贏只好通過找它的漏洞，但真的很難。這可能是我與人工智慧下的最後三盤棋，現在就只剩兩盤了，這可能是我最難得的機會，我會盡全力去珍惜。

柯潔和 AlphaGo 的第一盤棋有哪些值得關注之處？

知友：范廷鈺（職業九段棋手，第七屆「應氏杯」世界圍棋錦標賽冠軍）

柯潔使用了 AlphaGo 的開局，但是並不成功。

中盤果斷，先是掏取了角部，又成功處理棄子，非常成功。

這盤棋柯潔輸了四分之一子，為了方便讓不懂圍棋的知友理解，是圍棋中最小的差距。半目的設置是為了避免用整數出現雙方平目和棋的情況出現。賽前關於AlphaGo 和頂尖棋手的差距，我根據我自己的經驗，在Live中提出：AlphaGo 領先頂尖棋手有「一先」以上。

從這盤棋上看，柯潔是完敗。下半盤黑棋棄子治理非常成功，抓住了AlphaGo的緩手。

這裡我談兩Live 里提到的局部的看法和一點疑問。

【局部看法】

這裡 AlphaGo 無論如何還是直接提掉比較好，白棋棋型非常完整厚實，實戰後來柯潔巧妙地利用這裡的形狀問題走出了比較成功的處理。

這裡是全局黑棋最得分的部分，AlphaGo 從立被黑棋先手擋下，輕鬆斷在這裡，處理的非常成功。

【一點疑問】

這裡柯潔黑棋實戰選擇了c 點，當時在Live之中我擺了很久，可以說a/b/c 三個選點，實戰是選的最差的。

【小結】

從這盤棋來看，AlphaGo 明顯還是強過柯潔，但是也不必神話，仍然有很多明顯問題出現。

知友：高飛龍（圍棋話題優秀回答者）

我注意到很多媒體對比賽的稱呼為「人機對弈」而非「人機大戰」，這是一個很好的姿態。因為勝敗與懸念固然是最容易產生故事，也最容易動人心弦，但人類棋手和機器下棋，值得關注的不僅僅是勝敗結果。

這次AlphaGo的版本，比起去年4：1戰勝李世石的18.0版本，明顯有了很大的進步，可以說從絕對實力上來說明顯超越了人類棋手的水平。在超越節點之後的人機對弈，更像是測試，而競技比賽作為人類激發自身潛能的儀式化活動，可以產生更好的測試效果。人們一邊期待著從棋局的過程來探究棋盤上的客觀真理，藉助程序作為工具來更好的了解圍棋，另一邊也想看看能不能對人工智慧的進一步發展提供什麼參考和借鑒。這是兩個領域的雙贏，無論如何都將導致人類的進步。

而今天的棋局內容，則相對比較常規。柯潔開局就採用了Master（AlphaGoV19.0）元旦期間60盤網棋中常用的三三定式，策略很明顯，你喜歡撈實地，我就先撈實地，你在複雜局面下有可能出錯，我就儘可能先撈後洗，在中盤戰鬥中找機會。但棋局的過程，雖然雙方都發揮出色，但相對平淡，柯潔過早選擇點三三，在傳統的棋理中稍虧，實戰效果也差不多，然後雙方始終不溫不火的保持差距，都沒犯什麼明顯的錯。中盤時，黑棋最多只有盤面優勢，然後白棋就收兵了。白棋後半盤多次目數虧損，導致差距縮小，最終以1/4子的最小差距取勝。

要關注1/4子的勝負結果，首先要知道圍棋研究與圍棋實戰的不同。研究棋理，就像探究客觀真理，當然要追求最佳，也就是最大收益；而實戰，因為贏多贏少都是贏，所以完全可以追求穩健。而蒙特卡洛的演算法是按照不同後續下法，跑出海量棋局然後統計勝率，AlphaGo模型設定為取最高勝率的後續下法為實際下法，所以實戰中這個模型在封閉空間中可能導致非最佳下法，但一般情況下不影響勝負。

所以最後的1/4子，雖然也說明了柯潔的拼搏，但大家必須明白，這不是實際差距。也就是說，今天棋局顯示出黑白雙方的發揮差距，實際上不是半目而是更多，但也沒有達到很多誇張的說法所說的兩個子。我個人感覺實際差距不到一先，因為在AlphaGo後半盤收兵之前，黑棋盤面稍好，白棋至少握有4目左右的優勢，這個數目應該更接近於今天雙方的發揮。

當然大家必須知道一點，圍棋實戰結果的差距，並不見得能說明實際差距，人和人之間的對弈，如果看清楚會小敗，經常會釋放勝負手博取翻盤可能，結果要麼翻盤，要麼崩盤。今天的柯潔鬥志昂揚，但是AlphaGo整盤棋控制力非凡，柯潔落後不多，但始終沒有什麼明顯的機會，上邊想要強殺白棋，可惜AlphaGo下出精彩手筋，有驚無險的活出。如果AlphaGo中後盤稍露破綻，柯潔一定也會寧為玉碎、不為瓦全，可惜AlphaGo始終那麼穩。嗯，找不到玉碎的機會，這正是今天AlphaGo強大發揮的說明。

對於AlphaGo的下法，今天阿老師的下法非常常規，或者說很像人類棋手。去年和李世石對弈的18.0版本，每盤開局都有一些對局部變化的選擇與人類常見下法不同，或者說是冷僻下法，效果大多不錯，但有些也存疑。今年元旦新版的Master（19.0）上線，帶來的最明顯的新變化就是「早點三三」。而這種下法已經被職業棋壇大量研究和模仿，頗有收穫。可惜今天柯潔的開局點三三，效果上來看並不上佳，甚至可以說此下法可能導致了細微劣勢。但正如前所述，這更像是測試而非比賽，所以試探性著法是必然的，不然人還跟機器下什麼？總要有收穫的嘛！未來幾天的比賽，希望能看到各種姿勢的測試，今天這樣的平淡，一局足已。

經歷去年的人機大戰之後，這次許多輿論更加冷靜客觀一些，人機對弈更加回歸真實，這是可喜的。當然有些宣傳問題上有遺憾，也是無奈的。但重要的不是這些，用圍棋界的話說，「勝負不在這兒」，重要的是未來。

如何看待柯潔將於 5 月底與 AlphaGo 進行的終極人機大戰？這對圍棋、人類和人工智慧會有什麼影響？

知友：王小川（搜狗公司 CEO）

該來的終於來了。

一年前AlphaGo發布，看完論文後我就在知乎上發文預測機器會完勝人類。好些行業朋友不相信，為此我收了很多「智商稅」，之後微信發紅包一直發到春節才發完。此外我還立了兩個斷言：一個是Google很有可能再研發出AlphaGo 2.0，擺脫「監督學習」，不再需要人類下圍棋的歷史數據，而是只通過「增強學習」，兩台AlphaGo自我對戰學習如何下棋，並達到登峰造極的地步。從公開的資料判斷，此言中了。這意味著什麼呢，又有什麼看點呢？

技術重大提升：和1.0原理大不同更接近於人

AlphaGo 1.0 是巧妙地混合了三種演算法：蒙特卡洛樹搜索+監督學習+增強學習。其中蒙特卡洛樹搜索是一種優化過的暴力計算，比1997年深藍的暴力計算更聰明。而這裡的監督學習，是通過學習3000萬步人類棋譜，對六段以上職業棋手走棋規律進行模仿，也是AlphaGo獲得突破性進展的關鍵演算法。而增強學習作為輔助，是兩台AlphaGo從自我對戰眾中學習如何下棋，據悉對棋力提升有限。

根據公開資料推測，此次AlphaGo2.0的技術原理與之前有著巨大不同：

1. 放棄了監督學習，沒有再用人的3000萬局棋譜進行訓練。這本是AlphaGo最亮眼的演算法，也是今天主流機器學習不可避免的核心條件：依賴於優質的數據，在這個特定問題下就這麼被再次突破了。

2. 放棄了蒙特卡洛樹搜索，不再進行暴力計算。理論上，演算法越笨，就越需要暴力計算做補充。演算法越聰明，就可以大大減少暴力計算。從AlphaGo 2.0的「馬甲」Master的歷史行為看，走棋非常迅速，約在每10秒鐘就走棋一步，如此速度很可能是放棄了暴力的計算。

3. 極大地強化了增強學習的作用，之前敲邊鼓的演算法，正式成為扛把子主力。想想看有多勵志：兩台白痴機器，遵守走棋和獲勝規則，從隨機走棋開始日夜切磋，總結經驗，不斷批評和自我批評，一周後終成大器。

在這樣的演算法下，AlphaGo 2.0對計算資源開銷極小，把當前棋局輸入神經網路，電流流過，輸出就是最佳的走棋方案。我猜測如此演算法下，有可能僅僅依靠一個GPU工作，每一步棋消耗的能源接近人的大腦。

最大看點： AlphaGo2.0 棋風完全脫離人類經驗

今年年初，AlphaGo 化身Master連勝人類頂尖棋手60局。在圍棋領域，機器完勝已經變成公認的定論。這導致很多人開始問：這次人機大戰還有意義嗎？我們的關注點不再是機器是否會贏——而是機器將用什麼姿勢戰勝人類。

AlphaGo學習了3000萬步人類棋譜，走棋風格也近似於人。在比賽現場，偶有AlphaGo走棋和人的經驗不符合，就被評為「愚蠢」，只是在中盤之後發現機器漸漸局面佔優最終獲勝，為了自圓其說解讀為「AlphaGo中盤逆轉」，前兩局莫過如此。第三局開始評論者長了教訓，開始尊稱AlphaGo為「阿老師」，有了欣賞和敬畏的心態。這帶給圍棋界很大的衝擊，以前大家認為正確的東西，其實是不正確的。柯潔曾經評價說：「AlphaGo出現，很多理論都被推翻，再看以前定式變得好笑，虧那麼多目就不再是兩分。」人類通過數千年實戰，總結了圍棋理論，然後計算機告訴人類：這些全都是錯的。現在在很多比賽上，人類棋手已經開始向機器學習，模仿AlphaGo的下法，棋聖聶衛平也曾表示「理論被顛覆了」。

而AlphaGo2.0脫離了機器對人模仿，走棋風格也將完全脫離人的定式。在與柯潔的比賽中，會不斷出現我們意想不到的走棋，而且這些走棋在教科書中會被認為是低級錯誤或者完全不可理喻，但凡一個正常的棋手都不會這麼玩，但凡一個新手這麼玩都會被點撥這樣不對。而AlphaGo2.0會不斷製造這樣的局面，關鍵他還是對的。可想對專業棋手的心裡會有多大的震撼：不僅自己這一輩子都沒這麼想過這麼下棋，整個圍棋界都沒有想過。會不會懷疑自己白活了？會不會反思兩千年圍棋的發展為什麼有這樣的瓶頸？還有多少海闊天空等著我們去探索？可等不及我們去探索，計算機就給出了終局的答案，多麼惆悵。

我們會津津樂道，AlphaGo是什麼棋風。但可以這樣推理：但凡有流派和風格，就還有局限性。只有當所有流派合一看不出流派的時候，才到達致高境界。AlphaGo 2.0便會是這麼一台機器，沒有風格，穩如磐石。

可以想見這次與柯潔的對弈，能頻現「怪招」，完全顛覆人類對圍棋的理解——這會是比賽最大的看點。英勇的柯潔，要解鎖108種姿勢來抵擋了。

2017人機大戰的意義：重演一部進化史重新認識智慧的邊界

2016年在AlphaGo和李世乭的對戰後，人工智慧進入大眾的視野，我們開始重新思考機器和人的關係。

圍棋已經有兩千多年的歷史，在漫長歲月的琢磨中，圍棋理論不斷進化，到達了很高的水準，AlphaGo的獲勝，我們大可以解讀於「青出於藍」，畢竟是在人類圍棋進化的主路徑上又攀高峰。

而AlphaGo2.0完全拋棄掉人類這兩千年來進化的圍棋經驗，另尋他徑，僅憑兩台機器自我對弈中學習和進化，最終不僅趕超了人類進化的速度，還發展出一套截然不同的下棋方法，並且更加接近完美的狀態，實現了對人類的碾壓，重演了一部圍棋的進化史，而且得出了與這兩千年來不同的進化結果。

這會給我們什麼啟示？如果跳出圍棋的規則，類比看地球生命的進化：人類是從原始的有機物，到單細胞開始逐步變成靈長類動物，並且發展出超越其他一切生物的智慧。這條路徑是唯一的么？人類的生命形態和最頂級的生命形態還有多大距離？AlphaGo告訴我們：我們還有極大的發展空間；AlphaGo2.0告訴我們：如果有合適的條件，完全可能有其他的生命進化路徑，以及更不一樣的進化結果。

讓我們歡呼人的智慧造就了AlphaGo，這也幫我們開了眼界，看到我們離最終的生命形態和智慧依然有遙遠的距離。

保持敬畏，堅定前行，終得圓滿。

本文內容來自「知乎」

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 智競在線 的精彩文章:

※人機大戰面臨全國禁播柯傑你的表演或許國人看不到
※國象亞洲個人賽完滿閉幕玩偶熊貓萌翻全場

TAG:智競在線 |

您可能感興趣

※確認過眼神，遇上了一群賊
※女生路上看到一隻橘貓，確認過眼神後，她就這麼遇上了對的貓
※分手前後判若兩人，遇上這些星座只能認倒霉了！
※確認了眼神遇上對的你——五台山
※楊冪被稱為「爛片女王」，但是卻遇上了他
※熱巴遇上金晨變慫？仍自稱是女神，在電梯內上演的這一幕看呆眾人
※當復仇者聯盟遇上了京劇！這又是一番什麼樣的光景呢？
※貓咪撒歡遇上兩隻萌犬，下一秒就慫了，做的姿勢也是沒誰了
※張家輝這一次遇上難事了，發文懇求觀眾幫「渣渣輝」一次！
※搞笑漫畫：小孩上街遇上人販子？說了這句話之後不但沒被帶走還被暴揍了一頓！
※剛下樓就遇上一隻偷魚的貓咪，看到這一幕應該報警呢？
※路飛為何如此驚慌？兔兔一句話說明了一切，網友：遇上「剋星」！
※我是淮河中的一隻老水獺，因為看見那女子浣紗而喜歡上她，沒想到遇上了聖明的巫師
※如果在戰場上遇上了華裔美軍，你會怎麼做呢？看看老兵們怎麼說
※吳昕終於當一次仙女，卻遇上了阿嬌，這次直接打自己的臉了！
※【熱點】單親媽媽何潔，這次是否遇上了命中注定的人？
※對上了眼神，你遇上……
※當表情包遇上「真人」，看一次笑一次，網友：終於知道鼻祖是誰了
※話題小王子吳亦凡，這次和國外超模確認眼神了，難道遇上了對的人？
※為何很多人認為遇上誰也不能遇上《紅樓夢》里的薛姨媽？

認慫了 柯潔稱這次遇上「圍棋上帝」了

認慫了柯潔稱這次遇上「圍棋上帝」了