柯潔深夜發文：AI是唯一一個在棋盤上把我殺哭的啊！

科技 01-26

撰文 | 呂夢

微信 | ai_xingqiu

網址 | 51aistar.com

昨晚，柯潔在微博發布了頭條文章，談了自己與騰訊人工智慧「絕藝」下讓兩子棋的感受。

以下為柯潔微博長文內容：

今天執黑和騰訊的AI 絕藝下了一盤被讓兩子（黑貼6.5 大約等於讓先倒貼目）贏了一盤。

前幾天第一次嘗試輸了，被大肆報道了一番...今天贏了，卻沒有任何報道。現在的人呀...真是喜歡搞個大新聞啊...

其實穩著下優勢還是蠻大的...主要是第一次被AI讓一手，真的有一種說不出的滋味...苦楚？無奈？可我還是想去挑戰。

前幾天和很多棋院小夥伴聚會，大家都很開心。除了敘舊聊得最多的就是AI。還有就是我們棋手到底和AI有多大的差距？這不僅是廣大愛好者最關心的話題，其實也是我們最關心的話題。

其實聊這個話題的時候，我的內心是極其沉重的。你們可能也懂。AI到底給了我多大的傷害——它可是唯一一個在棋盤上把我殺哭的啊！！

但自從慢慢接受了以後，這又是不得不去面對的一個話題...

我經常會回想起兩年前的我，那個把熱血漫畫主角套進現實中、那個極度中二的圍棋少年。所有決賽的對手都是要擊敗的boss——而alphago就是最終暗黑大boss！他是壞人！（笑）熱血漫畫的主角一定會幹掉最終boss，我一定會贏！然而...結局我沒贏，中二的少年沒贏。我輸了，而且輸的很徹底。

現在雖然也沒到油膩的年紀，但心態確實已經發生了很大變化，油膩到可以放下尊嚴去向AI虛心討教了。

那麼到底，我們職業棋手AI有多大差距呢？

首先是心態

我覺得，我在和人類下棋的時候是英勇無畏的。因為老子棋就是最強的！（笑）

和AI下。。。我這裡會不會被干漏啊。。。哎呀我的棋怎麼這麼薄啊。。。哎呀我的實地怎麼這麼少啊。。。像一個60歲的老母親擔心自己遠遊的孩子一樣擔心自己的棋，最後結局一般都是哎呀不行了不夠了認輸鍵在哪我要認輸。

棋未先行心態已崩

但若是以一個平和的心態去面對。

我覺得差距，不會有想像中那麼大。

具體有多少差距，我保險點的說，絕對不會超過三子。

我不喜歡放空話，我希望登到有AI真的到了alphgo zero的水平的話，我可以放下尊嚴去下正式的讓子棋，給愛好者們看看到底又多大差距。

在AI面前，尊嚴是什麼？能吃嗎？我只知道

我喜歡下棋。

我熱愛圍棋。

2017年5月27日，柯潔九段對陣DeepMind人工智慧AlphaGo，比賽從上午10：30開始，一直激戰到下午14：08，最終柯潔投子認輸，AlphaGo執黑中盤勝。

至此，中國圍棋峰會人機大戰三番棋結束，柯潔0：3負AlphaGo。

這是繼2016年3月AlphaGo以4：1總比分戰勝圍棋世界冠軍、韓國職業九段選手李世石後，在慢棋規則中戰勝的另一個圍棋世界冠軍。

與李世石對戰的AlphaGo1.0版本不同的是，2.0版本的AlphaGo已不再拘泥於學習過的3000多萬人類棋譜。

隨著演算法的完善和不斷的自我學習，AlphaGo已經從2016年對人類棋手的模仿，到如今「無限接近完美的人類棋手」。

在25號三番棋第二場比賽中，下午1：37，第154步，柯潔投子認輸，AlphaGo在中盤執黑子獲勝。

峰會主廳里一片沉默，大屏幕上柯潔復盤抓子的聲音清晰可聞。幾分鐘，隊友唐韋星迫進入演播室與柯潔復盤，演播室的麥克風還未關閉，裡面傳來柯潔的聲音：我算錯了。

這場比賽的中盤階段，柯潔用了很多激進的打法，根據AlphaGo的計算，本局比賽前100手階段，柯潔的贏面很高，人類和機器的勝率從未如此接近。

「本來覺得挺看不清的還想著柯潔是不是有點機會？但阿爾法全看清了」，雖然很惋惜，但唐韋星還是對柯潔的表現讚賞有加，「今天這棋已經下的不是一般的好了」。

柯潔的優秀逼出了AlphaGo的極限。這個極限，正是來自於AlphaGo的「自學能力」。

AlphaGo主程序員David Silver在烏鎮圍棋峰會第二天的演講中表示，「我們能獲取到的最好的數據不是來自於人類，而是來自AlphaGo自己。我們讓AlphaGo做自己的老師，利用其強大的搜索能力自己生成數據，再用生成的數據讓下一代的AlphaGo學習」。

通過融入策略網路與價值網路，今天的AlphaGo2.0已經從傳統電腦「固定」的程序邏輯中跳脫出來，與自己的對弈中積累了更多經驗。

首先，AlphaGo通過與自己下棋，訓練一個新的策略網路，算出那些有戲的落子方案；然後，再利用與自己下棋時的贏家數據來訓練價值網路，一邊推算一邊判斷局面，預測和自己下棋的棋局中，哪一方是贏家。

當這一過程重複多遍時，就能得到全新的策略網路和價值網路，再如此循環，導致更強大的AlphaGo誕生。

DeepMind 的聯合創始人兼 CEO Demis Hassabis

DeepMind 的聯合創始人兼 CEO Demis Hassabis稱，「AlphaGo最強大的地方並不體現在具體某一手棋或者某個局部的變化，而是它在每一局棋里所展現出來的獨特視角。在它的世界裡，沒有什麼先入為主的概念，也沒有什麼必須要遵守的規則，從第一步開始，AlphaGo就在計算每一步的勝率，進而選擇最佳落子位置。」

這種有違人類棋手經驗的棋法，成就了機器的完美棋局。

2016年3月9日，AlphaGo對戰李世石勝利後，柯潔在微博寫道，「就算阿爾法狗戰勝了李世石，但它贏不了我。」

今年年初，在Master橫掃中國棋壇連勝60場後，柯潔改變了自己的看法，「人類數千年的實戰演練進化，計算機卻告訴完美人類全都是錯的。我覺得，甚至沒有一個人沾到圍棋真理的邊。」

5月24日，圍棋峰會人機大戰的第二天，Deepming團隊預測，2.0版本的AlphaGo比李世石版本提升了三子。這個差距意味著什麼？用柯潔自己的話說，就是「對手連續讓你下三步……又像武林高手對決讓你先捅三刀一樣……」

或許，人類棋手與AlphaGo的差距，遠比人類棋手之間的差距大的多。

25號，在第二場惜敗AlphaGo之後，柯潔對這台會發熱的GPU 顯然有了更多理解，「它很多的思想、理念，在改變我們最初對圍棋的看法，沒有什麼是不能下的」。

柯潔在微博中寫到，「現在雖然也沒到油膩的年紀，但心態確實已經發生了很大變化，油膩到可以放下尊嚴去向AI虛心討教了」。

今天，人類從與機器的對弈中探索新的可能，到開始學習和借鑒它的下棋思路。這樣的結果除了把人類棋手推向更加焦灼的境地，也為棋士們帶來了更加自由的棋局和新的思路。

「邃遠幽玄，越窺探越覺得圍棋的天地彌深彌廣。像我這樣凡庸的腦袋看來，只能認為圍棋是神的創造」，這是昭和棋聖吳清源在1937年寫下的對圍棋的理解。

就像柯潔說，「在AI面前，尊嚴是什麼？能吃嗎？我只知道，我喜歡下棋，我熱愛圍棋」。黑白交錯下，棋士們完成了對世界和自我的認知。