柯潔深夜發文:AI是唯一一個在棋盤上把我殺哭的啊!
撰文 | 呂夢
微信 | ai_xingqiu
網址 | 51aistar.com
昨晚,柯潔在微博發布了頭條文章,談了自己與騰訊人工智慧「絕藝」下讓兩子棋的感受。
以下為柯潔微博長文內容:
今天執黑和騰訊的AI 絕藝下了一盤被讓兩子(黑貼6.5 大約等於讓先倒貼目)贏了一盤。
前幾天第一次嘗試輸了,被大肆報道了一番...今天贏了,卻沒有任何報道。現在的人呀...真是喜歡搞個大新聞啊...
其實穩著下優勢還是蠻大的...主要是第一次被AI讓一手,真的有一種說不出的滋味...苦楚?無奈?可我還是想去挑戰。
前幾天和很多棋院小夥伴聚會,大家都很開心。除了敘舊聊得最多的就是AI。還有就是我們棋手到底和AI有多大的差距?這不僅是廣大愛好者最關心的話題,其實也是我們最關心的話題。
其實聊這個話題的時候,我的內心是極其沉重的。你們可能也懂。AI到底給了我多大的傷害——它可是唯一一個在棋盤上把我殺哭的啊!!
但自從慢慢接受了以後,這又是不得不去面對的一個話題...
我經常會回想起兩年前的我,那個把熱血漫畫主角套進現實中、那個極度中二的圍棋少年。所有決賽的對手都是要擊敗的boss——而alphago就是最終暗黑大boss!他是壞人!(笑)熱血漫畫的主角一定會幹掉最終boss,我一定會贏!然而...結局我沒贏,中二的少年沒贏。我輸了,而且輸的很徹底。
現在雖然也沒到油膩的年紀,但心態確實已經發生了很大變化,油膩到可以放下尊嚴去向AI虛心討教了。
那麼到底,我們職業棋手AI有多大差距呢?
首先是心態
我覺得,我在和人類下棋的時候是英勇無畏的。因為老子棋就是最強的!(笑)
和AI下。。。我這裡會不會被干漏啊。。。哎呀我的棋怎麼這麼薄啊。。。哎呀我的實地怎麼這麼少啊。。。像一個60歲的老母親擔心自己遠遊的孩子一樣擔心自己的棋,最後結局一般都是哎呀不行了不夠了認輸鍵在哪我要認輸。
棋未先行心態已崩
但若是以一個平和的心態去面對。
我覺得差距,不會有想像中那麼大。
具體有多少差距,我保險點的說,絕對不會超過三子。
我不喜歡放空話,我希望登到有AI真的到了alphgo zero的水平的話,我可以放下尊嚴去下正式的讓子棋,給愛好者們看看到底又多大差距。
在AI面前,尊嚴是什麼?能吃嗎?我只知道
我喜歡下棋。
我熱愛圍棋。
2017年5月27日,柯潔九段對陣DeepMind人工智慧AlphaGo,比賽從上午10:30開始,一直激戰到下午14:08,最終柯潔投子認輸,AlphaGo執黑中盤勝。
至此,中國圍棋峰會人機大戰三番棋結束,柯潔0:3負AlphaGo。
這是繼2016年3月AlphaGo以4:1總比分戰勝圍棋世界冠軍、韓國職業九段選手李世石後,在慢棋規則中戰勝的另一個圍棋世界冠軍。
與李世石對戰的AlphaGo1.0版本不同的是,2.0版本的AlphaGo已不再拘泥於學習過的3000多萬人類棋譜。
隨著演算法的完善和不斷的自我學習,AlphaGo已經從2016年對人類棋手的模仿,到如今「無限接近完美的人類棋手」。
在25號三番棋第二場比賽中,下午1:37,第154步,柯潔投子認輸,AlphaGo在中盤執黑子獲勝。
峰會主廳里一片沉默,大屏幕上柯潔復盤抓子的聲音清晰可聞。幾分鐘,隊友唐韋星迫進入演播室與柯潔復盤,演播室的麥克風還未關閉,裡面傳來柯潔的聲音:我算錯了。
這場比賽的中盤階段,柯潔用了很多激進的打法,根據AlphaGo的計算,本局比賽前100手階段,柯潔的贏面很高,人類和機器的勝率從未如此接近。
「本來覺得挺看不清的還想著柯潔是不是有點機會?但阿爾法全看清了」, 雖然很惋惜,但唐韋星還是對柯潔的表現讚賞有加,「今天這棋已經下的不是一般的好了」。
柯潔的優秀逼出了AlphaGo的極限。這個極限,正是來自於AlphaGo的「自學能力」。
AlphaGo主程序員David Silver在烏鎮圍棋峰會第二天的演講中表示,「我們能獲取到的最好的數據不是來自於人類,而是來自AlphaGo自己。我們讓AlphaGo做自己的老師,利用其強大的搜索能力自己生成數據,再用生成的數據讓下一代的AlphaGo學習」。
通過融入策略網路與價值網路,今天的AlphaGo2.0已經從傳統電腦「固定」的程序邏輯中跳脫出來,與自己的對弈中積累了更多經驗。
首先,AlphaGo通過與自己下棋,訓練一個新的策略網路,算出那些有戲的落子方案;然後,再利用與自己下棋時的贏家數據來訓練價值網路,一邊推算一邊判斷局面,預測和自己下棋的棋局中,哪一方是贏家。
當這一過程重複多遍時,就能得到全新的策略網路和價值網路,再如此循環,導致更強大的AlphaGo誕生。
DeepMind 的聯合創始人兼 CEO Demis Hassabis
DeepMind 的聯合創始人兼 CEO Demis Hassabis稱,「AlphaGo最強大的地方並不體現在具體某一手棋或者某個局部的變化,而是它在每一局棋里所展現出來的獨特視角。在它的世界裡,沒有什麼先入為主的概念,也沒有什麼必須要遵守的規則,從第一步開始,AlphaGo就在計算每一步的勝率,進而選擇最佳落子位置。」
這種有違人類棋手經驗的棋法,成就了機器的完美棋局。
2016年3月9日,AlphaGo對戰李世石勝利後,柯潔在微博寫道,「就算阿爾法狗戰勝了李世石,但它贏不了我。」
今年年初,在Master橫掃中國棋壇連勝60場後,柯潔改變了自己的看法,「人類數千年的實戰演練進化,計算機卻告訴完美人類全都是錯的。我覺得,甚至沒有一個人沾到圍棋真理的邊。」
5月24日,圍棋峰會人機大戰的第二天,Deepming團隊預測,2.0版本的AlphaGo比李世石版本提升了三子。這個差距意味著什麼?用柯潔自己的話說,就是「對手連續讓你下三步……又像武林高手對決讓你先捅三刀一樣……」
或許,人類棋手與AlphaGo的差距,遠比人類棋手之間的差距大的多。
25號,在第二場惜敗AlphaGo之後,柯潔對這台會發熱的GPU 顯然有了更多理解,「它很多的思想、理念,在改變我們最初對圍棋的看法,沒有什麼是不能下的」。
柯潔在微博中寫到,「現在雖然也沒到油膩的年紀,但心態確實已經發生了很大變化,油膩到可以放下尊嚴去向AI虛心討教了」。
今天,人類從與機器的對弈中探索新的可能,到開始學習和借鑒它的下棋思路。這樣的結果除了把人類棋手推向更加焦灼的境地,也為棋士們帶來了更加自由的棋局和新的思路。
「邃遠幽玄,越窺探越覺得圍棋的天地彌深彌廣。像我這樣凡庸的腦袋看來,只能認為圍棋是神的創造」,這是昭和棋聖吳清源在1937年寫下的對圍棋的理解。
就像柯潔說,「在AI面前,尊嚴是什麼?能吃嗎?我只知道,我喜歡下棋,我熱愛圍棋」。黑白交錯下,棋士們完成了對世界和自我的認知。
如果你是
AI行業人士
如果你想了解最前沿的AI技術和場景應用
一網打盡AI界前瞻科技和深度報道
如果你想持續拉升逼格
歡迎關注AI星球,並轉發朋友圈為我們打Call哦~~
你們的支持才是我們創造優質內容的不竭動力~送你花花
TAG:AI星球 |