當前位置:
首頁 > 最新 > 人機大戰:給柯潔提點什麼建議能提高戰勝阿爾法狗的機會

人機大戰:給柯潔提點什麼建議能提高戰勝阿爾法狗的機會

(以下建議是一個多月前寫出來的,但現在看起來,可以說仍有現實意義,很多說法被證明是正確的。添加了「補」的文字,是根據最新的情況補充的。)

坦白講,用不著我們提什麼意見,現在棋院肯定組織了各方面的專業人士幫助柯潔九段準備比賽,絕藝應該也是出了力的陪練。而且如柯九段自己說,「在棋上,什麼大風大浪我沒見過?」

所以,我們這裡講的「給建議」並不是真的要給柯潔九段提什麼建議,而是作為大家討論的一個話題,熱鬧熱鬧,跟棋友們互動一下。並沒什麼實際用處。

(1)要用「平常心」來下棋,不要用找BUG的心態去下。

這一點國際象棋大師卡斯帕羅夫在輸給深藍後就提到過,李世石九段在反思輸給AlphaGo的過程時也提到過,柯潔九段在樂視直播時也多次提到李世石九段應該「正常去下,別用測試的心態去試AI會不會應對偏招怪招」。說的時候挺清醒,重要的還是做的時候清醒。莫要忘了初心。

我這裡再次強調一遍,棋手們接觸科學家和技術專家比較少,也許並不了解這個群體有多麼聰明。像DeepMind這種領域世界最頂尖的研究團隊,那裡面都是些什麼人?都是腦子最聰明最靈活的「人尖子」,而且他們是群策群力團隊研究,另有其母公司總部的技術、人員和資金支持,引領當今最熱門研究領域的最頂尖研究方向。

想輕易糊弄這群人?恐怕不太可能。你能想到的那些什麼打劫、死活、對殺、模仿棋、官子騙招、布局套路打狗棒之類的陷阱,這些說法在網路上廣為流傳,講了好長時間了,一年多以來一直在講,DeepMind團隊的這群最強大腦會沒有準備?

(補:David Silver —— 「新版本的AlphaGo, 已經過幾百萬次的自我訓練,並在檢測舊版本弱點方面表現出色。也因此,新版本的AlphaGo可以讓舊的版本三個子。但當AlphaGo與從未對弈過的人類棋手對局時,這樣的優勢就不復存在了,尤其是柯潔這樣的圍棋大師,他可能幫助我們發現Alphago未曾展露的新弱點。這樣的衡量標準是無法比較的。對於本周的第二輪和第三輪對局,我們拭目以待。via. 樊麾)

事實上,AlphaGo在第一次人機大戰之後,特別增加了一個對抗訓練的版本,也就是專門搞一個特別版本的AlphaGo,它是做什麼用的呢?專門搞些陰招怪招陷阱全套,訓練AlphaGo應對這種情況的能力。因此在跨年六十盤棋的時候,我們看到的就是「老哥,穩!」

根據最新的信息,隨著包括使用TPU和演算法更新等方面的提升,目前AlphaGo的版本更新速度已經比早期快了非常多。從頭訓練一個新的AlphaGo版本也只需一周左右

所以,別耍小聰明。BUG肯定還有,但若用故意找BUG的心態,用「騙招」心理下棋,最大的可能還是BUG沒找到,棋已經輸飛了。

在跨年六十盤棋時,有兩盤是黃博士點錯了位置,落子不是AlphaGo建議的位置,搞得形勢一度很微妙,但憑藉圍棋AI的強大棋力,仍然可以力挽狂瀾,取得勝利。在強大的實力面前,什麼狀況都hold住。

【我不知道柯九段是否準備了模仿棋的套路。我個人不太建議下模仿棋

前些時有人問李世石九段為什麼不下模仿棋對付AlphaGo,李九段說,「也許模仿棋(對戰勝AlphaGo)有用,但我不想下那玩意」。確實,驕傲的小李在第四局贏了之後,在大貼目的規則下,第五局主動要求執黑,想要黑白各贏一盤。我們都知道,棋手們一般會覺得,大貼目下,執黑會虧一點。但李九段就是要這麼干。這種驕傲的性格不屑用模仿棋。

我倒不是從這個角度不建議柯潔九段下執白模仿棋的我個人是認為,執白模仿棋恐怕是沒用的,對付不了AlphaGo。我並沒有什麼實在的根據。我只是從谷歌公司一般的行事風格作出推理:如果連嚷嚷了這麼久的執白模仿棋套路,DeepMind方面都沒準備,那麼還搞什麼第二次人機大戰啊?這不是擺明著送菜嗎?DeepMind僱傭的是一群生甘藍嗎?

其實模仿棋也是需要棋力支撐的,這一點要給棋友們講明白。模仿棋的妙處在於——什麼時候不模仿!這不是什麼人都能掌握好的。從棋德來說,至少現在認為下模仿棋並不算有違棋德的行為但!是!如果在正式比賽中下模仿棋,而且是很多步的模仿棋,那麼通常會被認為「這個人下棋很猥瑣」

假如柯潔九段在前兩盤都輸了的情況下,第三盤棋下執白模仿棋,或者只要有執白機會便先下一次模仿棋,那麼,從找BUG的角度,或許有一定價值,但是在圍棋技藝和圍棋文獻的貢獻方面,則幾乎等於零,也是浪費了本就不多的人機大戰正式比賽的一盤棋的機會。我個人儘管不會聲討或者譴責這種做法,畢竟這也是棋手的個人選擇,外人沒什麼資格干預,不過從感情上,我不欣賞這樣下。更何況,不管用的可能性大,等於是賠了夫人又折兵。

(補:昨天,擔任人機大戰裁判的楊爽二段在接受採訪時就說:「第二盤棋柯潔執白棋,原來是希望他可以下模仿棋,看阿法狗有沒有好的方法來應對,但我諮詢過谷歌的工作人員,他告訴我,之前他們已經試過了,模仿棋對阿法狗是沒有用的。」via. 城市圍棋聯賽)

總而言之,用平常心下,就像在跟一個頂尖的人類棋手下棋,該怎麼下怎麼下就是了。柯潔九段自己講,全力爭勝,決不放棄,同時也知道對方的棋力高,自己有心理準備。這就很好。

(2)要穩、要有耐心,不要浪。

高手們都有自己的風格,有自己的個性,這也是人類高手下棋的魅力所在。但是,這也意味著,高手們的優點和缺點同樣明顯。

比如說,陳耀燁九段性格沉穩,精於細節,把握實地能力強,但在應用外勢上就差一些;朴廷桓九段性格沉靜,在防守反擊方面能力很強,擅於收束和平穩推進,但要他主動進攻去秀刀,面對同等級的高手玩狠的,大砍大殺,多半是竹籃打水;時越九段心有猛虎,棋風剛猛善殺,積極進取,不喜退縮隱忍,於是碰到能攪能搞的,往往遭到反噬,好局下崩;古力九段性格開朗,為人豪爽,巔峰時期氣魄十足,行棋瀟洒,力量無比強大,然而官子能力,簡直一把鼻涕一把淚。人無完人。

柯潔九段的特點是棋感好,計算快,算路深,死活題強,大局判斷強,布局中盤都沒什麼問題,後半盤也能攪,如果冷靜下來,官子也經常有妙手......這麼一說,好像是個沒什麼缺點的棋手?

並不是!柯潔九段的官子浪是廣為人知的。我給棋手們講過不少盤柯九段的棋,裡面官子浪輸出去的不是一盤兩盤,即使沒輸出去的那些棋,官子有時也浪得人膽戰心驚。唐韋星九段曾點評,如果柯潔不浪,那就沒辦法對付了。此言很妙。

無論從棋的內容還是對局時的表情動作上,又或是從平時的言談舉止和行事風格上,我們都可以看到,柯潔九段不是一個沉穩老練、喜歡反覆斟酌以求萬全的個性,隨著心意順手而為、順口一說,這樣的情況屢見不鮮。對局時表現的就是隨手棋和官子浪,在局面不行的時候,「唉,輸飛了,這棋已經進入垃圾時間了」的心態也偶爾會影響行棋,失去一些逆轉的機會。

冰凍三尺非一日之寒,這種事要改也不是短期內可以做到的。再者說,優點缺點共同構成了一個人,在很多棋手看來,柯潔九段這樣的個性也是他魅力的一部分。但是,針對這次比賽,適當地注意下這方面的問題,總歸是有益無害的。

我們都知道了AlphaGo的布局天下第一,能撐五六十手不落下風是很難的事情。那麼五六十手之後,假如落了下風,難道就放棄了嗎?或者是用喪氣的心態勉強應付嗎?當然不是,曾經以「潛伏」ID苦練棋藝最後一飛衝天的柯九段其實是個骨子裡不服輸的頑強棋士。激發鬥志,不到最後關頭,決不放棄拼搏,每一手棋都要盡最大努力,這是他完全可以做到的,不是過高要求。

柯九段的官子浪往往是形勢大好的情況下發生的。這次可能不太會發生這種情況。但是,萬一,比如AlphaGo打勺了,柯九段形勢不錯,那麼要戒驕戒躁,小心謹慎,珍惜機會,別浪。

(3)要有主心骨,知道自己要下什麼樣的棋,別聽些亂七八糟、不知道靠不靠譜的建議。

哪怕這個建議是什麼AI專家給的,也不一定要聽。我覺得,柯九段還是專心下好自己的圍棋,用自己的圍棋來迎戰代表或許是當代棋道最強者的AlphaGo,這樣的三番棋才更有意義,不僅是對棋界和觀眾,也是對柯九段自己。

靠一些小門道找BUG,這就真是完全把自己定位成「程序測試員」了。柯九段當年曾在微博上寫下「不忘初心」。柯九段的初心是作圍棋的強者,而不是作程序測試員。我的意思不是說程序測試員不好,角色不重要,而是說,純粹做程序測試員的事不該是柯九段重點考慮的問題。

(補:第一盤刻意用了兩個開局(點)三三,我個人認為,這就有點過了,這並不是柯九段自己的棋,最後被證明,這種針對性的戰法沒有什麼效果,反而讓自己有些手生,限制了更好的發揮,這一點上,江鑄久九段也提出來了。)

(又補:我看到有人向棋手建議搞什麼「過分手」或者「設下殺大龍的天地大殺局」,增加AlphaGo的剪枝難度,等等,這都是沒什麼用的建議。且不說人類棋手用這個辦法更可能犯錯下崩,就是真下了,AlphaGo也可以輕鬆化解。TA沒必要與你戰鬥死磕,可以很清晰地轉身取捨,你沒有辦法。再者,就是真殺起來,Master的六十盤棋里沒有?棋手只能敗得更慘,毫無用處。下自己的棋就好。)

(4)張弛有度。

AlphaGo的實力有目共睹,即便輸了,相信柯九段也不會受到苛責,——因為別人上也基本不會更好了。

那麼,比如說第一盤棋輸了,第二盤棋依然要輕裝上陣,不要有其他心思。前兩盤棋的結果不論如何,第三盤棋就當第一盤去下。別對上一局的失招念念不忘。

但是,也不能覺得「反正對手太強,也贏不了了」,就隨便下下吧。機會難得,要珍惜。一個棋手一生能有幾次這麼重要的棋戰?毋庸諱言,跟這三盤棋相比,世界大賽的決賽分量也要輕很多,萬眾矚目。假如能贏一盤,比兩三個世界冠軍可重要多了。

柯九段自己表示會全力以赴,我毫不懷疑柯九段的決心。不過,有時候,懈怠是在不知不覺中產生的,特別是面對過於強大的阻礙時,人的心理往往會發生不由自主的變化,產生一種「結局無法挽回」的宿命感,於是就「認命了」,不抱希望了,氣勢上就頹了。沒有了「一爭」的心態,這就是「弛」。

要克服這點,可以從家人的陪伴中尋找力量,從朋友的鼓勵中獲得力量,從其他人的事迹中汲取力量,但最重要的是——戰勝自己,超越自己,從自己的內心找到力量。

假如能夠做到這一點,那麼無論比賽的結果如何,柯潔九段都是最大贏家。

(5)【這點是最新補充的】用時要合理:

昨天到了最後還剩十多分鐘,這樣是吃虧的。布局階段(前五十手)要特別捨得花時間,前一百手該捨得花時間的時候也要捨得,因為基本上這個時候就已經決定勝負了,人類棋手很少有能撐過這時候的。

柯九段可能還有跟人類棋手下棋時形成的一些習慣性用時策略,比如布局和前半盤省點時間,給中後盤決戰時留下大量的思考時間,因為這時才決定勝負。

跟AlphaGo下棋,用不著等到那個時候。第一盤棋,右下和左上之後,柯九段的黑棋尚能維持一個還不錯的局面。但是,從白48開始,至黑55的打入,在這裡黑棋左下角的掏角行動就比較冒失,至白82跳起吃住,白棋已經小有優勢,儘管黑83斷到一下挽回了目數上的一些損失,單被白84果斷脫先在右上搶先打入,簡單撈邊空處理,這個棋就已經不好下了。最後,黑97強行做大,白98佔據上邊的要點,黑99開始拚命強吃未果,至白114,白棋安然處理,黑棋吃崩了,這盤棋已經結束。

這個時候,比賽剛進行了兩個半小時!要知道,這次比賽是每方三小時保留時間。勝負都定了,自己的保留時間還沒用完呢。

所以下這麼快乾嘛?不要被機器帶節奏,它平均每手棋40秒左右,因為它改進了演算法,使用了TPU,運算量是之前的1/10,穩定性和準確度卻更好。機器可以更快,棋手呢?柯九段平均每手棋用時1分鐘左右,有必要這麼急嗎?

後面就算有時間,比賽也已經進入「垃圾時間」了。最後收了一百好幾十手官子,儘管柯九段的拼搏精神和頑強鬥志值得讚美,目數差距也拉近了很多,但其實我們都知道,這個時候拉近目數差距的意義已經不大,AlphaGo是習慣性退讓。這時候的時間還有什麼用呢?

李世石九段在接受採訪時,也談到了這個問題,建議柯潔用時更合理一些,前面要捨得花時間想。如果前面一百手之後棋就已經不行了,後面的時間剩下能幹什麼?指望著AlphaGo下出DeepZenGo的官子昏招?


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 慶豐棋聖木可三吉 的精彩文章:

王思聰拿柯潔曾經說過的「贏不了我」回懟 並不佔道理
新版AlphaGo硬體資源更少 第二局柯潔要用好時間
如何評價柯潔九段其棋其人-第三篇 歷史地位
曼聯0-2客場負阿森納 穆里尼奧首次在英超輸給溫格

TAG:慶豐棋聖木可三吉 |

您可能感興趣

坐禪能成佛? 星雲大師提點應健全思想
最後的機會,世界盃決賽法國VS克羅埃西亞提點分析及重心推薦
想要成器?星雲大師提點雕琢自我的方法
高手也得靠提點,前體能師講馬拉多納如何指點梅西自由球
紛亂的人生該怎麼辦? 星雲大師提點要亂中求序
甄嬛傳:寧嬪並不喜歡甄嬛為什麼還是要提點甄嬛小心玉隱
這才是師徒!蘭帕德贏球後不忘力挺穆里尼奧,還幫其提點球員!
對想要種植「軟棗」的提點建議,供參考
今日提點:兩大豪強分心歐戰 貝蒂斯謹防受熱
南懷瑾老師對靈塔的設計也有所提點
摩羯座財運提點,功夫不負有心人?
把開發商裝的入戶門給換了,是小題大做嗎?幸得建材商朋友提點!
朱元璋臨終之前提點朱允炆,結果他沒聽懂,否則朱棣根本沒機會登基
人生苦甘先後 星雲大師提點要津
狡兔有三窟 星雲大師提點人生也需必備三窟
人生要享受什麼 星雲大師提點應學習享受自我
蜈蚣穿鞋? 星雲大師提點修行人要剋期取證
全是乾貨:德甲9場比賽戰意表,一場詳解,傳足提點
蘭森聲樂名師:好老師的提點才是事半功倍的捷徑
新手養肉技巧提點,必學的小經驗