當前位置:
首頁 > 運動 > 深度特稿 人工智慧讓柯潔見到了「圍棋上帝」

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」

特邀作者/呂良忠(新浪6D)

編輯/宋建華

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」

△在AlphaGo平均30秒一步的節奏下,柯潔首局以1/4子落敗

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」


AlphaGo又來了。

5月23日,出現在烏鎮圍棋峰會的AlphaGo已是一名老手。在去年3月份對韓國棋手李世石的較量中,它讓人類驚訝到了要自我顛覆。

這次,它武裝了新的牙齒,在高於原版10倍計算能力的基礎上,靠深度學習的方式成長起來,挑戰圍棋的極限。

上午10:30開始的比賽,沒有持續更長的時間。下午3點10分, AlphaGo最終戰勝柯潔,比後者少用時近1小時20分鐘。

賽前,柯潔表示,此戰將抱著「必勝的信念和必死的決心。」

「其實並不是人類與人工智慧的一次對戰,而是科學家和圍棋選手在一次共同探索。」谷歌大中華區總裁石博盟這樣表示。

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」


「我會我用所有的熱情去與它做最後的對決,不管面對再強大的對手——我也絕不會後退!至少這最後一次……」——柯潔

上午10點30分,比賽正式開始。穿了一身黑色西裝的柯潔,第3手棋將棋子下在了左上角的三3上。這是被日本超一流棋手武宮正樹稱為「低到似乎就要從棋盤上掉下去了」的位置。

第7手,柯潔再次選擇點入右下星位的三3,有備而來的中國少年在首局選擇了「以彼之道,還施彼身」。

現代棋手下三3開局的已經很少,只有在對方以星位為依託兩翼張開難以掛角的時候才會選擇點入三3。但阿爾法圍棋多次在盤面很寬廣的情況點入三3,讓人類棋手重新思考圍棋。

柯潔對面,AlphaGo隱身在顯示器後面,發散著微光。

一年之後,人們已經很少能夠看到柯潔身上的那種桀驁不馴。2016年3月,當李世石和AlphaGo激戰未果敗局已定時,他曾在微博上公開約戰:「就算阿法狗戰勝了李世石,但它贏不了我。」

彼時,何止柯潔,幾乎所有的圍棋職業選手都不相信,機器能夠在這項史上最複雜的遊戲中戰勝人類。

但李世石的敗局,讓所有人都驚訝地張開了嘴巴。

今年年初,AlphaGo再出江湖,化身Master,在弈城和野狐上取得60局線上快棋的連勝,未嘗敗績,一大批世界冠軍倒在Master刀下,包括柯潔四戰全墨。

中國圍棋隊總教練俞斌在一年後也改變了自己的看法,他承認去年三月人機對戰前,大家都認為是阿爾法圍棋一勝難求。可今天,大家反過來覺得是柯潔一勝難求了,可以說,整體上阿爾法圍棋已經超越了人類棋手。

賽前預測,中國圍棋世界冠軍古力表示,柯潔獲勝1局的幾率為10%。而李開復更為乾脆,給出了0%。

發布會上,早就嘗到過對手強大的柯潔只是說:「我將盡全力爭勝,一決勝負,抱有必勝的信念和必死的決心,不輕易言敗。」

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」

△柯潔第一手下在了右上角的小目

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」


「可它始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛。對它而言...它的熱情也只不過是運轉速度過快導致CPU發熱罷了。」 ——柯潔

為了放鬆心態,柯潔在比賽前兩天就早早來到烏鎮,和父母遊玩。

賽前90分鐘,柯潔先見到了AlphaGo之父哈薩比斯。這是兩人第一次見面,「我還沒有見過他。」哈薩比斯笑著說。

這項由中國圍棋協會、谷歌、浙江省體育局共同舉辦的特別賽事,勝者將獲得150萬美元的獎勵,敗者也將獲得30萬美元的參賽費。

3月19日央視的《朗讀者》節目中,柯潔九段朗讀了《哈利波特與死亡聖器》最後一個節選,內容是哈利波特與伏地魔第一次也是最後一次正面對決,柯潔表示這段文章要「獻給未來的對手」。

直播畫面上,柯潔面色充血。第23手拆邊後,他暫短離座去倒了一杯水。第24手,AlphaGo張揚的把引征補在了O9,而人類棋手在這種地方一般會選擇把黑一子乾淨地提掉,因為味道好,利用少。

在研究了AlphaGo的全部與人類棋手的對局後,棋盤前的柯潔撓頭笑了。

柯潔了解對手,並不僅僅在棋盤上。

與IBM 在上世紀打敗國際象棋大師卡斯帕羅夫的深藍不同, AlphaGo背後是一套神經網路系統,由谷歌 2014 年收購的英國人工智慧公司 DeepMind 開發。它不是一台超級計算機,而是一個由許多個數據中心作為節點相連,每個節點內有著多台超級計算機的神經網路系統。就像人腦,是由 50-100 億個神經元所組。

AlphaGo的系統還借鑒了一種名為深度強化學習的技巧。強化學習的靈感來源於心理學中的行為主義理論,即有機體如何在環境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,產生能獲得最大利益的習慣性行為。

此外,AlphaGo 也借鑒了蒙特卡洛樹搜索演算法,在判斷當前局面的效用函數和決定下一步的策略函數上有著非常好的表現。

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」

△哈薩比斯(左)、柯潔(中)、施密特在比賽前見面合影

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」


「新版AlphaGo告別了僅靠輸入數據來進行計算的套路」,在高於原版10倍計算能力的基礎上,它一直都在靠完全的自我學習和自我對弈來積累經驗。換句話說, AlphaGo已經是自己的導師,而和柯潔比賽的AlphaGo版本並非「自學版,AlphaGo仍舊需要學習人下棋的經驗。」——哈薩比斯

在比賽進行到半小時後,雙方的時間慢慢拉開。到上午封盤為止,柯潔的思考時間大概是AlphaGo的三倍。

比賽的裁判長、中國圍棋協會主席王汝南表示,就封盤前來看,他不認為AlphaGo有優勢。

清華AI團隊則表示,棋局進行至66手柯潔勝率42.97,白棋接近讓二子優勢。至86手柯潔勝率大幅上升至45.10,落後9.5目。

中國圍棋隊總教練俞斌此前在接受採訪時表示,通過認真研究去年李世石人機大戰的五盤棋和這次「大師」的60勝局,中國圍棋隊對AlphaGo有了更深的了解。AlphaGo現在唯一的弱點,就是在對李世石第四盤中所表現出來的「無中生有」的失誤,我們把這種失誤稱為「開放性計算的誤算」。這種誤算,阿爾法圍棋在對李世石第五局的角上計算也出現過。

但被俞斌忽略的是,這次來到柯潔家鄉浙江的AlphaGo,也是只「新狗」。

身為業餘5段的國內知名資料庫專家梁敬彬透露,新版AlphaGo是根據圍棋的基本規則,通過數以億萬記盤的對弈,自我總結完善,達到了這樣的水平。而完成這個自我訓練的時間,不過短短几個月。

如果不了解AlphaGo 背後的神經網路系統,你很容易以為它就是那個擊敗李世石的同一AlphaGo。

AlphaGo 採用了一種新的學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網路,將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分布。然後,訓練出一個價值網路對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。

「最後,新版的AlphaGo 產生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往複。」梁敬彬這樣寫道。

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」

AlphaGo背後的神經網路系統

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」


「其實私底下我已經與朋友家人說了很多次這樣的想法,現在的AI進步之快遠超我們的想像。像國產的絕藝、日產的ZEN雖然和AIphago還有著較大差距,但已經表現出超強的實力了...我相信未來是屬於人工智慧的。」——柯潔

和夢百合杯決賽對陣李世石時一樣,柯潔對局時習慣揪頭髮。老前輩華以剛八段說,柯潔平時髮型比較爆炸,今天倒顯得很順溜。

下午兩點,在新浪演播室錄節目的聶衛平判斷柯潔劣勢。黑棋追上了一些,但棋盤也在逐步變小。

至150手,黑棋已難逆轉。在距離比賽結束還有139手棋的時候,研究室里的眾多世界冠軍已經判定柯潔小敗成定局。

可怕的是,眾高手並沒有發現柯潔有明顯的失誤。

一代宗師吳清源說過:「圍棋的目標應該是中和。只有發揮出棋盤上所有棋子的效率那一手才是最佳的一手。每一手必須是考慮全盤整體的平衡去下——這就是六合之棋。」

AlphaGo的一些下法,在人類看來是虧損的,但隨著棋局的發展,這些下法可能變得不那麼壞,甚至可以成為用意深遠的好棋。人工智慧正是立足於發揮盤上已有棋子的效能去思考以後的著法,在對全盤整體的認知和掌控已足以讓人類反過來向它學習。

在今年清明節假期,馬化騰、馬雲和李彥宏同時出現在中國(深圳)IT 領袖峰會,探討人工智慧的話題。期間,馬雲對AlphaGo式的人工智慧提出了尖銳的質疑: 「大家把 AlphaGo 說得天花亂墜,很恐怖的樣子。我個人覺得,So TM What?」

同在台上的馬化騰事實上反駁了馬雲的質疑,他表示AlphaGo的出現極大擴展了人類的認知範圍和對人工智慧的理解。研究這一過程本身會給人類帶來大量的經驗和理論。

事實上,騰訊旗下的人工智慧棋手「絕藝」作為後起之秀,在網路上也11次擊敗了柯潔。

谷歌大中華區總裁石博盟在解釋為什麼AlphaGo與人類棋手對弈如此重要時表示,今天的結果是人工智慧科學家和世界各國的圍棋頂尖選手共同探索的結果。在這個過程中,其實並不是人類在與人工智慧對戰,而是科學家和圍棋選手在共同探索。

「AlphaGo的每一次升級,都意味著人工智慧科學家對『如何在有限信息下做出更優選擇』這一問題有了更深刻的認識,這正是讓人工智慧理解人類、產生思維的關鍵。」石博盟如是說。

人工智慧從發軔只不過60年,以歷史的眼光來看不過一瞬。它就像美國詩人e. e.卡明斯詩中的初生馬駒,既懵懂無知,卻又在感知一切。「摺疊的世界」在它面前一點點展開,有無數的領域等著它去學習、發掘。

一切才剛剛開始。

深度特稿 人工智慧讓柯潔見到了「圍棋上帝」

△柯潔在賽後發布會上說,AlphaGo上次還很接近人,這次越來越接近「圍棋上帝」了

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 北青深一度 的精彩文章:

失聯的賭徒大學生:赴澳門豪賭欠下巨債 曾是校學生會主席

TAG:北青深一度 |

您可能感興趣

博鰲特稿 旭輝規模弧度
特稿 永遠的李嘉誠
特稿:從漢諾威工博會看全球科技競爭熱點
特稿|清華晶元往事
特稿 | 黃永玉和木心告訴你怎樣成為大書家
讀友專欄 | 蘇林:說不盡的女人——三八節特稿
特稿:「冰上絲綢之路」構築人類新夢想
理論特稿:中國「百年宏偉藍圖」的發展演變
特稿:清華晶元往事
特稿 | 地下女團養成記
劉越特稿︳埃梅里讓阿森納踢得更開放
特稿於至簡境修道,存達觀心揮毫——訪金仙觀主持賈慧法道長
中國矽谷:松山湖邊的機器人夢想|特稿
【AI女神節特稿】你不能不知道的13位中國人工智慧女性
特稿:進口衝擊等加快製藥行業洗牌 強者將恆強、更多的會「消失」
『兩會特稿』不搞「花拳繡腿」、不做「人工盆景」 楊國強的鄉村振興實幹作風
汾陽人的春節 特稿
清明特稿‖石祿生:憶念先祖話收藏
特稿∣木棍上的舞蹈
【特稿】卷地長風思悠悠——和毛澤東有關聯的八個平山人