當前位置:
首頁 > 新聞 > 「AlphaGo之手」黃士傑:機器是沒有感情的,而我會微笑

「AlphaGo之手」黃士傑:機器是沒有感情的,而我會微笑

早在上世紀 60 年代,就已經有人開始對圍棋的計算機程序進行研究。當時還在威斯康辛大學麥迪遜分校讀計算機博士的Albert Zobrist引入了影響函數(influential function),為棋盤的每個空位計算數值,從而劃分黑白領域並為每個子的影響力打分。

圖丨w:白子影響函數;b:黑子影響函數;m:相互影響函數

1972 年,密歇根大學的Walter Reitman 和 Bruce Wilcox開始把人工智慧研究應用於圍棋。

從上世紀 80 年代末起,中國科學家也在相關領域做過一些工作,其中影響力最大的是陳志行和他的圍棋程序「手談」。從 1994 年到 1997 年,「手談」在兩個重要的國際計算機圍棋比賽應氏杯和 FOST 杯中共獲得了六個冠軍。

進入 21 世紀後,機器學習技術和蒙特卡羅樹搜索等方法開始被大量引入圍棋程序中,也讓圍棋人工智慧出現了飛躍。

2004 年,法國的B Bouzy 和 B Helmstetter發表論文,在評估某個行棋位置的時候,他們讓自己的蒙特卡羅圍棋程序隨機選取一些點,並以此為基礎完成一定數量的棋局,從而計算某個點引發的棋局最終結果的平均分數。

圖丨蒙特卡羅樹搜索

在此基礎上,法國計算機科學家 Rémi Coulom 開發出了圍棋程序 Crazy Stone。2008 年,Crazy Stone 在被讓 8 子的情況下戰勝了職業棋手青葉熏四段——這是計算機首次在讓 9 子之內戰勝職業棋手。

在那時,Rémi Coulom 也曾經指導了一名台灣師範大學的博士生,他叫做黃士傑。他從小學習圍棋,屬於圍棋業餘六段選手,還曾在台灣師大讀書期間創辦過圍棋社,並獲得大專杯圍棋賽冠軍。

圖丨黃士傑的博士論文

在讀碩士期間,黃士傑就將圍棋定為他的研究課題。為了寫程序,黃士傑有時在實驗室一待就是十幾個小時。他甚至還為了延續自己的研發成果而推遲兩年畢業,最終,功夫不負苦心人,他設計的程序不僅獲得了 19 路電腦圍棋金牌,更是擊敗了當時最強的圍棋程序 Zen。

在當時,這名計算機專業博士提出了一些新的蒙特卡羅樹搜索的啟發式演算法,包括應用了模擬平衡演算法(Simulation Balancing)和時間控制方法,極大地提升了程序的棋力。黃士傑用自己妻子的英文名 ERICA 給程序命名。

不過,這些程序都沒有達到職業水準。性能最好的 Crazy Stone 和 Zen 也只達到了業餘 5 段的水平。在那個時候,圍棋界一般認為,計算機戰勝職業圍棋選手的那天還遠遠沒有到來。

圖丨圍棋程序Crazy Stone

2012 年,在加拿大阿爾伯塔大學做了一年博士後研究員後,黃士傑加入了英國的人工智慧創業公司 DeepMind。當時 DeepMind 創建剛剛兩年,創始人是Demis Hassabis,Shane Legg 和 Mustafa Suleyman,早期投資人包括 Elon Musk、Peter Thiel 的 Founders Fund、以及李嘉誠的 Horizons Ventures。

2014 年 1 月,谷歌以 5 億美元的價格收購 DeepMind,那時的 DeepMind 尚未發布任何一個產品,只有一篇還沒有發表的論文。當時,黃士傑名列公司內兩位首席工程師之一。

DeepMind 早期希望通過機器學習和系統神經生物學理解智能。2014 年 10 月,公司發布了一款原型產品,可以讓計算機模擬人類大腦的短期記憶功能。

圖丨Demis Hassabis、David Silver和黃士傑

2014 年,DeepMind 組建了 AlphaGo 項目,用來檢測使用了深度學習的神經網路能否應用於圍棋。公司的科學家通過增強學習讓 AlphaGo 自己下了數千盤棋,矯正模型。

隨後,AlphaGo 又與 Crazy Stone、Zen 等圍棋程序下了 495 盤棋,只輸了 1 盤。為了增加難度,AlphaGo 又與 Crazy Stone,Zen 和 Pachi 下了讓四子棋,勝率分別為 77%、86%和99%。

2015 年 10 月,AlphaGo 隨後以 5:0 的比分完勝歐洲冠軍樊麾二段,這是計算機程序第一次在正式比賽中戰勝人類職業選手。

圖丨AlphaGo完勝樊麾二段

2016 年 3 月,AlphaGo 在普遍不被看好的情況下以 4:1 的比分戰勝了 18 次世界冠軍李世石九段。這標誌著計算機已經足以戰勝頂尖的人類圍棋選手,象徵意義可以媲美 19 年前「深藍」戰勝國際象棋大師卡斯帕羅夫。賽後,韓國棋院授予 AlphaGo 名譽九段證書,《科學》雜誌將之評為 2016 年十大突破之一。

在 2016 年 2 月, DeepMind 在《自然》雜誌上發表了一篇文章,介紹了自己的研究方法。他們在論文中表示,研究團隊使用監督學習的方法研究人類專家的棋局,同時也使用增強學習的技術讓 AlphaGo 自己和自己下棋。

5 月 23 日,中國·烏鎮圍棋峰會的人機圍棋大戰打響。最終,AlphaGo 三勝柯潔,也毫無懸念地戰勝了 5 位世界冠軍組成的聯隊。賽後,AlphaGo 獲得了中國棋院頒發的九段證書。至此,在圍棋領域,人機對戰的勝負不再有懸念。

實際上,為了這一天的到來,人工智慧圍棋學界實際上已經努力了將近半個世紀。

但毫無疑問的是,回看整個圍棋人工智慧發展史中,黃士傑的出現以及他之後的貢獻是最重要的轉折點之一。不僅是圍棋人工智慧技術的重要奠基者、AlphaGo 的幕後推手,他都直接參与「腦」的研發設計,甚至還作為「手」替 AlphaGo 在對弈中執子。

不論是在剛剛結束的烏鎮人機大戰中,還是去年在韓國首爾對陣李世石,我們都會留意到黃士傑非常「淡定」的坐著,盡量不去做落子之外的任何多餘動作。

李世石曾回憶道,黃士傑擔心他受影響,對弈期間面不改色,整個過程中就喝了一口水,甚至連一次洗手間都沒去過。黃士傑作為業餘六段的棋手,或許是在代替AlphaGo向對手表達應有尊重。

近日,DT君有幸對這位通常十分低調的人工智慧學者進行一次獨家專訪。這次的問答沒有太多談及技術,但有不少細節十分值得閱讀。

圖 | 黃士傑博士

問:能具體描述一下身為「AlphaGo之手」是一種什麼樣的感受?

黃士傑:AlphaGo 是 DeepMind 團隊努力不懈的成果,我有一種很強的責任感,絕對不能犯錯,因此對局時我始終努力保持冷靜。能跟頂尖棋手們面對面下棋我也感到無比的榮幸。

問:您個人更希望機器贏還是人類棋手贏?柯潔和李世石都曾坐在您的對面下圍棋,兩人給你的不同感受是?

黃士傑:作為 AlphaGo 團隊的一員,我當然是站在 AlphaGo 這一邊。不過李世石九段靠著「神之一手」贏下了第四局,我衷心為他感到高興,因為在比賽過程中,我感覺到他承受著極大的壓力。柯潔九段跟我都說中文,我們在對局前後都有簡短的交流,因此跟他對局我感到比較親切。

圖 | AlphaGo對戰李世石(上圖) & AlphaGo對戰柯潔(下圖)都由黃士傑博士執子

問:當初為什麼同意加入AlphaGo項目?是什麼吸引了您?

黃士傑:我熱愛圍棋,我在博士班期間所開發的圍棋程序 Erica 甚至是以我太太的英文名字所命名的。其實,Demis Hassabis(DeepMind創始人)與David Silver(AlphaGo項目負責人)在項目開始的時候,動機比我更強烈,我們三個人也就成為了 AlphaGo 的創始團隊。

問:在研發AlphaGo的過程中印象最深刻的一件事情是?

黃士傑:研發 AlphaGo 讓我印象最深刻的始終是 AlphaGo 不停止的進步,我們團隊是在把科學的力量發揮的淋漓盡致。也因此我也清楚的認識到圍棋的深奧,圍棋遠遠的難於我原本所想像的。

(圖片由谷歌官方提供)

問:在不久前的烏鎮圍棋峰會團體賽中,有一個小插曲,當時棋手周睿羊起身應該是去洗手間,而為AlphaGo執棋的您露出了「迷之微笑」,請問當時您在想什麼?

黃士傑:團體賽的氣氛是比較輕鬆的,我也可以清楚的聽到五位棋手在討論什麼。周睿羊九段所提出的下法似乎常常被其他四位棋手反駁,我覺得十分有趣,所以周九段起身時,我們互看了一眼,很有默契的互相微笑了一下。

問:對於很多人來說,AlphaGo宣布不再參加比賽是非常遺憾的,您怎麼看待?

黃士傑:我覺得 AlphaGo 在圍棋項目的歷史性任務已經完成了。AlphaGo 不但幫助了圍棋界在圍棋技術上的突破,也促進了計算機圍棋界與 AI 領域的進步。

未來,其他的圍棋程序可以站在我們所公布的 AlphaGo 論文基礎上繼續研發,普及圍棋並探索圍棋的真理。所以我並不覺得遺憾。

(圖片由谷歌官方提供)

問:一個充滿腦洞的說法是,您已經是AlphaGo本人了,那麼,您如何證明自己是黃博士而不是AlphaGo呢?

黃士傑:比賽中我不是微笑了嗎? AlphaGo 是沒有感情的,我會笑就證明我不是 AlphaGo(迷之微笑)。

圖 | 黃士傑博士(右)與浙江省圍棋協會秘書長盧俊和(左)

問:據說,AlphaGo 的研發團隊中僅有您一人會下圍棋,這樣的人員配置其實挺有意思的,DeepMind為何如此設置?

黃士傑:事實上,Demis Hassabis(DeepMind創始人)與David Silver(AlphaGo項目負責人)都會下圍棋,棋力大約都是業餘初段。Demis 與David 在1997年深藍(Deep Blue)打敗西洋棋王之後,就夢想著一起研發出超級圍棋 AI,DeepMind 被 Google 收購之後,我們三個人對計算機圍棋與圍棋的熱情,促使了 AlphaGo 項目的誕生。

我雖然在團隊中的棋力是最強的,但是研發人員的棋力並不是研發 AlphaGo 的必要條件,這也證明了 AlphaGo 的技術具備了很強的通用性,即使是圍棋初學者也可以根據我們的論文打造出自己的 AlphaGo。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

還能不能好好地打遊戲了?虛擬貨幣淘金熱導致全球GPU嚴重缺貨
高不高興,驚不驚喜!《紀念碑谷2》發布,徘徊於手游和VR之間
調查發現:窮人的孩子更容易性早熟
蘋果發布會恰似喬布斯在世,16年,從iPod到HomePod
大眾汽車「排放門」一波未平一波又起,奧迪頂級轎車又被捲入其中

TAG:DeepTech深科技 |

您可能感興趣

感謝信只會寫 Thank you,沒有回復你怪誰?
抱歉,就純白色的Air Force 1來說,我沒有任何情感可言
看了angelababy精緻的臉,才知道什麼叫做美的沒有靈魂
沒有這雙鞋,也就沒有了 Jordan Brand
沒有水,我們就失去了一切 《Ayo:A Rain Tale》向我們講述水的珍貴
Angelababy竟然又雙叒「整容」了,沒有一個不說丑!
被「結石姐」贊很酷,和Vin Diesel通宵打遊戲的吳亦凡告訴你:這個世界上沒有我帶不動的貨!
Fate/stay night,沒有金閃閃C媽必勝?saber不能與之匹敵!
Tulle socks非常寬鬆,沒有束縛的感覺,可以打造出一種朦朧的美感
Felipe Pantone:魔幻抽象未來主義,還沒有玩夠
沒有水,我們就失去了一切 《Ayo: A Rain Tale》向我們講述水的珍貴
LOL-Condi:自己表現得一般般,並沒有Carry!
美如Angelababy,除了寵,似乎也沒有別的辦法了
Bottega Veneta|沒有Logo,卻一眼可以認出!
LeCun再度回應卸任:我沒有被取代,Jér?me 的朋友爆料趣事
「我還沒有放下,但我想重新開始了。」see you in the hell,my ex!
揭秘陳可辛iPhone X春運大片:他的蘋果手機和你的其實沒有半毛錢關係
小夥伴們,有沒有吃過「biangbiang面」的!
陳可辛的iPhone X和你的iPhone X沒有半毛錢關係
張藝興:穿衣沒有Balance?我覺得你要被淘汰了