「深藍」專家訪談:征服國際象棋後的20年,AI 取得了哪些發展?
編者按:很多人在關注柯潔對戰AlphaGo時,或許都會聯想到20年前的Kasparov對戰「深藍(Deep Blue)」,當時的那場世紀之戰大概比現在更加轟動,因為正是「深藍」開創了正式比賽中機器戰勝人類象棋冠軍的先河。儘管很多人質疑「深藍」戰勝Kasparov並非全憑下棋謀略,而是摻入了一些作弊手段,但不可否認的是,經過費城慘敗後它確實進步飛快。那征服國際象棋之後,IBM的AI技術團隊又有了哪些發展呢?下面我們來看看Scientific American上一篇對IBM「深藍」團隊主創Murray Campbell的專訪,原文:20 Years after Deep Blue: How AI Has Advanced Since Conquering Chess。
二十年前,IBM開發的「深藍」計算機經過六場比賽,成為世界上首個擊敗世界象棋冠軍的機器,這一新聞當時可謂震驚了全世界。很多人和Kasparov一樣,質疑超級計算機以謀略戰勝頂尖棋手的可靠性,甚至引發了社會輿論對IBM涉嫌利用作弊手段贏得人機大賽勝利的指控。然而,接下來的幾個月和幾年裡呈現在大眾面前的事實證明,1997年5月的那場大戰確非常具有顛覆性,堪比一場激烈的拳王爭霸賽,不過,顯然這場比賽充滿智慧的火花碰撞。以前經歷的艱難進步和費城大戰的慘敗,最終都為後來的絕地逆襲打下了基礎。
數十年來,計算機科學家都把國際象棋作為AI進步的標杆。早在上世紀70年代後期,下國際象棋的計算機就已經出現,不過,直到十年後的1989年,卡內基梅隆大學的研究生團隊才開發出了第一台象棋計算機「深思(Deep Thought)」,並在後來的一場常規賽中擊敗一位頂尖象棋選手。但是這此成功壽命不長,同年晚些時候,Kasparov再次以2比0的成績輕鬆擊敗「深思」。IBM對C.M.U.團隊的這項技術留下了深刻印象,以至於後來還組織其研究人員繼「深思」之後又開發出了初代「深藍」計算機。「深藍」研發團隊後來在1996年費城舉辦的一次人機對戰中以1比6再次輸給了Kasparov,不過,令他們欣慰的是,至少還是贏了世界冠軍一局。
Murray Campbell如今是IBM的T. J. Watson研究中心認知計算組裡AI基礎技術團隊中非常傑出的研究人員,他表示,這局看似毫不起眼的勝利卻「是對證明我們的研發方向正確的重要肯定」,1997年人機大戰最後一場比賽,我們也根據之前獲勝的經驗改進了計算機系統。接受《科學美國人》的採訪時,Campbell談到了計算機科學家長期以來對計算機下象棋的痴迷,還有IBM是如何成功應對AI技術面臨的挑戰並扭轉戰局,擊敗國際象棋冠軍的。
【以下是經過編輯的訪談記錄。】
Q:你當初是怎麼加入「深藍」研發項目的呢?
我是IBM當時接觸的卡內基梅隆大學研究生團隊中的一員。很早之前我就對計算機象棋非常感興趣,本科期間還寫過一個國際象棋程序。在C.M.U.期間,我對人工智慧有了更廣泛地了解,並不僅限於製作出足以打敗世界象棋冠軍的高性能象棋計算機。雖然它只是一個編外項目,但我們還是在上面分配了許多研究人員(包括Feng-hsiung Hsu和Thomas Anantharaman),隨後研發出了一台名為「深思」的計算機,它還成了首個在象棋賽事中打敗象棋大師和專業棋士的計算機程序。
IBM注意到了我們團隊用於研發這個機器的預算十分緊張,也認為讓我們加入IBM研究中心研發下一代象棋計算機「深藍」一定會非常有意思。他們還很想知道,不久的將來,那些頂尖國際象棋選手是否還能打敗象棋計算機。雖然當時其他研究人員認為打敗人類還需幾十年,我們卻覺得幾年內就能成為現實。
Q:對計算機科學家來說,象棋讓他們如此感興趣的地方在哪?
全世界下象棋的人過億。它是人類智慧的結晶,玩這種遊戲需要有一定的策略、遠見和邏輯等。因此,象棋對於衡量人工智慧發展程度具有重要意義。
看著象棋這類遊戲,我們一般會說,「當然,電腦確實下象棋很厲害,因為它的遊戲規則、動作以及目標都界定明確。」這是一個你了解所有信息的約束性問題。然而,儘管簡化了很多,國際象棋仍然是一個極其複雜的遊戲,這也是為什麼我們要花50年的時間才最終打敗世界象棋冠軍的原因。
Q:你在「深藍」團隊擔任什麼工作呢?
我是團隊的AI專家。1990年前期的AI和1989年的AI大不一樣。我們現在一般稱那段時期很小一部分基於機器學習的AI為老式AI,或象徵性AI。當然,機器學習在當時還是一個很嚴肅的領域,但是現在就不一樣了。現在我們擁有大量的數據集和大型計算機,還有非常先進的演算法來研究數據,創建一些驚人的新事物的模型。我剛進入IBM時,用於遊戲項目的機器學習方法還相當原始,對我們研發設計「深藍」沒有太大幫助。我們致力於研究提高搜索效率和可持續評估的演算法,因為我們知道,要想在比賽中佔據競爭優勢,「深藍」必須擁有這種演算法。
Q:當時AI最大的限制是什麼?
硬體對構建大型網路並沒有真正的幫助。而且,數據本身並不一定要達到我們需要的程度。只要你回顧一下20或25年前最流行的計算機系統,你就會對當時如何在這樣一個系統上完成指令感到震驚。不過,大概還是因為我們沒有經歷過,我想我們還不知道自己到底錯過了什麼。
至於數據,我覺得當時應該沒人會知道它以後用處這麼大,也不會想到要花錢建立大數據集,其中部分原因大概是運行能力還不足。所以,我們只建了很小的數據集。
Q:你的象棋專長在「深藍」研發工作中發揮了多大作用?
其實這個專長並沒有你想像的那麼有用。早期,我還能夠識別出系統存在的問題,還能提出我認為可以解決某個問題且不引發一系列其他問題的方法。這點對於我們的研發達到某種程度已經很夠用了。不過,如果是要打比賽,那就還有很多真正的遊戲專業知識需要掌握。與世界冠軍對決時,我們還把Joel Benjamin這些象棋大師都找來幫助我們了。
Q:這些象棋大師如何幫助「深藍」提高比賽水平呢?
他們有兩個主要的作用。一是協助建立開局資料庫,把每一種象棋程序都應用起來,從而節省時間,並確保這些程序應用在合理位置上。幾個世紀以來,人類一直在研究國際象棋的開局,並發展出了自己喜歡的【棋步】。這些大師正幫我們選出了很多種編寫進「深藍」程序中的棋步。
這些大師也可以充當「深藍」的陪練。他們與計算機下棋的同時也嘗試著發現系統缺陷。隨後,他們會與研發團隊的其他成員共同討論缺陷所在並找出解決方法。有時考慮到我們的條件所限——我們將部分計算機指令直接編進國際象棋加速器晶元,而不是自己編寫軟體——有一些問題並不能輕易解決。但通常我們還是能提高機器處理現有問題的效率。
Q:「深藍」如何決定棋步?
「深藍」採用混合決策。它把通用超級計算機處理器與象棋加速器晶元相結合。在超級計算機上運行的軟體只執行部分象棋運算,更複雜的棋步則由加速器處理,然後開始計算對手可能走出的棋步和結果。超級計算機就是根據這些來決定最終的棋步。
Q:為了擊敗Kasparov,1996到1997年期間,「深藍」做了哪些改進?
我們做出了好幾項改進。通過開發新一代硬體,我們差不多將運算速度提升到原先的兩倍。我們還通過改善象棋晶元充實了系統內部的象棋知識,使它能夠識別不同的棋局,同時對象棋的概念有更好理解。在不同棋局走勢中,這些晶元可以從眾多可能性中走出最佳棋步。同時,這幾年我們還發現一個棋局中可以有很多種模式,我們分別給它們賦值,從而對局勢進行更準確的評估。1997版本的「深藍」每秒檢索1億到2億個棋局,具體數目取決於棋局的類型。有時,系統一次能夠計算出6到8種棋步,最多可達20種甚至更多。不過,儘管我們自認為97版「深藍」比96版改善了很多,但我覺得最終的比賽結果可能還是平局。即便是到了比賽的最後一局,我仍在期待來場平局,或者之後有可能再次交手。
Q:為什麼經過1997年的那次比賽後,IBM不同意Kasparov再戰的請求?
因為我們覺得已經達到了最初的目標——證明計算機可以在比賽中擊敗世界象棋冠軍,現在是時候轉到其他重要的研究領域了。
Q:迄今為止,那場比賽已經過去20年了,這20年里AI有什麼變化呢?
當然有了,機器在運行速度和內存等方面都有所改進。人們開始收集更多的數據,從而為機器學習演算法提供練習數據。最終我們發現,將他們結合起來可以產生很多絕妙的結果。參加電視競答節目的IBM「沃森(Watson)」通過機器學習吸收了全球海量數據——包括維基百科——並利用這些數據答出了很多現實問題。從那之後,我們還開始學習如何處理感知任務,如語音識別和機器視覺。「沃森」也可以執行越來越多的商業任務,如分析放射影像並與醫師交流信息。
Q:研發「深藍」項目的這段經歷對你們之後在AI領域的工作有何影響?
我們學到了很多經驗,其中之一就是多種角度看待覆雜問題。舉個例子,在國際象棋中,人類的下棋方式通常是基於模式識別和直覺,而機器則是通過密集檢索數百萬乃至數十億的可能性。這些方法其實彼此互補。國際象棋中如此,許多現實世界中的問題同樣如此,電腦和人腦的結合都要勝過其中任何一方。例如,我們肯定不希望計算機全權接管病患的診斷和治療,因為病情診斷涉及大量無法數據化的信息,但是在提供診療建議上,計算機系統還是非常有用的。
我們現在採用的是先進的基於人工神經網路的系統——有點像黑箱——它們並不怎麼擅長解釋自己為何要給出某項建議。但是如果它自己都解釋不清原因,又讓人們怎麼相信這個系統的建議呢?況且,未知的神經網路系統擁有百萬參數,極其複雜。不過,處理部分問題還是可以照著給出的優秀範例來訓練系統,這在醫療保健領域,計算機進行診斷或給出治療建議時尤為明顯。如果能給出合理解釋的話,我想我們開發出來的機器在醫生診斷時或許會有更大的發言權。
編譯組出品。編輯:郝鵬程
※共享充電寶爆發衝突:代理商與小電進行「搶地盤」之爭
※用戶2億,營收60億,為何《王者榮耀》如此有毒?
※歐盟向谷歌開出創紀錄罰金:24.2億歐元,出來混總是要還的啊
※戴威說ofo新一輪融資接近完成,但和摩拜似乎目標相同:攻下200座城市
※排行榜:中國全球第二,第一是巴西!
TAG:36氪 |
※中年以後,發現除了家人,自己已經一無所有了 | KY訪談:家的意義是什麼?
※我們訪談了117位家長,發現了兒童手錶的秘密
※剛剛的《焦點訪談》,是個信號嗎?
※E3吉田修平訪談:我們想要更多的了解中國市場
※818家電主場看蘇寧 LG來訪談了這幾點
※DOGI跨年訪談:創世紀- 區塊鏈遊戲的2018
※【訪談】騎士老闆:2018年詹姆斯離開時,我們做好了準備
※花間堂CEO訪談:生活方式酒店成熱門IP,但我們已經做了8年
※【訪談】庫里:近年來外界都在挑剔我們,來干擾我們對目標的專註
※90年代女星的訪談截圖,一個都不是「照騙」!
※2018天津「兩會」·津雲訪談第一期:走向世界的「拔火罐」
※《往日不再》TGS訪談:這個世界,到處都是危險
※玩家挖出《精靈寶可夢:劍/盾》製作人八年前的訪談,有些諷刺
※【訪談】韋斯特:若能拿到NBA標誌的版稅,會為青少年建造球場
※熊園微訪談:尋找超預期 2019年可以樂觀一點
※《流放者柯南》開發商訪談:XB1X與PS4 Pro兩家都一樣!
※人間訪談1:假如你中了五百萬
※最近很火的國漫《迷域行者》圈訪談來襲啦!
※【訪談】西亞卡姆:我們打出了我們應該打出的表現,要準備好G2
※高通CEO 8000字訪談實錄:與蘋果和解是巨大的里程碑