當前位置:
首頁 > 最新 > DeepMind的最新版AlphaZero4小時統治了國際象棋界

DeepMind的最新版AlphaZero4小時統治了國際象棋界

DeepMind的最新版本棋類AI——AlphaZero從零開始自學國際象棋知識,僅用4小時就擊敗了國際象棋頂級程序Stockfish。

令人驚嘆的是AlphaZero還提出了全新的戰略,現在國際象棋大師們正在分析它的新策略。

當年,IBM的超級計算機「深藍」之所以能擊敗國際象棋大師加里·卡斯帕羅夫(Gary Kasparov),是因為提前被灌輸了最好的棋步。但是,AlphaZero只是了解下棋規則,其他都是靠自己學習的。

深藍大戰加里卡斯帕羅夫

英國國際象棋大師西蒙·威廉姆斯( Simon Williams)說,這一成就可以載入史冊了。「2017年12月6日,AlphaZero統治了國際象棋界。」

國際象棋教育網站Chessable的David Kramaley補充說:「我們現在知道我們的新霸主是誰了。

「AlphaZero所玩的遊戲表明,它可以計算出一些令人難以置信的創造性之舉,其意義遠遠高於人類或國際象棋程序所提供的任何東西。

「毫無疑問,這個AI將會帶來革命性的變化,接下來要思考的就是它如何在國際象棋之外發揮作用。讓這一最新演算法用於城市,各大洲,甚至宇宙。」

AlphaGo Master大戰柯潔

挪威國際象棋大師約恩·盧德維格·哈默爾( Jon ludvig hammer)將AlphaZero的策略描述為「瘋狂地攻擊國際象棋」,並且每一步都走得意義深遠。

除了在國際象棋界大展神威外,AlphaZero還順便統治了將棋界,用了不到2小時擊敗了世界頂級將棋程序Elmo。

智能觀上次還報道了DeepMind的AlphaGo Zero擊敗哥哥們AlphaGo、AlphaGo Master的事件,如果你認為這一次的Zero和上一次的Zero是一個品種,那就大錯特錯了!

最新版本的Zero使用了全新的演算法,更接近「通用AI」,並且此次僅用了8小時就完敗了當年打敗李世乭的AlphaGo。當然,單純地從名字看,新Zero比老Zero少了一個Go,不知道這算不算是它要脫離「狗狗家族」,擺脫只能下棋的命運,走向「通用AI」的標誌。

此外,從技術角度看,新老兩版Zero有4點不同:

1.AlphaGo Zero是在假設結果為贏/輸二元的情況下,對獲勝概率進行估計和優化;AlphaZero會將平局或其他潛在結果納入考慮,對結果進行估計和優化。

2.AlphaGo和AlphaGo Zero會轉變棋盤位置進行數據增強,而AlphaZero不會。

3.AlphaZero只維護單一的一個神經網路,這個神經網路不斷更新,而不是等待迭代。

4.AlphaZero中,所有對弈都重複使用相同的超參數,因此無需針對某種特定的遊戲進行調整。

最後,保持初心,DeepMind團隊還是希望使用該演算法來解決嚴重的健康問題。他們認為,這項計劃可以在幾天或幾周內為重大疾病提供治療方案(一般這樣的方案要花費數百年才能找到)。

該公司已經開始使用AlphaZero來研究蛋白質摺疊(錯誤摺疊的蛋白質會導致許多破壞性疾病,包括阿爾茨海默病、帕金森病和囊性纖維化),並表示將很快發布新的研究結果。

我們,拭目以待!

附 DeepMind的AlphaZero最新論文:

https://arxiv.org/pdf/1712.01815.pdf

參考 The Telegraph,DeepMind論文,網易智能

—完—

想知道AI加教育領域有哪些最新研究成果?

想要AI領域更多的乾貨?

想了解更多專家的「智能觀」?

請在對話界面點擊「找找看」,去獲取你想要的內容吧。

有人問:你們為什麼要做智能觀?為什麼關注AI+教育?

我想,這不是一個選擇。

當AI開始顛覆各行各業時,我們首先想到了教育。未來是我們正在為之努力的地方,教育可以影響當下,改變未來。

我們用心觀察和記錄教育在這個時代的蛻變;努力把前沿的動態、最新的進展、先進的觀點帶到你面前,希望與你一起思考和探索。我們相信,長出AI翅膀的教育,會創造出無限可能。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 智能觀 的精彩文章:

Photoshop使用AI增加了新功能,使圖像編輯更容易
東北大學校長專訪:人機協作時代,高等教育應教什麼
Udacity CEO專訪:AI前沿科技在教育中的機會,方法和障礙
AI要有好奇心了?伯克利研究人員正在開發
清華副教授:如何解決MOOC中的問題?如何用數據彌補老師與學生之間的信息不對稱?

TAG:智能觀 |