DeepMind的最新版AlphaZero4小時統治了國際象棋界

最新 12-07

DeepMind的最新版本棋類AI——AlphaZero從零開始自學國際象棋知識，僅用4小時就擊敗了國際象棋頂級程序Stockfish。

令人驚嘆的是AlphaZero還提出了全新的戰略，現在國際象棋大師們正在分析它的新策略。

當年，IBM的超級計算機「深藍」之所以能擊敗國際象棋大師加里·卡斯帕羅夫（Gary Kasparov），是因為提前被灌輸了最好的棋步。但是，AlphaZero只是了解下棋規則，其他都是靠自己學習的。

深藍大戰加里卡斯帕羅夫

英國國際象棋大師西蒙·威廉姆斯( Simon Williams)說，這一成就可以載入史冊了。「2017年12月6日，AlphaZero統治了國際象棋界。」

國際象棋教育網站Chessable的David Kramaley補充說：「我們現在知道我們的新霸主是誰了。

「AlphaZero所玩的遊戲表明，它可以計算出一些令人難以置信的創造性之舉，其意義遠遠高於人類或國際象棋程序所提供的任何東西。

「毫無疑問，這個AI將會帶來革命性的變化，接下來要思考的就是它如何在國際象棋之外發揮作用。讓這一最新演算法用於城市，各大洲，甚至宇宙。」

AlphaGo Master大戰柯潔

挪威國際象棋大師約恩·盧德維格·哈默爾( Jon ludvig hammer)將AlphaZero的策略描述為「瘋狂地攻擊國際象棋」，並且每一步都走得意義深遠。

除了在國際象棋界大展神威外，AlphaZero還順便統治了將棋界，用了不到2小時擊敗了世界頂級將棋程序Elmo。

智能觀上次還報道了DeepMind的AlphaGo Zero擊敗哥哥們AlphaGo、AlphaGo Master的事件，如果你認為這一次的Zero和上一次的Zero是一個品種，那就大錯特錯了！

最新版本的Zero使用了全新的演算法，更接近「通用AI」，並且此次僅用了8小時就完敗了當年打敗李世乭的AlphaGo。當然，單純地從名字看，新Zero比老Zero少了一個Go，不知道這算不算是它要脫離「狗狗家族」，擺脫只能下棋的命運，走向「通用AI」的標誌。

此外，從技術角度看，新老兩版Zero有4點不同：

1.AlphaGo Zero是在假設結果為贏/輸二元的情況下，對獲勝概率進行估計和優化；AlphaZero會將平局或其他潛在結果納入考慮，對結果進行估計和優化。

2.AlphaGo和AlphaGo Zero會轉變棋盤位置進行數據增強，而AlphaZero不會。

3.AlphaZero只維護單一的一個神經網路，這個神經網路不斷更新，而不是等待迭代。

4.AlphaZero中，所有對弈都重複使用相同的超參數，因此無需針對某種特定的遊戲進行調整。

最後，保持初心，DeepMind團隊還是希望使用該演算法來解決嚴重的健康問題。他們認為，這項計劃可以在幾天或幾周內為重大疾病提供治療方案（一般這樣的方案要花費數百年才能找到）。

該公司已經開始使用AlphaZero來研究蛋白質摺疊（錯誤摺疊的蛋白質會導致許多破壞性疾病，包括阿爾茨海默病、帕金森病和囊性纖維化），並表示將很快發布新的研究結果。

我們，拭目以待！

附 DeepMind的AlphaZero最新論文：

https://arxiv.org/pdf/1712.01815.pdf

參考 The Telegraph，DeepMind論文，網易智能

—完—

想知道AI加教育領域有哪些最新研究成果？

想要AI領域更多的乾貨？

想了解更多專家的「智能觀」？

請在對話界面點擊「找找看」，去獲取你想要的內容吧。

有人問：你們為什麼要做智能觀？為什麼關注AI+教育？

我想，這不是一個選擇。

當AI開始顛覆各行各業時，我們首先想到了教育。未來是我們正在為之努力的地方，教育可以影響當下，改變未來。

我們用心觀察和記錄教育在這個時代的蛻變；努力把前沿的動態、最新的進展、先進的觀點帶到你面前，希望與你一起思考和探索。我們相信，長出AI翅膀的教育，會創造出無限可能。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 智能觀 的精彩文章: