當前位置:
首頁 > 科技 > Facebook首次開源超級圍棋AI,復現AI高手AlphaZero

Facebook首次開源超級圍棋AI,復現AI高手AlphaZero

Facebook AI團隊在論文中詳細披露了圍棋AI的訓練數據。

最近,Facebook的人工智慧研究所(以下簡稱FAIR)宣布,他們開源了自研的圍棋AI訓練模型和代碼。這意味著,你可以隨時隨地和Facebook的人工智慧下圍棋了,而且此圍棋AI程序重現的是名噪一時的AI高手AlphaZero。

Facebook首次開源超級圍棋AI,復現AI高手AlphaZero

打開今日頭條,查看更多圖片

去年5月,FAIR發布了ELF Open GO,ELF OpenGo是FAIR依照DeepMind在《自然》上發表的和AlphaGo Zero以及AlphaZero相關的論文,做出的開源計算機圍棋程序,也就是說,ELF OpenGo不使用人類棋譜與累積的圍棋知識,僅使用單一類神經網路從自我對弈中學習。

該圍棋AI之前在和韓國棋院的專業圍棋選手對弈中,都取得不錯的成績。據悉,OpenGo 的最新版本使用2000塊GPU訓練了15天後,在一塊GPU的情況下與4個排名前30的職業選手進行比賽時,取得了20:0全勝的戰績,可謂是戰無不勝。

Facebook首次開源超級圍棋AI,復現AI高手AlphaZero

在這次開源的論文中,FAIR研究人員全面披露了ELF OpenGo的訓練過程,包括取得的是三個突破。

一是為ELF OpenGo訓練了一個超人類棋藝的模型,他們在2000個GPU上運行類AlphaZero的訓練軟體9天後,有20個模塊的模型超越了人類水平。

二是提供了模型在訓練過程中的行為分析,包括和其他模型的對比、學習速度、學習難度等等。

三是通過實施ablation實驗,以研究AlphaZero風格演算法的性質,他們發現對於最終模型而言,對局中加倍rollout水平大約提升200 ELO,AI的發揮會受到模型容量的限制。

最後,此次論文的主要作者為田淵棟,他一直負責Facebook的圍棋AI相關研究,在此前的一篇知乎文章中,他提到:DeepMind不開源也不透露細節,文章裡面一些地方也沒有寫得很清楚。沒有第一手經驗總不是很踏實。所以本著研究目的,我們需要復現一下,先有復現,才有創新,這個是做研究的習慣。而且如果我們去看 ELF OpenGo 的代碼,會發現其完全適用於其它方向的工作。而圍棋對我們來說,只是一個把演算法和平台做好的手段。在這一點上,花點時間把圍棋做好是值得的。

最後,關於ELF OpenGo最新訓練模型的具體數據鏈接了解一下。

https://dl.fbaipublicfiles.com/elfopengo/pdf/arxiv.pdf

更多優質內容,請持續關注鎂客網~~

Facebook首次開源超級圍棋AI,復現AI高手AlphaZero

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 鎂客網 的精彩文章:

NASA公布「門戶計劃」,在月球軌道建立空間站進一步探索月球
驚天消息!美國重啟病毒實驗,或對人類造成巨大威脅

TAG:鎂客網 |