當前位置:
首頁 > 知識 > AlphaGo Zero:這個世界人類是多餘的!

AlphaGo Zero:這個世界人類是多餘的!

道生一,一生二

二生三,三生萬物

今天,人工智慧又佔領互聯網了!

簡單的總結就是圍棋人工智慧 AlphaGo 出了個新版本,叫 AlphaGo Zero,然後做了些很厲害的事兒。

到底有多厲害,來看看官方公布的成績單就知道了~(以下圖片來源:DeepMind 論文)

一開始,AlphaGo Zero 除了基本規則以外,沒有任何關於圍棋的基礎知識,偶爾還會犯些錯誤,比如填死自己送子,妥妥的萌新。。。

隨後,它花了 3 個小時入門了圍棋,水平變得和人類初學者一樣,低級錯誤不太會犯了,但策略上很單一,吃子吃得很貪婪。

19 個小時以後,AlphaGo Zero 學會了一些進階技巧,例如死活,打劫,先佔邊角這些人類棋手總結出來的 「 套路 」。

在第 70 個小時,AlphaGo Zero 開始以超越人類的水平下圍棋,掌握多種套路,多點布局。

到了第三天,AlphaGo Zero 打贏了 AlphaGo Lee(當初擊敗李世石的 AlphaGo 版本),戰績是 100 : 0,完勝!

第 21 天,AlphaGo Zero 的排位分數和 AlphaGo Master 差不多了,要知道 AlphaGo Master 在今年以 3 比 0 擊敗過當時的世界第一柯潔。

到了第 40 天, AlphaGo Zero 壓倒性戰勝了 AlphaGo Master,勝率達到 90%,成為了世界第一的 「 圍棋手 」。

人類最強棋手柯潔當天發了個微博,表示人類太多餘了。

以前的 AlphaGo 用了幾千萬局人類的棋譜去訓練,最新的 Zero 一開始只學會了圍棋的基本規則,沒有人類棋譜當成訓練素材,它自己和自己下,左右互搏。。。

差評君覺得,AlphaGo Zero 和它的前身相比,和人類的差距要小得多,尤其是它得學習過程很像人類。

打個比方,人類剛剛發明圍棋的時候,沒有棋譜去參考,那麼棋手下棋是按著規則和當時的棋局,自己想下一步的。

下得多的棋手會慢慢總結出一些在特定情況下可以套用的下法,靠著這些 「 經驗套路 ",例如 「 金角銀邊草肚皮 」,可以減少思考時間和負擔。

這從側面肯定了人類的圍棋研究價值,但是人類花了上千年,阿爾法狗 Zero 只用了幾天,感受一下差距。。。

AlphaGo Zero 一開始不靠人類經驗直接根據規則來計算下法,這一點和剛接觸圍棋的人很像。

人類到後來會學習他人的棋譜,總結更多套路,學習他人的經驗,而 AlphaGo Zero 不會忘記事情也不知疲倦,更不會犯同一遍錯誤,因此它獨自就完成了對圍棋的研究,默默地變成了地球上最厲害的圍棋手。

AlphaGo Zero 不光又快又強,還省資源,只用了一台機器和 4 個 TPU (谷歌為機器學習定製的運算器),以前的版本要 48 個 TPU。

省資源這一點也開始漸漸接近人腦了,人腦和計算機比有個很大的優勢就是高效,比如說小黑胖就很會吃還不太聰明,計算機要完成黑胖大腦的計算量,一般需要 「 吃 " 更多能量。

計算機吃的能量是啥,當然是燒東西發的電啊,難不成用愛?

人工智慧從今往後可能越來越當得起 「 智能 」 二字了。

目前人類讓計算機解決問題的方式,還是讓計算機按人類的方法做事,只不過利用了計算機不知疲倦,簡單計算速度快的特點。

而以後,可能只要把問題交給人工智慧,人工智慧不用受人類經驗的局限,搞出截然不同但是又很高效管用的解決方案。

這麼一看,人工智慧說不定就能和人類平起平坐了,甚至人類連思考也沒什麼必要。

最後開個腦洞,當人類走到那一步的時候,不禁產生了人類存在的意義是什麼,而這個問題,人類找不到答案,丟給人工智慧試試?

「 我算出來了,42! --AlphaGo Zero 」

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 隨我漲知識 的精彩文章:

NASA準備發射一顆最大的火箭,把人送上月球
機械學家認為,只有研究出機器人,人類才有未來!
管理你的情緒,清除你的氣場與負能量,變得開朗起來!
在7000年前,太陽經歷過一次不可思議的事情

TAG:隨我漲知識 |