AlphaGo Zero：這個世界人類是多餘的！

知識 10-20

道生一，一生二

二生三，三生萬物

今天，人工智慧又佔領互聯網了！

簡單的總結就是圍棋人工智慧 AlphaGo 出了個新版本，叫 AlphaGo Zero，然後做了些很厲害的事兒。

到底有多厲害，來看看官方公布的成績單就知道了~（以下圖片來源：DeepMind 論文）

一開始，AlphaGo Zero 除了基本規則以外，沒有任何關於圍棋的基礎知識，偶爾還會犯些錯誤，比如填死自己送子，妥妥的萌新。。。

隨後，它花了 3 個小時入門了圍棋，水平變得和人類初學者一樣，低級錯誤不太會犯了，但策略上很單一，吃子吃得很貪婪。

19 個小時以後，AlphaGo Zero 學會了一些進階技巧，例如死活，打劫，先佔邊角這些人類棋手總結出來的「套路」。

在第 70 個小時，AlphaGo Zero 開始以超越人類的水平下圍棋，掌握多種套路，多點布局。

到了第三天，AlphaGo Zero 打贏了 AlphaGo Lee（當初擊敗李世石的 AlphaGo 版本），戰績是 100 ： 0，完勝！

第 21 天，AlphaGo Zero 的排位分數和 AlphaGo Master 差不多了，要知道 AlphaGo Master 在今年以 3 比 0 擊敗過當時的世界第一柯潔。

到了第 40 天， AlphaGo Zero 壓倒性戰勝了 AlphaGo Master，勝率達到 90%，成為了世界第一的「圍棋手」。

人類最強棋手柯潔當天發了個微博，表示人類太多餘了。

以前的 AlphaGo 用了幾千萬局人類的棋譜去訓練，最新的 Zero 一開始只學會了圍棋的基本規則，沒有人類棋譜當成訓練素材，它自己和自己下，左右互搏。。。

差評君覺得，AlphaGo Zero 和它的前身相比，和人類的差距要小得多，尤其是它得學習過程很像人類。

打個比方，人類剛剛發明圍棋的時候，沒有棋譜去參考，那麼棋手下棋是按著規則和當時的棋局，自己想下一步的。

下得多的棋手會慢慢總結出一些在特定情況下可以套用的下法，靠著這些「經驗套路 "，例如「金角銀邊草肚皮」，可以減少思考時間和負擔。

這從側面肯定了人類的圍棋研究價值，但是人類花了上千年，阿爾法狗 Zero 只用了幾天，感受一下差距。。。

AlphaGo Zero 一開始不靠人類經驗直接根據規則來計算下法，這一點和剛接觸圍棋的人很像。

人類到後來會學習他人的棋譜，總結更多套路，學習他人的經驗，而 AlphaGo Zero 不會忘記事情也不知疲倦，更不會犯同一遍錯誤，因此它獨自就完成了對圍棋的研究，默默地變成了地球上最厲害的圍棋手。

AlphaGo Zero 不光又快又強，還省資源，只用了一台機器和 4 個 TPU （谷歌為機器學習定製的運算器），以前的版本要 48 個 TPU。

省資源這一點也開始漸漸接近人腦了，人腦和計算機比有個很大的優勢就是高效，比如說小黑胖就很會吃還不太聰明，計算機要完成黑胖大腦的計算量，一般需要「吃 " 更多能量。

計算機吃的能量是啥，當然是燒東西發的電啊，難不成用愛？

人工智慧從今往後可能越來越當得起「智能」二字了。

目前人類讓計算機解決問題的方式，還是讓計算機按人類的方法做事，只不過利用了計算機不知疲倦，簡單計算速度快的特點。

而以後，可能只要把問題交給人工智慧，人工智慧不用受人類經驗的局限，搞出截然不同但是又很高效管用的解決方案。

這麼一看，人工智慧說不定就能和人類平起平坐了，甚至人類連思考也沒什麼必要。

最後開個腦洞，當人類走到那一步的時候，不禁產生了人類存在的意義是什麼，而這個問題，人類找不到答案，丟給人工智慧試試？

「我算出來了，42! --AlphaGo Zero 」

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 隨我漲知識 的精彩文章: