AlphaGo Zero:這個世界人類是多餘的!
道生一,一生二
二生三,三生萬物
今天,人工智慧又佔領互聯網了!
簡單的總結就是圍棋人工智慧 AlphaGo 出了個新版本,叫 AlphaGo Zero,然後做了些很厲害的事兒。
到底有多厲害,來看看官方公布的成績單就知道了~(以下圖片來源:DeepMind 論文)
一開始,AlphaGo Zero 除了基本規則以外,沒有任何關於圍棋的基礎知識,偶爾還會犯些錯誤,比如填死自己送子,妥妥的萌新。。。
隨後,它花了 3 個小時入門了圍棋,水平變得和人類初學者一樣,低級錯誤不太會犯了,但策略上很單一,吃子吃得很貪婪。
19 個小時以後,AlphaGo Zero 學會了一些進階技巧,例如死活,打劫,先佔邊角這些人類棋手總結出來的 「 套路 」。
在第 70 個小時,AlphaGo Zero 開始以超越人類的水平下圍棋,掌握多種套路,多點布局。
到了第三天,AlphaGo Zero 打贏了 AlphaGo Lee(當初擊敗李世石的 AlphaGo 版本),戰績是 100 : 0,完勝!
第 21 天,AlphaGo Zero 的排位分數和 AlphaGo Master 差不多了,要知道 AlphaGo Master 在今年以 3 比 0 擊敗過當時的世界第一柯潔。
到了第 40 天, AlphaGo Zero 壓倒性戰勝了 AlphaGo Master,勝率達到 90%,成為了世界第一的 「 圍棋手 」。
人類最強棋手柯潔當天發了個微博,表示人類太多餘了。
以前的 AlphaGo 用了幾千萬局人類的棋譜去訓練,最新的 Zero 一開始只學會了圍棋的基本規則,沒有人類棋譜當成訓練素材,它自己和自己下,左右互搏。。。
差評君覺得,AlphaGo Zero 和它的前身相比,和人類的差距要小得多,尤其是它得學習過程很像人類。
打個比方,人類剛剛發明圍棋的時候,沒有棋譜去參考,那麼棋手下棋是按著規則和當時的棋局,自己想下一步的。
下得多的棋手會慢慢總結出一些在特定情況下可以套用的下法,靠著這些 「 經驗套路 ",例如 「 金角銀邊草肚皮 」,可以減少思考時間和負擔。
這從側面肯定了人類的圍棋研究價值,但是人類花了上千年,阿爾法狗 Zero 只用了幾天,感受一下差距。。。
AlphaGo Zero 一開始不靠人類經驗直接根據規則來計算下法,這一點和剛接觸圍棋的人很像。
人類到後來會學習他人的棋譜,總結更多套路,學習他人的經驗,而 AlphaGo Zero 不會忘記事情也不知疲倦,更不會犯同一遍錯誤,因此它獨自就完成了對圍棋的研究,默默地變成了地球上最厲害的圍棋手。
AlphaGo Zero 不光又快又強,還省資源,只用了一台機器和 4 個 TPU (谷歌為機器學習定製的運算器),以前的版本要 48 個 TPU。
省資源這一點也開始漸漸接近人腦了,人腦和計算機比有個很大的優勢就是高效,比如說小黑胖就很會吃還不太聰明,計算機要完成黑胖大腦的計算量,一般需要 「 吃 " 更多能量。
計算機吃的能量是啥,當然是燒東西發的電啊,難不成用愛?
人工智慧從今往後可能越來越當得起 「 智能 」 二字了。
目前人類讓計算機解決問題的方式,還是讓計算機按人類的方法做事,只不過利用了計算機不知疲倦,簡單計算速度快的特點。
而以後,可能只要把問題交給人工智慧,人工智慧不用受人類經驗的局限,搞出截然不同但是又很高效管用的解決方案。
這麼一看,人工智慧說不定就能和人類平起平坐了,甚至人類連思考也沒什麼必要。
最後開個腦洞,當人類走到那一步的時候,不禁產生了人類存在的意義是什麼,而這個問題,人類找不到答案,丟給人工智慧試試?
「 我算出來了,42! --AlphaGo Zero 」
※NASA準備發射一顆最大的火箭,把人送上月球
※機械學家認為,只有研究出機器人,人類才有未來!
※管理你的情緒,清除你的氣場與負能量,變得開朗起來!
※在7000年前,太陽經歷過一次不可思議的事情
TAG:隨我漲知識 |