當前位置:
首頁 > 最新 > AlphaGo戰勝柯潔並不意外,但讓AlphaGo成為「柯潔」卻不簡單!

AlphaGo戰勝柯潔並不意外,但讓AlphaGo成為「柯潔」卻不簡單!

導讀

AlphaGo戰勝了柯潔第一局後,大家就猜到這次「第二局」的結果,以至於這次人機大戰的最終結局。不過有一點被大多數人所忽視了,就是Alpha是真正的人工智慧嗎?距離真正的人工智慧究竟還有多遠?……

通過以上的「AlphGo 人機大站 2.0」的日程安排,我們發現這場比賽僅僅是為論證「超級計算機對於人類超級大腦」的超越;因為這僅限於一場圍繞圍棋的獎懲機制下的人機對弈,從根本還不算做人工智慧與人類的博弈。

揭秘AlphGo的工作原理

當然啦,上文的這個比喻有些偷換概念,而且AlphaGo的配置比這要高出許多。當年和李世石下棋時,AlphaGo配備了1920個CPU加280個GPU,如今經過一年多的軟硬體升級,自然將計算能力武裝到了牙齒。

不過,AlphaGo用的真的不是窮舉,而是一套結合了深度學習(Deep Learning)與增強學習(Reinforcement Learning)的系統。DeepMind團隊在《自然》雜誌上發表的《用深度神經網路和樹搜索掌握圍棋博弈(Mastering the Game of Go with Deep Neural Networks and Tree Search)》論文中詳細介紹了AlphaGo是怎麼下棋的,此處不展開講了,只做一個粗淺的流程介紹:

(1)分析專業棋手棋譜,得到兩個結果,快速走棋策略(Rollout Policy)與策略網路(SL Policy Network)。其中快速走棋策略類似於人觀察盤面獲得的「直覺」,使用線性模型訓練;策略網路則經過深度學習模型訓練進行分析,類似於人類的「深思熟慮」。

(2)用新的策略網路與先前訓練好的策略網路互相對弈,利用增強學習來修正參數,最終得到增強的策略網路(RL Policy Network),類似於人類左右互搏後得到一個「更加深思熟慮」的結果,對某一步棋的好壞進行判斷。

(3)將所有結果組成一個價值網路(Value Network),對整個盤面進行「全局分析」判斷,圖中藍色越深的位置贏面越大,這樣可以讓程序有大局觀,不會因蠅頭小利而輸掉整場比賽。

4)綜合「直覺」、「深思熟慮」、「全局分析」的結果進行評價,循環往複,找出最優落子點。

AlphGo VS Ke Jie

不同於上一盤,這一次雙方在前期就奠定了廝殺的格局。並且在棋局的下部展開了複雜的大規模廝殺。並且造成了多個打劫的情況。

但在進入中盤後,柯潔自身似乎錯算了打劫可能帶來的影響,最終在局面非常劣勢的情況下放棄了抵抗,示意投降。

目前比賽結果如下:

AlphGo和AI

與單純的深度學習應用不同,AlphaGo在系統中加入了增強學習的部分。增強學習不一定為機器設定特殊明確的行為,機器試探性地做一個行動後,觀察「世界」會有怎樣的反應(獎賞還是懲罰),最終逐步形成對刺激的預期,產生能獲得最大利益的習慣性行為。這個方法具有普適性,因此在其他許多領域都有研究,但比較集中在步驟可能性較少、任務行為較窄的領域(比如圍棋、簡單物理運動等)。英偉達CEO黃仁勛在月初的GTC大會上就宣布了一款名為ISAAC的增強學習世界模擬器,創造出一個完全虛擬的、專為訓練機器人而打造的世界,用來訓練機器人執行打冰球、打高爾夫等動作。

「卷積神經網路之父」、深度學習三巨頭之一、Facebook人工智慧研究院院長Yann LeCun曾經這樣解釋道,人類的佔領、統治、鬥爭等大部分行為,都是在一代代進化的過程中,受到「希望獲得資源」這一目的所驅動的。而如果我們想要機器做一件事情,則需要給它賦予這個能力,朝這個目的去打造機器。如今我們已經做出了在特定領域比人類更智能的機器,但人工智慧並不會真正統治世界,因為我們並不會朝這個目的去做。

人工智慧大體上劃分為三個階段,即知識+搜索階段,特徵+統計學習階段,數據+深度學習階段。第一個階段給系統的是知識,通過推理(搜索)求解問題,需要專家整理知識,人的參與最強。第二個階段給系統的是特徵,通過統計學習求解問題,需要認為定義特徵,人的參與程度次之。第三個階段給系統的是數據,通過深度學習求解問題,人的參與程度最弱。三個階段的進階,反應了人工智慧的不斷進步,人為參與程度越來越弱。當然三個階段並不是完全分離的,不同方法有不同的特點,以後也需要融合,不是任何一種方法能包打天下的。

小武觀點

1.目前的人工智慧還屬於草履蟲(只生活在淡水環境中,一旦進入高鹽度水環境就會馬上逃離)這種低級動物階段,沒有意識和認知。

2.計算機在計算和記憶方面遠遠超過人類,是人類的好工具;量子計算機的出現,會加速人工智慧的發展。

3.人工智慧在封閉環境下強於人類,但在開放環境下弱於人類,所以人工智慧並不完美。

精彩內容

2017

預知精彩內容,請關注我們!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI簡史 的精彩文章:

TAG:AI簡史 |

您可能感興趣

詳解AlphaGo到AlphaGo Zero!
如何評價 AlphaGo Zero?
想當AlphaGo的 Open AI,玩刀塔時為何又慘敗給人類了?
AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
柯潔和AlphaGo曾經的對戰前瞻
AlphaGo「兄弟」AlphaFold出世,DeepMind再創記錄
最小化類 AlphaGo Zero 引擎——Nochi
AlphaGo之父DeepMind再出神作,PrediNet原理詳解
AlphaGo後再出神作!DeepMind打造AlphaFold擊敗人類,精度碾壓人類專家!
打敗柯潔的AlphaGo有了繼任者AlphaZero 國際象棋/圍棋/將棋通殺
AlphaGo Zero代碼遲遲不開源,TF等不及自己推了一個
人工智慧AlphaGo Zero是一個突破,那它呢?
實現通用人工智慧還要多久?Hinton與AlphaGo之父這樣回答
Tomaso Poggio解析下個「AlphaGo」線索,再談「深度學習鍊金術」
AlphaGo理解圍棋嗎?
生物界「AlphaGo」來了!蛋白結構預測AlphaFold大勝傳統人類模型
受AlphaGo啟發,AI重建量子系統新方法登上Nature Physics
AlphaGo Zero又上《Science》封面!谷歌的人工智慧又干翻人類了!
與前輩Alphago相比,openAI現在還只是個弟弟
AlphaGo演算法再思考