AlphaGo戰勝柯潔並不意外，但讓AlphaGo成為「柯潔」卻不簡單！

最新 05-26

導讀

AlphaGo戰勝了柯潔第一局後，大家就猜到這次「第二局」的結果，以至於這次人機大戰的最終結局。不過有一點被大多數人所忽視了，就是Alpha是真正的人工智慧嗎？距離真正的人工智慧究竟還有多遠？……

通過以上的「AlphGo 人機大站 2.0」的日程安排，我們發現這場比賽僅僅是為論證「超級計算機對於人類超級大腦」的超越；因為這僅限於一場圍繞圍棋的獎懲機制下的人機對弈，從根本還不算做人工智慧與人類的博弈。

揭秘AlphGo的工作原理

當然啦，上文的這個比喻有些偷換概念，而且AlphaGo的配置比這要高出許多。當年和李世石下棋時，AlphaGo配備了1920個CPU加280個GPU，如今經過一年多的軟硬體升級，自然將計算能力武裝到了牙齒。

不過，AlphaGo用的真的不是窮舉，而是一套結合了深度學習(Deep Learning)與增強學習(Reinforcement Learning)的系統。DeepMind團隊在《自然》雜誌上發表的《用深度神經網路和樹搜索掌握圍棋博弈(Mastering the Game of Go with Deep Neural Networks and Tree Search)》論文中詳細介紹了AlphaGo是怎麼下棋的，此處不展開講了，只做一個粗淺的流程介紹：

（1）分析專業棋手棋譜，得到兩個結果，快速走棋策略(Rollout Policy)與策略網路(SL Policy Network)。其中快速走棋策略類似於人觀察盤面獲得的「直覺」，使用線性模型訓練；策略網路則經過深度學習模型訓練進行分析，類似於人類的「深思熟慮」。

（2）用新的策略網路與先前訓練好的策略網路互相對弈，利用增強學習來修正參數，最終得到增強的策略網路（RL Policy Network），類似於人類左右互搏後得到一個「更加深思熟慮」的結果，對某一步棋的好壞進行判斷。

（3）將所有結果組成一個價值網路（Value Network），對整個盤面進行「全局分析」判斷，圖中藍色越深的位置贏面越大，這樣可以讓程序有大局觀，不會因蠅頭小利而輸掉整場比賽。

4）綜合「直覺」、「深思熟慮」、「全局分析」的結果進行評價，循環往複，找出最優落子點。

AlphGo VS Ke Jie

不同於上一盤，這一次雙方在前期就奠定了廝殺的格局。並且在棋局的下部展開了複雜的大規模廝殺。並且造成了多個打劫的情況。

但在進入中盤後，柯潔自身似乎錯算了打劫可能帶來的影響，最終在局面非常劣勢的情況下放棄了抵抗，示意投降。

目前比賽結果如下：

AlphGo和AI

與單純的深度學習應用不同，AlphaGo在系統中加入了增強學習的部分。增強學習不一定為機器設定特殊明確的行為，機器試探性地做一個行動後，觀察「世界」會有怎樣的反應（獎賞還是懲罰），最終逐步形成對刺激的預期，產生能獲得最大利益的習慣性行為。這個方法具有普適性，因此在其他許多領域都有研究，但比較集中在步驟可能性較少、任務行為較窄的領域（比如圍棋、簡單物理運動等）。英偉達CEO黃仁勛在月初的GTC大會上就宣布了一款名為ISAAC的增強學習世界模擬器，創造出一個完全虛擬的、專為訓練機器人而打造的世界，用來訓練機器人執行打冰球、打高爾夫等動作。

「卷積神經網路之父」、深度學習三巨頭之一、Facebook人工智慧研究院院長Yann LeCun曾經這樣解釋道，人類的佔領、統治、鬥爭等大部分行為，都是在一代代進化的過程中，受到「希望獲得資源」這一目的所驅動的。而如果我們想要機器做一件事情，則需要給它賦予這個能力，朝這個目的去打造機器。如今我們已經做出了在特定領域比人類更智能的機器，但人工智慧並不會真正統治世界，因為我們並不會朝這個目的去做。

人工智慧大體上劃分為三個階段，即知識+搜索階段，特徵+統計學習階段，數據+深度學習階段。第一個階段給系統的是知識，通過推理（搜索）求解問題，需要專家整理知識，人的參與最強。第二個階段給系統的是特徵，通過統計學習求解問題，需要認為定義特徵，人的參與程度次之。第三個階段給系統的是數據，通過深度學習求解問題，人的參與程度最弱。三個階段的進階，反應了人工智慧的不斷進步，人為參與程度越來越弱。當然三個階段並不是完全分離的，不同方法有不同的特點，以後也需要融合，不是任何一種方法能包打天下的。

小武觀點

1.目前的人工智慧還屬於草履蟲（只生活在淡水環境中，一旦進入高鹽度水環境就會馬上逃離）這種低級動物階段，沒有意識和認知。

2.計算機在計算和記憶方面遠遠超過人類，是人類的好工具；量子計算機的出現，會加速人工智慧的發展。

3.人工智慧在封閉環境下強於人類，但在開放環境下弱於人類，所以人工智慧並不完美。

精彩內容

2017

預知精彩內容，請關注我們！

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI簡史 的精彩文章:

TAG:AI簡史 |

您可能感興趣

※詳解AlphaGo到AlphaGo Zero！
※如何評價 AlphaGo Zero？
※想當AlphaGo的 Open AI，玩刀塔時為何又慘敗給人類了？
※AlphaGo之後，DeepMind重磅推出AlphaFold：基因序列預測蛋白質結構
※柯潔和AlphaGo曾經的對戰前瞻
※AlphaGo「兄弟」AlphaFold出世，DeepMind再創記錄
※最小化類 AlphaGo Zero 引擎——Nochi
※AlphaGo之父DeepMind再出神作，PrediNet原理詳解
※AlphaGo後再出神作！DeepMind打造AlphaFold擊敗人類，精度碾壓人類專家！
※打敗柯潔的AlphaGo有了繼任者AlphaZero 國際象棋/圍棋/將棋通殺
※AlphaGo Zero代碼遲遲不開源，TF等不及自己推了一個
※人工智慧AlphaGo Zero是一個突破，那它呢？
※實現通用人工智慧還要多久？Hinton與AlphaGo之父這樣回答
※Tomaso Poggio解析下個「AlphaGo」線索，再談「深度學習鍊金術」
※AlphaGo理解圍棋嗎？
※生物界「AlphaGo」來了！蛋白結構預測AlphaFold大勝傳統人類模型
※受AlphaGo啟發，AI重建量子系統新方法登上Nature Physics
※AlphaGo Zero又上《Science》封面！谷歌的人工智慧又干翻人類了！
※與前輩Alphago相比，openAI現在還只是個弟弟
※AlphaGo演算法再思考