在它面前，最頂尖的人類也弱爆了！現實版《黑鏡》或許正在發生

娛樂 01-18

2016年，人工智慧程序「阿爾法圍棋」（AlphaGo）擊敗世界圍棋冠軍李世石。

那次比賽，一下子讓人工智慧成為人類最關心的話題之一——

人工智慧的運作機制是什麼？

阿爾法圍棋是如何打敗李世石的？

對人工智慧的發展來說，阿爾法圍棋的這次勝利究竟意味著什麼？

今天，甜叔跟大家聊一部紀錄片，從這部片里，你可以找到上述問題的答案——

《阿爾法圍棋》

提到阿爾法圍棋，首先得說說這個程序的幕後研發團隊——

谷歌旗下的深度思維公司（DeepMind）。

該團隊成員將深度思維比作人工智慧領域的阿波羅計劃。

團隊的任務是徹底了解智能，通過人工方法重新創造，從而利用這些科技造福社會。

而各類遊戲，就是這個團隊了解智能、開發與測試人工智慧演算法的重要平台。

因為，很多遊戲都有記分機制，通過遊戲，可以很容易地對演算法取得的漸進式進步進行測量。

在一款遊戲中，人工智慧是如何學習、如何進步的呢？

以我們人人都熟悉的打磚塊遊戲為例——

跟人類一樣，第一次接觸這款遊戲，智能系統也得從零學起。

它不知道自己在控制什麼，甚至連遊戲的目標都不知道。

根據遊戲中的原始像素，智能系統可以進行判斷，自行學習其中的操作方式。

在最開始的100場遊戲中，智能系統多半都接不到球。

不過，它逐漸開始掌握遊戲的竅門，發現應該讓短棍更靠近球。

經過300場遊戲，智能系統幾乎每次都能接到球。

深度思維團隊又繼續讓系統玩了200次，結果，令人非常驚訝。

它發現了玩這款遊戲的最佳策略——

沿牆壁邊緣挖隧道，讓球穿過隧道，在磚塊和牆壁之間來回彈跳。

這招，連負責研究此次計劃的研究員都沒發現，智能系統使他們學到了新知識。

在打磚塊遊戲之後，深度思維將目光瞄準了圍棋。

打敗職業圍棋選手，長久以來，一直是人工智慧研究的一大挑戰。

我們先了解一下圍棋的遊戲規則——

玩家的目標是把棋子連接起來，製造一個彼此相連的群體，包圍某個空地。

當玩家包圍敵方的棋子後，就能將那些棋子從棋盤上移走。

玩家包圍的領土，用目數來計算。

到最後，誰包圍的目數最多，誰就是整場遊戲的贏家。

這些規則看似簡單，實際上，圍棋是人類有史以來發明過的最複雜的遊戲——

每顆棋子可以走的路徑選擇，大約有200種。

棋局可能的變化數目，比全宇宙的原子總數還多。

即使出動全世界的電腦運作一百萬年，也不可能計算出所有可能的變化情形。

研發人員嘗試將人工智慧應用到各個領域，但每次碰到圍棋都以失敗收場。

一定意義上，圍棋是人工智慧領域的終極目標。

很多人認為人工智慧要在圍棋比賽中戰勝人類，還需要上千年，有些人則覺得不可能。

因為，他們認為，要在圍棋中獲勝，需要憑藉人類的直覺。

圍棋高手下棋，很多時候，只是因為感覺是對的。

這種觀點，讓深度思維團隊深受啟發。

他們意識到，通過仿效人類直覺，或許，能發明出某種讓人工智慧取勝的高明演算法。

阿爾法圍棋的核心科技，被稱為「深度神經網路」，意即模擬人類大腦的神經元網路。

這個概念已經存在很久了。

但直到最近，隨著電腦運算能力提升，這些神經網路，一夕之間變得非常強大。

和打磚塊遊戲一樣，阿爾法圍棋也是通過自學，來掌握圍棋遊戲的技巧的。

團隊從網路上下載了十萬部厲害業餘棋手比賽的影片，讓阿爾法圍棋「觀看」。

一開始，他們讓阿爾法圍棋模仿人類棋手的招數。

之後，藉由跟自己下棋與強化學習，挑戰數百萬次不同棋局，阿爾法圍棋取得了長足進步。

接下來，要進行實戰了。

首先應邀而來的，是職業圍棋選手樊麾。

樊麾是職業二段選手，曾拿過2013到2015年的歐洲圍棋冠軍。

五局比賽，樊麾全敗。

這是歷史性的一刻，人工智慧系統有史以來第一次打敗職業圍棋選手。

不久後，深度思維向世界圍棋冠軍李世石下了挑戰書。

李世石屬於九段選手，曾獲得過18次世界冠軍。

他被認為是過去十年來最偉大的棋手，樊麾跟他完全不是一個等級的。

正式應戰前，阿爾法圍棋進行了兩次測試賽。

一勝，一敗。

為了改善這種局面，深度思維請樊麾來給團隊擔任顧問。

樊麾不斷與阿爾法圍棋下棋，發現了這個程序的一個大漏洞。

什麼漏洞呢？

我們可以想像有個空間，裝滿了阿爾法圍棋知道的所有東西。

對這些東西，它大多都了如指掌。

但，有些比較困難的知識區塊，阿爾法圍棋幾乎一竅不通。

在短暫的時間內，研發團隊很難歸納出程序何時會碰到這些區塊。

而一旦碰上，它可能就會發生錯亂。

它會把棋盤上的活棋當成死棋，或是把死棋當成活棋。

深度思維進行了緊張的修改工作，但並沒有取得太大進展。

阿爾法圍棋就這樣帶著漏洞走上了戰場。

關於這次比賽的結果，我們已經知道了。

李世石以1:4的比分，輸給了阿爾法圍棋。

所以，懸念已經不重要了，重要的是阿爾法圍棋在這次比賽中令人始料未及的一些表現。

它在遊戲中所努力的方向、它對勝敗的理解，與我們人類完全不同。

以前，人們玩圍棋，通常只考慮怎樣才能贏得更多的目數。

阿爾法圍棋不考慮這個。

在這個人工智慧系統中，一共包含了三種機制——

一是走棋網路：藉助從高階棋局中獲得的訓練，模仿人類棋手的招式。

二是估值網路：衡量棋局情勢，判斷獲勝幾率。

三是樹搜尋：分析棋局的各種可能變化情形，嘗試推演棋局未來演變。

在實際對戰中，走棋網路掃描棋子擺放情況，選出可行落點。

接著，樹搜尋根據每個落點可能產生的變化，建構出樹狀圖。

最後，運用估值網路，分析每一種方法獲勝的幾率。

在整個比賽中，阿爾法圍棋一直致力於把勝率提高到最大，但並不在乎所贏目數的多少。

它的很多棋步，在人類職業棋手看來是錯誤的，或者是多餘的。

分明有其它更好的走法，阿爾法圍棋卻不採用。

這都是因為，以它的邏輯，贏才是目的，贏多贏少完全無關緊要。

對於人類棋手來說，這意味著一種嶄新的思維方式。

它的出現，或許會影響接下來一千年人類下圍棋的方式。

除此之外，阿爾法圍棋還能走出一些讓人類覺得是創新的棋步。

最被人稱道的是第二局的第37步棋，按照計算，人類只有萬分之一的幾率會走這樣一步。

阿爾法圍棋走出這一步，證明它已超越了人類的指導。

這一步，讓李世石思考了12分鐘。

而局勢也徹底轉向了。

之前的每個落子全部起了作用，連接了起來。

這一局結束後，李世石稱，他在這一局明顯處於劣勢，從比賽一開始，沒有一刻掌握主動權。

或許是受到了阿爾法圍棋的啟發，在連敗三局之後，李世石也走出了一個創新棋步。

根據計算，人類走出這步的概率同樣不足萬分之一。

正是因為這步，阿爾法圍棋暴露了它的弱點。

它接連犯錯，棋步變得非常異常，勝率評估值不斷下降，最後，舉手投降。

對於這一情況，場外的一名評論員並不感到意外。

他說，如果深度思維有辦法寫出沒有錯誤的程序碼，那會是比阿爾法圍棋更大的新聞。

實際上，儘管在本次比賽中取得了這麼大的勝利，人工智慧依舊還處在萌芽階段。

距離它正真應用到我們的生活中，給人類生活方式帶來巨大改變，也許還要等上不短的時間。

不過，正如阿爾法圍棋給圍棋界帶來的那些啟發，已震撼到很多人，我們也應該試著改變一下傳統的思維方式。

放下人類的傲慢，像人工智慧一樣思考，或許，我們會看到一個不一樣的世界。

文 | 甜叔

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 電影審片官 的精彩文章:

※好萊塢老戲骨演技炸裂，甚至比《白夜追兇》里的潘粵明還厲害！

TAG:電影審片官 |