當前位置:
首頁 > 娛樂 > 在它面前,最頂尖的人類也弱爆了!現實版《黑鏡》或許正在發生

在它面前,最頂尖的人類也弱爆了!現實版《黑鏡》或許正在發生

2016年,人工智慧程序「阿爾法圍棋」(AlphaGo)擊敗世界圍棋冠軍李世石。

那次比賽,一下子讓人工智慧成為人類最關心的話題之一——

人工智慧的運作機制是什麼?

阿爾法圍棋是如何打敗李世石的?

對人工智慧的發展來說,阿爾法圍棋的這次勝利究竟意味著什麼?

今天,甜叔跟大家聊一部紀錄片,從這部片里,你可以找到上述問題的答案——

《阿爾法圍棋》

提到阿爾法圍棋,首先得說說這個程序的幕後研發團隊——

谷歌旗下的深度思維公司(DeepMind)。

該團隊成員將深度思維比作人工智慧領域的阿波羅計劃。

團隊的任務是徹底了解智能,通過人工方法重新創造,從而利用這些科技造福社會。

而各類遊戲,就是這個團隊了解智能、開發與測試人工智慧演算法的重要平台。

因為,很多遊戲都有記分機制,通過遊戲,可以很容易地對演算法取得的漸進式進步進行測量。

在一款遊戲中,人工智慧是如何學習、如何進步的呢?

以我們人人都熟悉的打磚塊遊戲為例——

跟人類一樣,第一次接觸這款遊戲,智能系統也得從零學起。

它不知道自己在控制什麼,甚至連遊戲的目標都不知道。

根據遊戲中的原始像素,智能系統可以進行判斷,自行學習其中的操作方式。

在最開始的100場遊戲中,智能系統多半都接不到球。

不過,它逐漸開始掌握遊戲的竅門,發現應該讓短棍更靠近球。

經過300場遊戲,智能系統幾乎每次都能接到球。

深度思維團隊又繼續讓系統玩了200次,結果,令人非常驚訝。

它發現了玩這款遊戲的最佳策略——

沿牆壁邊緣挖隧道,讓球穿過隧道,在磚塊和牆壁之間來回彈跳。

這招,連負責研究此次計劃的研究員都沒發現,智能系統使他們學到了新知識。

在打磚塊遊戲之後,深度思維將目光瞄準了圍棋。

打敗職業圍棋選手,長久以來,一直是人工智慧研究的一大挑戰。

我們先了解一下圍棋的遊戲規則——

玩家的目標是把棋子連接起來,製造一個彼此相連的群體,包圍某個空地。

當玩家包圍敵方的棋子後,就能將那些棋子從棋盤上移走。

玩家包圍的領土,用目數來計算。

到最後,誰包圍的目數最多,誰就是整場遊戲的贏家。

這些規則看似簡單,實際上,圍棋是人類有史以來發明過的最複雜的遊戲——

每顆棋子可以走的路徑選擇,大約有200種。

棋局可能的變化數目,比全宇宙的原子總數還多。

即使出動全世界的電腦運作一百萬年,也不可能計算出所有可能的變化情形。

研發人員嘗試將人工智慧應用到各個領域,但每次碰到圍棋都以失敗收場。

一定意義上,圍棋是人工智慧領域的終極目標。

很多人認為人工智慧要在圍棋比賽中戰勝人類,還需要上千年,有些人則覺得不可能。

因為,他們認為,要在圍棋中獲勝,需要憑藉人類的直覺。

圍棋高手下棋,很多時候,只是因為感覺是對的。

這種觀點,讓深度思維團隊深受啟發。

他們意識到,通過仿效人類直覺,或許,能發明出某種讓人工智慧取勝的高明演算法。

阿爾法圍棋的核心科技,被稱為「深度神經網路」,意即模擬人類大腦的神經元網路。

這個概念已經存在很久了。

但直到最近,隨著電腦運算能力提升,這些神經網路,一夕之間變得非常強大。

和打磚塊遊戲一樣,阿爾法圍棋也是通過自學,來掌握圍棋遊戲的技巧的。

團隊從網路上下載了十萬部厲害業餘棋手比賽的影片,讓阿爾法圍棋「觀看」。

一開始,他們讓阿爾法圍棋模仿人類棋手的招數。

之後,藉由跟自己下棋與強化學習,挑戰數百萬次不同棋局,阿爾法圍棋取得了長足進步。

接下來,要進行實戰了。

首先應邀而來的,是職業圍棋選手樊麾。

樊麾是職業二段選手,曾拿過2013到2015年的歐洲圍棋冠軍。

五局比賽,樊麾全敗。

這是歷史性的一刻,人工智慧系統有史以來第一次打敗職業圍棋選手。

不久後,深度思維向世界圍棋冠軍李世石下了挑戰書。

李世石屬於九段選手,曾獲得過18次世界冠軍。

他被認為是過去十年來最偉大的棋手,樊麾跟他完全不是一個等級的。

正式應戰前,阿爾法圍棋進行了兩次測試賽。

一勝,一敗。

為了改善這種局面,深度思維請樊麾來給團隊擔任顧問。

樊麾不斷與阿爾法圍棋下棋,發現了這個程序的一個大漏洞。

什麼漏洞呢?

我們可以想像有個空間,裝滿了阿爾法圍棋知道的所有東西。

對這些東西,它大多都了如指掌。

但,有些比較困難的知識區塊,阿爾法圍棋幾乎一竅不通。

在短暫的時間內,研發團隊很難歸納出程序何時會碰到這些區塊。

而一旦碰上,它可能就會發生錯亂。

它會把棋盤上的活棋當成死棋,或是把死棋當成活棋。

深度思維進行了緊張的修改工作,但並沒有取得太大進展。

阿爾法圍棋就這樣帶著漏洞走上了戰場。

關於這次比賽的結果,我們已經知道了。

李世石以1:4的比分,輸給了阿爾法圍棋。

所以,懸念已經不重要了,重要的是阿爾法圍棋在這次比賽中令人始料未及的一些表現。

它在遊戲中所努力的方向、它對勝敗的理解,與我們人類完全不同。

以前,人們玩圍棋,通常只考慮怎樣才能贏得更多的目數。

阿爾法圍棋不考慮這個。

在這個人工智慧系統中,一共包含了三種機制——

一是走棋網路:藉助從高階棋局中獲得的訓練,模仿人類棋手的招式。

二是估值網路:衡量棋局情勢,判斷獲勝幾率。

三是樹搜尋:分析棋局的各種可能變化情形,嘗試推演棋局未來演變。

在實際對戰中,走棋網路掃描棋子擺放情況,選出可行落點。

接著,樹搜尋根據每個落點可能產生的變化,建構出樹狀圖。

最後,運用估值網路,分析每一種方法獲勝的幾率。

在整個比賽中,阿爾法圍棋一直致力於把勝率提高到最大,但並不在乎所贏目數的多少。

它的很多棋步,在人類職業棋手看來是錯誤的,或者是多餘的。

分明有其它更好的走法,阿爾法圍棋卻不採用。

這都是因為,以它的邏輯,贏才是目的,贏多贏少完全無關緊要。

對於人類棋手來說,這意味著一種嶄新的思維方式。

它的出現,或許會影響接下來一千年人類下圍棋的方式。

除此之外,阿爾法圍棋還能走出一些讓人類覺得是創新的棋步。

最被人稱道的是第二局的第37步棋,按照計算,人類只有萬分之一的幾率會走這樣一步。

阿爾法圍棋走出這一步,證明它已超越了人類的指導。

這一步,讓李世石思考了12分鐘。

而局勢也徹底轉向了。

之前的每個落子全部起了作用,連接了起來。

這一局結束後,李世石稱,他在這一局明顯處於劣勢,從比賽一開始,沒有一刻掌握主動權。

或許是受到了阿爾法圍棋的啟發,在連敗三局之後,李世石也走出了一個創新棋步。

根據計算,人類走出這步的概率同樣不足萬分之一。

正是因為這步,阿爾法圍棋暴露了它的弱點。

它接連犯錯,棋步變得非常異常,勝率評估值不斷下降,最後,舉手投降。

對於這一情況,場外的一名評論員並不感到意外。

他說,如果深度思維有辦法寫出沒有錯誤的程序碼,那會是比阿爾法圍棋更大的新聞。

實際上,儘管在本次比賽中取得了這麼大的勝利,人工智慧依舊還處在萌芽階段。

距離它正真應用到我們的生活中,給人類生活方式帶來巨大改變,也許還要等上不短的時間。

不過,正如阿爾法圍棋給圍棋界帶來的那些啟發,已震撼到很多人,我們也應該試著改變一下傳統的思維方式。

放下人類的傲慢,像人工智慧一樣思考,或許,我們會看到一個不一樣的世界。

文 | 甜叔


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 電影審片官 的精彩文章:

好萊塢老戲骨演技炸裂,甚至比《白夜追兇》里的潘粵明還厲害!

TAG:電影審片官 |