當前位置:
首頁 > 新聞 > 三連敗!圍棋5高手群毆難敵AIphaGo!田淵棟、顏水成、鄧侃解讀人機協作與團體對戰

三連敗!圍棋5高手群毆難敵AIphaGo!田淵棟、顏水成、鄧侃解讀人機協作與團體對戰

三連敗!圍棋5高手群毆難敵AIphaGo!田淵棟、顏水成、鄧侃解讀人機協作與團體對戰

新智元報道

三連敗!圍棋5高手群毆難敵AIphaGo!田淵棟、顏水成、鄧侃解讀人機協作與團體對戰

新智元獲得的最新消息,在剛剛結束的五名中國棋手(陳耀燁、時越、羋昱廷、唐韋星、周睿羊)對陣 AlphaGo 的比賽中,人類棋手執黑告負,繼柯潔兩連敗之後在人機pk中再輸一場。

在上午結束的圍棋界歷史上首次人機協作大戰中,連笑和 AlphaGo 的組合中盤第220手執白戰勝古力和 AlphaGo 的組合。

三連敗!圍棋5高手群毆難敵AIphaGo!田淵棟、顏水成、鄧侃解讀人機協作與團體對戰

在五人團體賽中,人類棋手的每一步棋,都由五名棋手討論後決定。

三連敗!圍棋5高手群毆難敵AIphaGo!田淵棟、顏水成、鄧侃解讀人機協作與團體對戰

五個人類真的能抵上一個「阿老師」嗎?就此問題,新智元採訪了幾位專家。

Facebook 研究員田淵棟表示:」這種下法當然很有意思,不過五個人可能不能提高勝算,主要是意見不會太統一。大家想不到的招,五個人一起也一樣(想不到)。」

360首席科學家顏水成表示:「如果配合好,後續算棋時可以算得更准。(機器)有些招式人開始理解不了,只能後面反推才能明白。」

對於上午的人機配合比賽,田淵棟說:「人和機器的協調是挺有意思的。很多時候人不理解機器的意圖,回頭想來覺得機器還挺有道理的,如果機器太強,可能人幫不上什麼忙,如果機器有明顯弱點,那人可以補上。「

資深技術專家、CMU 博士鄧侃說:群毆也無濟於事。五個人的腦子合在一起,算力能抵得過 TPU 嗎?(這種下法能夠)營造熱鬧的比賽氣氛,提高觀賞性,吸引注意力。

古力在解說本場比賽時透露,團隊賽中棋手團隊派出周睿羊為代表,是因為他對 AlphaGo 的棋局有著深入的研究,有「Alpha羊」之稱。古力還透露,柯潔曾自告奮勇要為棋手團隊執子,擔任「機械臂」,但因棋手團隊擔心「柯氏機械臂」自作主張而作罷。

圍棋歷史上首次人機協作大戰

和 5 對 1 的比賽相比,上午的人機協作大戰也許更值得玩味。在上午結束的圍棋界歷史上首次人機協作大戰中,連笑和 AlphaGo 的組合中盤第220手執白戰勝古力和 AlphaGo 的組合。

三連敗!圍棋5高手群毆難敵AIphaGo!田淵棟、顏水成、鄧侃解讀人機協作與團體對戰

比賽過程首先是一次人與 AI 的溝通過程。兩方的 AlphaGo 都走出了一些本方搭檔不能理解的招數,讓連笑與古力兩位人類選手有些無所適從。而當人類選手出招發難時,AI 似乎也不能完全理解人類的意圖,並不能完全配合。

三連敗!圍棋5高手群毆難敵AIphaGo!田淵棟、顏水成、鄧侃解讀人機協作與團體對戰

這種感覺就像玩實況足球時,你拿球看到空檔,AI 控制的隊員卻遲遲不懂跑位。唯一的區別是,在圍棋中,我們現在更傾向於相信,更聰明的那個是 AI。

有趣的細節有三點:

  1. 比賽進行到中盤,連笑和 AlphaGo 的組合明顯處於下風,解說員和現場觀眾紛紛認為勝負已定。此時連笑的 AlphaGo 隊友招數明顯變得激進;不難想像,在 AlphaGo 左右互搏自我訓練的寂寞時間裡,AlphaGo 內部經常有這樣的激烈對招,AlphaGo 因此才成為了今天的 AlphaGo。而今天的比賽,對 AlphaGo 來說,不過是自我對弈過程的外化;

  2. 此後,連笑和 AlphaGo 的配合忽然非常順暢,連笑對 AlphaGo 棋路的理解,至少從當時的局勢看,似乎在古力之上,而這一點,也成為了致勝的關鍵;

  3. 比賽進行到最後,古力的 AlphaGo 隊友已經提出認輸,卻被古力拒絕;在這之後,古力的 AlphaGo 隊友招數明顯變得保守而消極,正如很多觀戰的人士指出的,古力的 AlphaGo 隊友似乎在「逼」古力認輸。

解讀:人機協作還需探索

David Silver 在烏鎮的演講上曾經表示:「這一代 AlphaGo 如此強大的原因之一,是我們使用了最好的數據——AlphaGo 自我對弈的數據。所以,AlphaGo 實際上成了自己的「老師」,每一代生成的數據都成為下一代、更強一代的訓練材料。我們使用這一過程,訓練了更強大的策略網路和價值網路。」

「具體說,我們讓AlphaGo自我對弈,也就是通過強化學習,生成大量數據,訓練下一代的AlphaGo。這時,策略網路就使用它自己生成的數據,在不進行任何搜索的情況下,自己訓練自己得出最強大的走法,由此得出了目前最強大的策略網路。」

這裡的問題在於,今天對戰雙方的 AlphaGo,都不知道自己在協同作戰。在整個過程中,只有兩位人類選手清醒地認識到他們是在協作,他們會去主動配合 AI 的走法,並預測自己 AI 隊友的招數。而對於兩台 AlphaGo 來說,今天的比賽和它們無數次進行的自我對弈沒有區別。

簡言之,它們只是根據最新的棋盤局面,去考慮接下來自己該怎麼走。它們沒有意識到,接下來的每一步,都仍然需要配合完成。

目前確實還沒有官方消息,顯示 DeepMind 為此役對 AlphaGo 進行了哪些演算法上的調整。但無論是今天場上的局面看,還是從時間點上判斷,這一演算法和與柯潔對弈的 AlphaGo 單打獨鬥版本沒有太大區別。

實際上,關於多智能體協作的研究一直在繼續,但 DeepMind 似乎並未本次參賽的 AlphaGo 上加入相關研究成果,正如新智元此前在文章中報道的,DeepMind 此來,本就是醉翁之意不在酒。

此前新智元給大家介紹過,阿里巴巴認知計算實驗室與倫敦大學學院計算機系合作,以遊戲「星際爭霸1」(下簡稱「星際」)中的微觀戰鬥場景為測試環境,深入地研究了多個 AI 智能體之間的協作問題,旨在通過協作智能解決人類不擅長的問題。

人機協同的未來

仍然是新智元此前的特別推薦:鋼鐵俠 Elon Musk 曾表示,人機協同才是人類的未來——「人類只有一個選擇,成為 AI。」 (點擊【2萬字巨獻】馬斯克腦機融合系統Neuralink:人類只有一個選擇——成為 AI閱讀)

Elon Musk 視通信帶寬為決定人機融合程度的關鍵因素,同時將人機融合程度視為我們未來在AI世界中生存的關鍵因素:我們或者被遠遠拋在身後,全無用處,被當做寵物(如家貓)對待;或者最終找到某種與AI共生及融合的方式。之後他補充道:能被當做家貓還是算是不錯的結局呢。

在完全無法想像未來充斥著 AI 的世界是什麼樣子的前提下,在超級智能時代到來之前,通過人機融合實現對人類物種的保護聽起來挺靠譜。AI 時代人類可能會受到的威脅將來自於利用 AI 作惡的人類以及與人類利益相悖的AI。當絕大多數人類都能控制一部分AI,與AI共同思考,利用AI自我防禦,或通過與AI融合,進而基本上能完全理解AI的想法,人類就處於不那麼危險的境地了。

人類會變得從未有過的強大,也是很恐怖的一件事,但是如 Elon 所講,如果人人都是超人,單個人就很難造成大面積傷害,會有很多限制和平衡加以制約。人類也因此不太可能對AI整體完全失控,因為AI將以多種目的廣泛存在。

微軟副總裁洪小文在北大 AI 公開課上也表示:人類智能和人工智慧的共進化(HI+AI)才是未來的真正趨勢。

從這一角度上,這場比賽的意義又不是作秀那麼簡單。或許我們可以理解為,是一個沒有做好協作準備的 AlphaGo,來參加了一場人機協同大戰,從中,每個人都窺到了未來的影子。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

百度發布升級版 Deep Voice 2,神經網路實時生成,完美模仿數百種聲音(論文下載)
CPU和GPU雙低效,摩爾定律之後一萬倍——寫於TPU版AlphaGo重出江湖之際
柯潔中盤再敗!谷歌乘AlphaGo之勢強推TPU,與英偉達必有一戰
亞馬遜 AI 正在吞噬這個世界:在賺錢的同時「被迫」升級自己的技術基礎設施

TAG:新智元 |

您可能感興趣

Circle 團隊-烯量資產OFC OCC研發團隊的戰略解讀
Michael I. Jordan帶你解讀百萬獎金ATEC螞蟻人工智慧大賽
Michael I. Jordan帶你解讀百萬獎金ATEC螞蟻人工智慧大賽
專欄 | 基於IR-transformer、IRGAN模型,解讀搜狗語義匹配技術
基於IR-transformer、IRGAN模型,解讀搜狗語義匹配技術
KOL解讀TouchBoost,遊戲時,讓手機充滿鬥志
AITech 專場回顧:學界、產界、政策三方解讀超高清與VR技術的機遇與挑戰
銳龍背後的功臣!AMD Zeppelin多核心架構和封裝系統解讀
AlphaGo背後的秘密!解讀谷歌全面重磅開放的雲TPU
解讀GitHub、Apache疑云:主流開源軟體是否會被閉源?| CSDN獨家
乾貨!聽英特爾Rob Topol解讀5G、物聯網和邊緣計算
業界首部!系統解讀NB-IoT、LoRa、Sigfox等低功耗廣域物聯網產業市場
權威解讀!iPhone比Android手機更安全?
解讀!優秀Logo設計的構成秩序
無線電競最為致命:金士頓 HyperX Cloud Flight 耳機詳細解讀
NFS-Ganesha 核心架構解讀
深度解讀重要變革FBA Onsite:機遇和挑戰
多篇文章解讀MicroRNA在機體健康中的關鍵角色!
打造「高街零售商中的 Harrods」!新東家解讀高端百貨 House of Fraser 改造戰略,將保留多數門店
Kubernetes 網路、監控技術全面解讀!