不是為了輸贏!柯潔 VS AlphaGo 大戰之前,你需要知道的幾大看點
雷鋒網按:AlphaGo 終於又來了。5 月 23 日,也就是明天,曾在去年以一己之力將 「人工智慧」 浪潮帶到新層次的圍棋人工智慧 AlphaGo 就將再次出馬。在這次為期 5 天的活動當中,AlphaGo 將會與世界最頂尖圍棋選手柯潔展開正式對決,同時還會進行耳目一新的 「配對賽」 以及 「團體賽」。
目前雷鋒網了解到的具體賽程如下:
? 5 月 23 日,開幕式、柯潔 vs AlphaGo 三番棋第一場;
? 5 月 24 日,人工智慧論壇;
? 5 月 25 日,柯潔 vs AlphaGo 三番棋第二場;
? 5 月 26 日,配對賽,團隊賽(相談棋);
? 5 月 27 日,柯潔 vs AlphaGo 三番棋第三場。
這次比賽核心目的只有一個——在公開場合驗證 AlphaGo 的實力,看是否已經打造出了在圍棋上超越所有人類的 「AI」。
作為國內最重要的科技媒體,雷鋒網也將全程跟蹤此次賽事。但在比賽正式開始前,有幾個問題你可能需要了解一下:
1. 這次的 「新 AlphaGo」 跟 「老 AlphaGo」 有什麼不同?
2. 柯潔能否戰勝 「新 AlphaGo」?
3. 比賽相關直播應該如何觀看?
新 AlphaGo:砍斷 「人類束縛」
作為一個從 2014 年發展至今的圍棋人工智慧項目,其實 AlphaGo 在發展歷程中使用過多個名字,比如最早期亦城圍棋上的 「DeepMind」,又或者是之前在野狐平台上的 「Master」。那麼這次的 「新 AlphaGo」 是否也只是一個新名字?
答案必然是否定的,之前起新名字很可能有保密、個人喜好等原因,但這次新添加的 「新」 字只為了突出一點——這是 「機器自學」 為主的一版 AlphaGo。
這一點判斷的線索,來自於今年初,Master 在網路上一口氣橫掃 60 名人類棋手的時候。當時 Master 第二次戰勝柯潔之後,棋聖聶衛平曾表示:
Master 改變了我們傳統的厚薄理念,顛覆了多年的定式。圍棋遠不像我們想像的那麼簡單,還有巨大的空間等著我們人類去挖掘,阿法狗也好,Master 也罷,都是『圍棋上帝』派來給人類引路的。
著名棋手古力在成為 Master 的第 60 個手下敗將,之後,也在微博發表了自己的感受:
作為第 60 個勇士,犧牲了。。。經過這幾天的對局,我深深的感受到圍棋的神秘,似乎 Master 給我們打開一道圍棋的神秘之門,不論勝負,人類與人工智慧共同探索圍棋世界的大幕即將拉開,新一次的圍棋革命正在進行著。。。
這種表現,與將近一年前的 「老 AlphaGo」 可謂天差地別。想要達成這樣的成績只有一種可能——DeepMind 尋找到了一種機制來擺脫圍棋中的 「人類束縛」。
迷之改進:一舉讓 AlphaGo 成為人類老師
作為一個極其特殊的棋類和任務,圍棋擁有數量極其龐大的可能性,總的局面數量達到 10^172,而可觀測宇宙範圍內的原子數量不過 10^80。這也意味著窮舉絕對不是一條明智的路線。
最終 DeepMind 給出了一套能夠 「模擬」 出人類頂尖高手的方案:深度學習 + 蒙特卡洛搜索樹 + 自我進化。
這一套架構在 DeepMind 發布在《自然》雜誌中的論文中已經有詳細敘述,
(https://www.nature.com/nature/journal/v529/n7587/full/nature16961.html)
如果你對其中的細節感興趣,推薦閱讀國內人工智慧創業公司彩雲 AI 創始人、CEO 袁行遠在知乎上的相應回答。
(https://www.zhihu.com/question/41176911/answer/90118097)
深度學慣用以分析人類棋盤,蒙特卡洛搜索樹用來減輕工作量,自我進化用來提升能力。但有限的運算能力還是給 DeepMind 出了一個不小的難題,後者最終想出了一個辦法:只對學習到的人類棋招進行蒙特卡洛搜索樹運算,這恰如人類棋手依賴定式。
定式,又名定石,指的是人類下圍棋長久積累下來的一種經驗,對弈雙方在特定情況下會遵循固定下法。著名棋手吳清源則將簡單描述為 「在角部彼我棋子接觸時最合理的走法」。
這些定式被記載在各式各樣的棋譜當中,成為新手入門必看的書籍。
雖然定式是某種意義上是最合理的走法,但它卻是理想化條件下的產物,想要完整復現定式,意味著雙方都必須抱有同樣的理想化思路。而歷史上並不缺乏不遵守定式,或者用新定式打敗對方的事例。
問題來了,為什麼千變萬化的圍棋會出現定式?而且死守定式會輸,不學習定式也會輸。答案只有一個——人類需要定式來減少圍棋上面的變化,這樣進入中盤之後人類才能利用自身能力掌握棋局走向。
湊巧的是,這回我們遇到的是運算能力遠超人類的計算機,讓掌握更多乃至全部圍棋奧秘擁有了一絲可能。
但究竟新 AlphaGo 怎麼樣擺脫 「人類束縛」?參考之前 「老 AlphaGo」 的工作方式,排除運算過程中所有人類元素可能是最徹底的方法。但這樣一來就必須找到另外一種減輕運算壓力的策略。目前來看,這個秘密也只能等 DeepMind 方面稍後公開了。
人類敗局已定?
儘管去年人類代表是韓國選手,但明眼人都可以看出當下和去年圍棋人機比賽的熱度差別。這從另外一個側面也反映出了絕大部分觀眾的看法:這次人類要輸。而去年 3 月李世乭 1:3 扳回一局時,柯潔還曾在直播中表示:
我們必須承認谷歌就是了不起, AlphaGo 確實是超一流的水平,但是也沒有到不可戰勝的地步。
而在上個月的發布會上,柯潔卻顯得尤為謙遜:
有點小緊張,但我不會輕易言敗,在阿爾法圍棋出現之前,我以為計算力是 AI 的優勢,後來讓我震驚的是他的大局觀,AI 的宏觀思維讓我很佩服。AlphaGo 圍棋讓我們重新思考,這麼下是不是錯的,會給我們很多啟發,輸的痛苦是外界無法想像的,我會不惜一切去追求勝利。
「輕易言敗」 這樣的措辭與其在央視節目上的慷概激昂形成了強烈對比。客觀公正地說,柯潔的勝算很小,三番棋中哪怕有一盤能夠獲勝都是成功。
而另外兩場比賽(配對賽、團隊賽)同樣值得認真關注,這兩場比賽中,人類棋手將首先與 AlphaGo 配對比賽、然後再 「群毆」AlphaGo。這不僅體現了 DeepMind 的自信,同時也再次突出本次本次圍棋峰會的主題:
頂尖棋手以賭局開創性的方式為世人帶來精彩絕倫的棋藝展示,挑戰人類智慧的極限。同時 AlphaGo 與世界最優秀的棋手相互啟發,共同探索圍棋背後的深遠奧秘。
換句話說,別再糾結人類和機器誰輸誰贏了,趕緊認真感受科技帶來的巨大改變、預見未來吧!
※相聚蘇州,共話人工智慧與自動駕駛
※獨家 | 梅卡曼德機器人獲數千萬Pre-A輪融資,華創資本領投
※AAAI協會主席 Rao:中國AI研究進步喜人,創業風氣無處不在 | GAIR 2017
TAG:雷鋒網 |
※亞馬遜Prime Day要來了,你需要知道這些
※快被數據淹沒了!然而你還是需要這個-Google Analytics:生命周期價值新功能介紹
※OPPO Find X雖然驚艷,但是這些缺點你也需要了解
※關於微軟新推出的Your Phone App,還有這些細節你需要知道
※關於URL Schemes,你需要知道這些
※不用修圖App,不用單反,不用腳架,三秒拍出Vivid Sydney大片,你只需要帶上它!
※關於最新的 Material Design 這裡是你需要知道的全部重點
※不是每個人都是Lady Gaga,可以融入生活的妝才是你需要的!
※不需要 Root,也能用上強大的 Xposed 框架:VirtualXposed
※三星Galaxy Tab S4:你需要知道的一切
※不需要 Root,這個方法教你用上 Android 最強大的 Xposed 框架
※下一件街頭火熱單品!你需要攢錢買Virgil Abloh設計的Louis Vuitton球鞋了!
※Core i5 cpu對大多數人來說都很好你真的需要i7的額外功能嗎?
※中籤 CONVERSE 的幸運兒是你嗎?除了全新 CONVERSE x Virgil Abloh 之外,你更需要一個聯名 「三級盔」!
※你的 iPhone 需要換電池么?這事必須知道!
※Thrasher的人需不需要會滑板
※OPPO FindX和vivo Nex的5個「遺憾設計」,你更需要哪一個?
※To Buy and Not To Buy,你需要「買手思維」
※關於第二代ARKit,你需要知道的都在這裡了
※iOS Electra工具最新消息,不需要開發者帳號也能使用!