1:0,AlphaGo 打敗柯潔,用的處理器只有上次的 1/10
烏鎮,5 月 23 日 14 點 52 分。AlphaGo 1,柯潔 0。機器再次在圍棋上打敗人類。
柯潔是目前圍棋等級分排名世界第一的選手。AlphaGo 是 Google 下屬 Deepmind 開發的圍棋人工智慧,因去年 3 月 4:1 戰勝圍棋世界冠軍李世乭成名。
比賽在上午 10 點半開始,下午 14 點 55 分裁判開始數子,比賽歷時 4 小時 25分。
柯潔執黑先手,布局階段使用了 AlphaGo 之前所用,而人類棋手幾乎不會使用的開局「點三三」下法落子。柯潔途中上了一次廁所,和 AlphaGo 最終進行到官子階段,在第 286 手之後開始數子。根據雙方約定的中國式圍棋規則,黑方柯潔九段先手貼三又四分之三子之後以 180 又四分之三子,輸白方四分之一子,以圍棋對決中最微小的差距落敗。
接下來,柯潔還會在 5 月 25 日和 5 月 27 日與 AlphaGo 再下兩盤,在 5 月 26 日,數名中國頂尖職業圍棋選手還會組成團隊和 AlphaGo 進行兩盤團體和配對比賽。
在 AlphaGo 大敗李世乭,並且化名 Master 在線打敗柯潔之後,這次比賽的勝負沒什麼懸念,至少比去年李世乭賽前的期待要悲觀得多。
「一年前我期待李世乭 3:2 或者 4:1 戰勝 AlphaGo,我當時沒預料它那麼強大。今年的結果毫無疑問,AlphaGO 三場全勝。」阿爾伯塔大學教授喬納森·謝弗(Jonathan Schaeffer)賽前對《好奇心日報》表示。謝弗教授是人工智慧專家,曾帶隊製作跳棋和國際象棋程序。
博彩業的預測則是 AlphaGo 勝率 95.24%、柯潔 12.5%。AlphaGo 獲勝賠率 1.05、柯潔獲勝賠率 8。也就是說買 10 元柯潔獲勝,將能獲得 80 元;10 元買 AlphaGo 勝,就只能拿回 10.5 元。
但這次令人意外的地方是,AlphaGo 背後的計算能力只有此前對戰李世乭那會兒的 1/10。
比賽之後的新聞發布會上,哈撒比斯在談到 AlphaGo 的技術細節時解釋說,去年戰勝李世乭時,AlphaGo 的程序需要依靠全世界 Google 很多機房提供計算能力。
而今天的 AlphaGo 的算力需求更小,它不再是分布式運算,整個程序僅運行在一個單一的雲伺服器里。今天 AlphaGo 調用的算力只有對弈李世乭那會兒的 1/10。
換句話說,同樣是戰勝人類頂尖棋手,AlphaGo 的程序性能提升了至少 10 倍。
比賽為期五天,「低調」莫名
除了柯潔和 AlphaGo 的三番棋對局,5 月 26 號還會進行兩場團體賽,分別是古力和 AlphaGo 配對,應戰連笑和 AlphaGo 的組合;另外一場是五位中國圍棋冠軍共同對戰 AlphaGo。
比賽在烏鎮西柵景區的互聯網國際會展中心舉行,安保嚴密。門口停著一輛浙江警方的 PTU 巡邏車、進門社有安檢、負責安保的武警和公安分布在會展中心各處。
有 120 多家中文媒體、十幾家國外媒體在現場報道。媒體和工作人員,包括 Google 中國員工,都在比賽前半個月將個人信息上傳到政府網站,進行備案和審核。
一年前李世乭對陣 AlphaGo 時,比賽安排在首爾四季酒店,現場簇擁著媒體。
在賽前的開幕式上,數位中國政府官員和 Google(Alphabet)董事長埃里克·施密特、Google 大中華區總裁石博盟、DeepMind 首席執行官丹密斯·哈薩比斯 (Demis Hassabis)登台致辭。
「我很榮幸再次回到中國。各位眼前看到的,是一個非常棒的改變世界的機會。Alphabet 帶來的是在人工智慧領域的新嘗試。」施密特說。
據稱是因為有關部門的要求,整場比賽在中國境內沒有視頻直播,曾在 4 月放出預告的CCTV5 體育台直播被換成籃球直播。
你能在 YouTube 上看到現場直播,有中英文語言版本。多家網站曾轉播 YouTube 視頻,但比賽中途全部撤下。
圍棋是人腦在棋類上的最後防線
1996 年 2 月 10 日,IBM 研發的國際象棋超級計算機「深藍」嘗試挑戰當時的國際象棋世界冠軍,俄羅斯棋手加里·基莫維奇·卡斯帕羅夫,這輪六局比賽卡斯帕羅夫保住了勝利,深藍總比分 2 比 4 落敗。
1997 年 5 月 3 日,國際象棋人工智慧「深藍」的升級版「更深的藍」挑戰國際象棋世界冠軍加里·基莫維奇·卡斯帕羅夫,以兩局勝利和三盤和棋,總比分 3.5 - 2.5 獲勝。
比賽前,美國《新聞周刊》在封面上印出「人腦最後防線」的標題。
但其實圍棋才是人腦在公平遊戲里的最後防線。
圍棋棋盤一共有 361 個落子點,平均分配的話,一方棋子佔據的位置加上活棋圍住的落子點只要超過 180.5 個就會勝利。
規則雖然簡單,但是圍棋每一步的可能性都是天文數字,靠計算機窮舉原理上就是不可能的。
而在大眾看來,人工智慧的思考能力不如人類,所以即使在卡斯帕羅夫敗給深藍之後,圍棋也被認為是計算機沒辦法「學會」的一門技藝。
人工智慧和人類下棋的歷史
1996年2月
IBM 超級計算機「深藍」挑戰國際象棋世界冠軍卡斯帕羅夫,但 2:4 落敗。
1997年5月
升級的深藍再戰卡斯帕羅夫,3.5:2.5 戰勝卡斯帕羅夫。
2012 年
Zen 圍棋 AI 在讓 5 子和讓 4 子的情況下兩次擊敗日籍九段棋手武宮正樹,AI 剛剛摸到了人類頂尖棋手的邊緣。
2015年10月
AlphaGo 5:0 戰勝職業棋手歐洲冠軍樊麾二段,這是 AI 第一次戰勝職業圍棋棋手。
2016年3月
AlphaGo 4:1 戰勝職業棋手李世乭九段,圍棋等級分一度超過所有人類棋手位列第一。
2017年5月
AlphaGo 戰勝目前排名世界第一的柯潔九段。
之後十多年裡,圍棋人工智慧的棋藝相距人類圍棋大師甚遠。直到 AlphaGo。
計算性能的進步打敗了象棋大師,計算方法的進步打敗了圍棋大師
人工智慧依託的電子計算機,從誕生之日起,就是比人類強大的多的計算工具。
人類的第一台商用電子計算機,1946 年誕生於美國賓夕法尼亞大學的 ENIAC 和現在的電腦相比非常笨重和遲鈍,但即使是這台佔地幾間大教室的老古董,每秒也可以進行 5000 到 10 萬次加法運算。
在這之後,電子計算機在半導體工業的發展下突飛猛進。1965 年,英特爾的創始人之一戈登·摩爾發表了著名的「摩爾定律「,他提出,大規模集成電路上晶體管的數量,會隨著材料和工藝的進步逐漸增加,大約每隔兩年便會增加一倍,同時計算能力也提升一倍。
回過頭來看,從 1900 年到 2015 年這 100 多年,人類計算機機器的性能確實沿著「摩爾定律」發展。從 1900 年代用於人口普查的機械製表器每分鐘 150 次計算能力開始,到 2016 年 Nvidia 推出的 GeForce Titan X 顯卡,在火柴盒大小的晶元上已經集中了 80 億個晶體管。
關於戰勝卡斯帕羅夫的「深藍」有一種誤解,認為超級計算機深藍是靠單純的「窮舉」,通過計算所有的可能性來實現勝利。實際上,深藍的算力約為每秒 2 億步棋,想要窮盡國際象棋十的四十五次方這個級別的可能性需要十的二十九次方年的時間,這顯然不可能。
最終在公平遊戲中戰勝人類的 AlphaGo 同樣不依靠窮舉,現在看來,它也不是非常依賴電子計算機的發展。
2013 年開始,國際半導體發展路線圖組織的數據顯示,摩爾定律已經逐漸失效,每兩年增加一倍的計算里已經逐漸擴大到了三年,隨著材料和工藝瓶頸,摩爾定律最終可能完全失效。
今天英特爾的處理器已經不能維持摩爾定律,每年的產品升級更多是在降低製造成本。
而 Nvidia 的性能提升則依賴於顯卡本身,因為顯卡對功率和散熱的需求不是那麼苛刻,頂級顯卡都是板磚那麼大的一塊,所以核心面積可以比 CPU 更大,晶體管更多,運算能力更強。
相比於過去 50 年的飛速發展,大規模集成電路最終可能進入原地踏步的境地。
AlphaGo 打敗人類,靠的是深度學習。上一個版本的 AlphaGo,每秒鐘可以計算幾百萬步棋,通過大量學習人類棋局,用這些經驗自我對弈產生新的經驗,用這些新經驗來下棋。
而後 AlphaGo 再利用蒙特卡羅樹搜索產生下一步對應的下法,最後配合「亂下」產生的對局面的評估,最終取得勝利。更詳細的解釋,可以看這篇文章。
這次戰勝柯潔的 AlphaGo 一定用了新的演算法和邏輯,才能在十分之一的算力里完成戰勝人類頂尖棋手的圍棋水平。
「圍棋,我還是喜歡跟人下。」柯潔在比賽結束後的發布會這麼說道。
題圖來自 Google
※大公司頭條:微軟發布中國政府版 Win 10,成立合資公司管理系統升級;樂視美國裁員七成,說接下來只做華人生意;全球最大同性戀社交網站也被中國公司買了,1.52 億美元
※你會在各種談及美學的地方看到「浪漫」,這究竟是什麼意思?
※為了預防太空戰,有個國際聯盟草擬了份太空戰法律手冊
※政府能為紅燈區做什麼?阿姆斯特丹有點焦頭爛額
TAG:好奇心日報 |
※一天出道職業哥100次 OpenAI要做打遊戲界的AlphaGo
※李飛飛等華人入選ACM 2018 Fellow;生物界的「AlphaGo」來了;吳恩達《機器學習》筆記
※IJCAI 2018所有獎項出爐:AlphaGo獲獎,中國研究成果佔據半壁江山
※早報:柯潔對戰中國AlphaGo,地平線推基於征程2.0的計算平台
※詳解AlphaGo到AlphaGo Zero!
※AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
※AlphaGo「兄弟」AlphaFold出世,DeepMind再創記錄
※打敗柯潔的AlphaGo有了繼任者AlphaZero 國際象棋/圍棋/將棋通殺
※與前輩Alphago相比,openAI現在還只是個弟弟
※AlphaGo後再出神作!DeepMind打造AlphaFold擊敗人類,精度碾壓人類專家!
※想當AlphaGo的 Open AI,玩刀塔時為何又慘敗給人類了?
※AlphaGo首席研究員親授!10張PPT介紹10大強化學習黃金法則!
※最小化類 AlphaGo Zero 引擎——Nochi
※人工智慧AlphaGo Zero是一個突破,那它呢?
※AlphaGo之父DeepMind再出神作,PrediNet原理詳解
※AI 計算四年之內,沒人玩得起下一個 AlphaGo
※柯潔和AlphaGo曾經的對戰前瞻
※AlphaGo Zero代碼遲遲不開源,TF等不及自己推了一個
※AlphaGo Zero又上《Science》封面!谷歌的人工智慧又干翻人類了!
※如何評價 AlphaGo Zero?