AlphaGo 2.0首局擊敗柯潔
5月23日,「中國圍棋峰會」在烏鎮拉開帷幕,備受關注的世界第一棋手柯潔與AlphaGo 2.0的第一場比賽於10:30正式開始,下午14:50,三番棋第一局,AlphaGo 執白1/4子勝,比分0-1。AlphaGo目前在實力上已經有了較為明顯的優勢,基本上掌控著全場比賽的局面,較為平穩地擊敗了柯潔。新版AlphaGo擯棄了人類棋譜,只靠深度學習的方式成長起來挑戰圍棋的極限,直播地址:http://events.google.com/alphago2017/。
整體賽程如下:
柯潔與AlphaGo的對戰現場
DeepMind創始人Demis Hassabis、柯潔與Google董事長Eric Emerson Schmidt
開賽前夜,柯潔更新微博表示「現在的AI進步之快遠超我們的想像,可它始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛,無論結果,這將是我最後的三盤人機大戰」。
AlphaGo是什麼?
AlphaGo 是第一個擊敗人類職業圍棋選手並戰勝圍棋世界冠軍的程序,是圍棋史上最具實力的選手之一。2016 年 3 月,在全世界超過一億觀眾的關注下,AlphaGo 經過5局對弈,最終以 4 比 1 的總比分戰勝了圍棋世界冠軍李世石,這場比賽成為了人工智慧領域的一個重要里程碑。過去曾有專家預測人工智慧需要十年的時間才有可能戰勝人類職業選手,在這場比賽之後,AlphaGo 憑藉其「充滿創意而又機智」的下法,躋身圍棋界最高職業稱號——職業九段行列,成為歷史上首個獲得這一榮譽的非人類棋手。
近期,AlphaGo的升級版本以」Master/Magister」的稱謂與世界頂級的圍棋選手進行了60場線上快棋對局,並取得了全勝的出色戰績。
AlphaGo如何進行訓練?
一直以來,圍棋就被認為是傳統遊戲中對人工智慧最具挑戰性的項目。這不僅僅是因為圍棋包含了龐大的搜索空間,更是因為對於落子位置的評估難度已遠遠超過了簡單的啟發式演算法。
為了應對圍棋的巨大複雜性,AlphaGo 採用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網路(policy network),將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分布。然後,訓練出一個價值網路(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。這兩個網路自身都十分強大,而 AlphaGo將這兩種網路整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo 產生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往複。
AlphaGo 如何決定落子?
在獲取棋局信息後,AlphaGo 會根據策略網路探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索演算法就能在其計算能力之上加入近似人類的直覺判斷。
AlphaGo 的棋風
AlphaGo最強大的地方,並不體現在具體某一手棋或者某個局部變化中,而是它在每一局棋里所展現出來的獨特視角。雖然AlphaGo的棋風本身並不容易總結,但是總體來說,AlphaGo更傾向於使用一種自由、開放式的行棋風格。在它的世界裡,沒有什麼先入為主的概念,也沒有什麼必須要遵守的規則,這讓它得以打破常規,發現當前棋局中最高效的一手。
※NoSQL資料庫的主主備份
※P語言:為非同步、容錯和不確定性而生的編程語言
※100%代碼覆蓋率的悲劇
※如何看待Kotlin成為Android官方支持開發語言?
※巧用React Fiber中的渲染字元串新功能
TAG:CSDN |
※13分鐘領先5000經濟?RNG首局碾壓VG,Letme反向大招閃現惹爭議
※SKT首局擊敗GRF,faker卻被LCK官方黑慘了!
※DOTA2吉隆坡Major:VG攜手星辰上演首局逆境大翻盤!
※絕地求生PCPI勝者組晉級賽:1246首局14殺吃雞 4am10殺無力回天
※SMLZ團戰走A美如畫,RW對戰BLG首局馬哥打出46.3%傷害佔比!
※LOL-MSI:Letme吸血鬼首局瘋狂Carry,網友表示要道歉!
※iG沖鴨,首局暴打FNC,Caps慘遭安排!
※AG超玩會承包KPL所有笑點,首局打了60分鐘,第二局10分鐘被ko
※LCK季後賽:SKT首局贏了KT,Bang用小炮打出爆炸傷害拿下mvp!
※LOL:EDG首局失利Iboy頂替上場 Iboy:期待廠長的二級抓下
※LCK三大中單回國後偷師Doinb克烈,Faker首局就打出恐怖戰績!
※LOL-LPL:UZI復出首局零封WE!RNG 2-1拿下年後開門紅
※RW首局不敵JDG!Mouse賽前狂打哈欠!賽後一臉錯愕!Doinb嘆氣!
※LPL夏季賽:JDG與WE首局打出大亂斗的效果 9.13版本大家都放飛了
※KZ首局輕鬆擊敗KT,MATA的牛頭叫了一個50分鐘的暫停!
※PGI第二日首局:GEN.G GOLD天命吃雞,4AM戰術變革立竿見影殺入第四!
※Marin凱南靈性大招,多次逆天改命,全場個人秀!TOP首局擊敗VG!
※首局轟18-3!世界第1雅思2-0雙殺印度組合 25分鐘速勝
※LOL:RNG爆冷負於JDG EZ首局先埋伏筆 MLXG次局丟大龍致全隊崩盤
※Alan轉會eStar首局比賽被挖苦,項羽出錯裝備背黑鍋