當前位置:
首頁 > 知識 > AlphaGo雖能戰勝人類卻不會計時:時間控制仍需人類干預

AlphaGo雖能戰勝人類卻不會計時:時間控制仍需人類干預

北京時間6月28日午間消息,谷歌DeepMind的人工智慧圍棋系統AlphaGo已成為全球最知名的深度學習技術應用案例。不過,幫助AlphaGo取得成功的某些代碼仍來自人工程序員。今年3月,AlphaGo以4:1的比分擊敗了韓國圍棋冠軍李世石。根據此前的報道,AlphaGo自己與自己練習了幾百萬盤棋,從而掌握了圍棋技巧。


AlphaGo是DeepMind的兩大神經網路之一。其技術包括監督學習(即研究人類棋手的棋譜),以及增強學習(自己與自己練習,並從中改進)。不過最新消息顯示,有些東西AlphaGo無法通過學習去掌握。


DeepMind研究總監索爾·格雷佩爾(Thore Graepel)表示,最終完成的AlphaGo系統非常善於發現,應當專註於棋盤的哪個區域。不過,AlphaGo並不擅長何時停止思考,完成落子。

這帶來了問題,因為頂級圍棋賽事有著複雜的計時系統。例如,在與李世石的對局中,雙方各有2小時的常規時間去落子,並在時間耗盡後有3次讀秒機會。棋手可以選擇在某一回合中啟動讀秒。但如果全部讀秒時間耗盡,那麼就會被判負。


格雷佩爾表示:「人類能進行複雜的時間管理。在困難的局面下,他們會思考更長時間,而在簡單的局面下,他們花的時間較少。我們試圖讓AlphaGo也能做到這點。」


「時間是重要資源:我們思考某一步棋的時間越長,那麼下法就可能越好。然而,時間是有限的。因此我們提出了一些方法,即如果演算法在更長時間的思考後不會改變決策,那麼我們可以探測出這點。」


研究團隊並未在AlphaGo的圍棋知識中加入時間規則,而是引入了額外的限制。與核心引擎不同,時間演算法是由人工設計的。

不過,這仍完全基於演算法。格雷佩爾表示:「通過評價系統,我們進行了優化。我們會比較不同的耗時曲線,例如在開始階段用時較少,隨後用時增多,或是開始用時較多,隨後逐漸減少。我們測試了哪種方法效果最好。」


因此,目前還不必擔心機器搶走人類的工作,人類仍有工作要做,例如控制秒錶。


請您繼續閱讀更多來自 cnBeta 的精彩文章:

NASA可容忍延遲網路計劃將互聯網擴展向整個太陽系
韓研究團隊打造強大人造神經 讓超級計算機模仿人腦
「殺手機器人」即將成為現實 人類只剩1年時間阻止
NASA懸賞50萬美元為受傷宇航員培養替代器官
揭秘恐怖組織IS黑客團隊 創始人是英國青年

TAG:cnBeta |

您可能感興趣

Braille盲人手錶,盲人也能看時間
「時間旅行」功能,給你一個買 Apple Watch 的理由
微軟Windows時間伺服器出現故障:你看到的時間可能是錯的
fragment design x LV發售詳情正式曝光,這次你不必再次擔心時間有限
iOS 版 Google Map 時間軸上線,可以即時記錄用戶的每日行程
E一把Spartan,用半年時間可勁操
Flyte懸浮時鐘,讓你的時間有跡可循
水晶男孩-Big Bang-Black Pink全部缺席MAMA 官方稱:並沒有摩擦,只是時間不足
安昭熙:Wonder Girls解散以後的時間更重要,希望都能發展好
因為「功能問題」,蘋果Smart Keyboard保修時間延長至三年
Intel期望借Optane記憶體改變運算模式但還需要點時間……
《Life is strange》:即便時間可以倒流,我就真的能救你嗎
《Happy Together》神話成員因「神話時間」成受害者,他是...
鹿晗只用6個時尚Look,一首歌的時間,就能讓你叫他鹿Boss
如果把玩 Facebook 的時間用在工作上,北美經濟可以增長萬億元
Air Jordan 5 「Red Suede」 發售時間確定
Team Cherry表示Switch版《空洞騎士》製作時間將很長 估計需要6
iPhone 8 終於確定發布時間了!新功能要逆天了!這次兩個腎都不夠用...
《Happy Together》神話成員因「神話時間」成受害者,他是……