走,跟AlphaGo下棋去!
5月23日,傳說中的「人機大戰第二季」上演了,這一次,AlphaGo2.0來到了中國烏鎮。AlphaGo2.0與圍棋現排名世界第一的柯潔九段進行了三番賽對弈(此前都是五番賽)的第一場,結果是AlphaGo執白1/4子險勝。這一從去年夏天就「被謠言」的消息,在各方的期待中變為了現實,意義就不僅僅局限在圍棋領域。當下,在金融、醫療、教育等各個領域,人工智慧對於人類社會的基礎性變革影響力已經展開。這種變革的過程進展飛快,它把我們又捲入了一波技術浪潮帶來的、打破均衡、再造均衡的過程。
AI進化者:AlphaGo、Master、AlphaGo2.0
人工智慧(AI)和機器人領域的從業者,都對2016年3月李世石與AlphaGo的對決印象深刻。這場「人機大戰」讓AI從幕後走向了台前,幾乎每一位地球人都意識到了AI的發展已經走進了日常生活,未來,還將顛覆我們的生活。
追根溯源,AlphaGo是一款由Google旗下DeepMind團隊研發的圍棋人工智慧程序。「破解智能,用它來讓世界變得更好」是打開DeepMind官網後,清晰可見的口號,DeepMind公司早在2014年就以4億英鎊的價格被谷歌收購,今時今日仍是Google截至目前在歐洲地區的最大收購案。而在Google之前,包括特斯拉創始人馬斯克、Facebook創始人扎克伯格在內的許多矽谷大佬們也都曾向DeepMind拋出過橄欖枝。
人工智慧程序AlphaGo首次被大眾熟知是在2015年,因其在沒有讓子的前提下以5:0擊敗中國旅歐職業棋手、歐洲冠軍樊麾。
隨後,AlphaGo以4:1戰勝世界圍棋名將李世石,這場被稱為全球頂級「人機大戰」的對抗中,AlphaGo的實力首次被世人真正認可。
但是,圍棋界人士也表示,李世石心態上準備不足,在比賽中未必發揮出真實的最高水準。DeepMind創始人Demis Hassabis在賽後也表達,希望AlphaGo能與中國的高水平棋手對弈。
AlphaGo在未能「華山論劍」的時間裡,江湖還是有它的各種傳說,比如「化身」 Master標註為韓國九段,在圍棋網站弈城與野狐上不斷發起挑戰,先後擊敗了包括世界冠軍常昊、時越、羋昱廷、唐韋星、古力在內的諸多好手,以及「韓國第一人」朴廷桓與「日本第一人」井山裕太都敗北。世界排名第一的柯潔也在與Master的對抗中敗下陣來。直到最後,Master宣布自己就是AlphaGo,而代為執子的就是AlphaGo團隊的黃士傑博士。
在結束了Master的測試後,DeepMind團隊於1月下旬宣布推出新版「AlphaGo」,也就是這次來中國的AlphaGo 2.0。這一版本的升級亮點是——摒棄人類棋譜,即僅通過監督學習和強化學習,再度進化出新的「圍棋機器人」。
柯潔遭遇了一個全新的、更強大的對手。
執黑的柯潔落下了第一子
AlphaGo為什麼能不斷贏
一直以來,圍棋就被認為是傳統遊戲中對人工智慧最具挑戰性的項目。這不僅僅是因為圍棋包含了龐大的搜索空間,更是因為對於落子位置的評估難度已遠遠超過了簡單的啟發式演算法。
在AlphaGo出現之前,基於傳統演算法的圍棋程序僅能達到業餘棋手的水平,遠遠不能令人滿意。而AlphaGo橫空出世後,首戰即以5:0大勝歐洲圍棋冠軍樊麾二段,展現出不俗的實力。因此,說AlphaGo的出現嚴重動搖了人類智能在圍棋上的壟斷,是毫無問題的。那麼,AlphaGo及其研發團隊DeepMind都有什麼亮點呢?
在談及AlphaGo及其開發團隊DeepMind之前,必須先介紹一下其領導者Demis Hassabis,可以說,在他出現之前,幾乎所有研究者都認為在十年內人工智慧戰勝圍棋大師的機會是渺茫的。而在他出現以後,幾乎所有人都在驚呼人工智慧已破解了圍棋這一歷史難題,甚至在極短的時間內兩次讓研究成果上了《Nature》雜誌的封面。因此,英國《衛報》直呼Hassabis就是人工智慧領域的超級英雄。Hassabis個人完全配得上這個稱謂。
據《衛報》報道,Hassabis的終生目標就是開發出「通用」的人工智慧程序,來解決生活中的一切問題。他分別取得了劍橋大學和倫敦大學學院的計算機科學和神經科學學位。Hassabis稱自己領導的項目就是「21世紀的阿波羅項目」,這也難怪AlphaGo在擊敗了李世石九段之後,Hassabis第一時間在Twitter對團隊的祝賀中用「登月」形容圍棋程序擊敗人類頂尖棋手的意義。而在此之前,DeepMind通過對近期人工智慧技術中最熱門的一項技術——深度學習網路,加上「強化學習」的方法使計算機通過自學的方式在上世紀七八十年代的雅達利經典遊戲中,獲得了近乎人類的表現。而這一成果在更早先的時候登上了《Nature》雜誌的封面。擁有千年歷史的古老遊戲與三十年前的像素遊戲紛紛被人工智慧攻破,恐怕在未來若干年間,人工智慧在任何遊戲中都強於人類也不會是太令人震驚的事情吧。
以上所有人工智慧領域的發展,都離不開一項技術在近年來的突破,那就是深度學習(Deep Learning),深度學習是傳統的神經網路技術的再發展。何為神經網路?神經網路就是人類提出的一套模擬大腦工作方式的計算機演算法。人的大腦有100億個神經元,人類對於環境的感知,對於未知事物的認知與神經元的「可塑性」息息相關,人腦通過對特定的人物或者感興趣的知識進行「建模」,神經元形成相互連接的「神經網路」,並通過互聯神經元的連接強度,即突觸權值來儲存知識。而所謂人工神經網路,就是將化簡後人腦的神經元模型實現於電子計算機之上,從而得到類似於人腦的功能,使計算機可以通過「學習」從外界環境中獲取知識。
輸贏並不是AlphaGo的目的
最初等的人工神經網路出現在20世紀50年代末的「感知機」模型,初步展現了人工神經網路的學習能力,後來的研究表明感知機模型只能解決很有限的幾類問題。神經網路的最新發展——深度學習方法源於Geoffrey Hinton教授等人三十多年來的不懈努力研究和推廣,自誕生之日起,即在機器學習領域中大放異彩,通過深度學習方法訓練出來的模型,在某些特別的圖像識別和語音識別的任務中,甚至有超過人類的表現。在當下,深度學習方法是最接近人類大腦的人工智慧學習演算法。
據AlphaGo官方介紹,AlphaGo採用的是一種更加「通用」的人工智慧方法,即將改進的蒙特卡洛決策樹演算法與深度神經網路演算法相結合的方法構建最終的學習系統。其中,深度神經網路由一個多達12層的包含上百萬個神經元節點的神經網路構成,其包括兩個部分:策略網路與價值網路。具體的技術細節在此不贅言,僅說說其發揮的作用。策略網路在當前給定的棋局中,負責預測下一步的走棋,並對下一步走棋的好壞進行打分,如果是好棋,就打高分,最終,最高分的走法被策略網路選為下一步棋的走法。而這個最高分要如何評定呢?此時,現存於人類資料庫中的圍棋棋譜的作用就體現出來了。對比以往高手對決的棋譜,如果如此走法能得到最終的勝利,那就是好棋,這步就可以評高分,因為以往棋譜的勝負是已知的,反之亦然。在這裡,人類歷史上的大量圍棋起了訓練數據的作用,好比老師在「監督」學生做練習,答對了就給高分,答錯了不給分。通過對於三千萬步人類棋譜的學習,AlphaGo對於人類棋手下一步走棋的預測準確率高達57%(之前為43%)。策略網路的作用好比「模仿」人類棋手的各種走法,以達到預測的效果。
然而僅憑模仿無法擊敗最頂級的人類高手。因此,AlphaGo增加了價值網路來判斷當前的局面,到底對哪一方有利。這一步類似於國際象棋程序中的估值函數,而具體的實現方法卻有所不同。象棋程序中需要人工調整估值函數中的權重,以達到最好的效果,甚至需要水平極高的國際特級大師參與調整參數。而圍棋程序的局勢評估相當困難,只能通過深度學習網路之間自我訓練的方法來達到良好的效果。與國際象棋程序相比,圍棋好比人類用自己的知識訓練電腦,使其達到人類高手的水平。而國際象棋程序則是人類親自將行棋的方法與邏輯設計為電腦程序,最終由計算機代表人類與人類高手進行對弈。
AlphaGo下圍棋的原理和人類有相似之處,一是判斷局部,二是把握全局。但是,AlphaGo就不會輸嗎?並不竟然。從原理上來說,在大數據時代,更加複雜且更加強大的深度學習模型能深刻揭示海量數據里所承載的複雜而豐富的信息,並對未來或未知事件做更精準的預測。但是,深度學習也有瓶頸——延遲反饋的問題。所以AlphaGo下圍棋也不是深度學習包下所有的,它還有強化學習的一部分,反饋是直到最後那一步才知道你的輸贏。還有很多其他的學習任務都不一定是深度學習才能來完成的。
AlphaGo下圍棋背後的DeepMind 方法其實就是深度學習和強化學習混合體,被稱為「深度強化學習(deep reinforcement learning)」。簡單來說,在這之中,深度學習是主體,強化學習解決了延時反饋的問題。
AlphaGo之父、柯潔以及Alphabet董事長施密特
AlphaGo的行業複製
目前,AlphaGo取得的研究成果正在快速複製到各行各業,谷歌旗下的DeepMind做的第一件事情是用機器學習來管理數據中心。為了解決伺服器集群的冷卻管理問題,DeepMind訓練了三個神經網路,並在某一個數據中心進行了應用,比人管理的時候節電40%。DeepMind認為,這個神經網路不只可以用於數據中心,具有一定的通用性,準備把它發展到發電廠、半導體製造等行業。
DeepMind也將神經網路帶到了醫療領域。有數據顯示每11個成年人里就有1個會得糖尿病,糖尿病讓患者失明的概率提高了25倍,如果失明的癥狀能在早期發現,那麼有98%的可能性治癒。DeepMind與一家叫Moorfields的機構合作,拿到了近百萬的原始數據。用這些數據來訓練神經網路,然後從圖片中提取特徵,神經網路在圖像識別上的錯誤率比人低,未來準確率會越來越高。
資深的程序員和性能強大的電腦對AI業務至關重要,但獲取真實環境數據也至關重要。利用AI和機器學習技術改進醫院、電網和工廠等場合的不同系統時,需要具體的操作數據。
當然,它所屬的Google公司擁有海量可服務於這些目的的數據,以供DeepMind「挖寶」。但有關每個細分領域,DeepMind現有的數據還遠遠滿足不了需求。最近它參與了一個研究讀唇語的項目,並取得了成功,而成功的關鍵就在於研究團隊掌握了一個龐大的數據集。該項目的研究團隊主要來自牛津大學,並以計算機視覺研究者安德魯?西塞曼(Andrew Zisserman)為首。BBC向研究團隊提供了數十萬小時的新聞剪輯資料。如果沒有這些資料,他們根本無法讓AI系統接受讀唇語的訓練。
數據獲取對DeepMind未來的重要性,Hassabis持輕描淡寫的態度。他稱,讓人類工程師打造出模擬待解決問題的模型就足夠了,再在這些模型中部署AI學習工具。但這並不是目前大多數機器學習系統的運作方式。如果DeepMind需要收集大量個人信息,它將需要考慮清楚:如何應對消費者對企業訪問個人數據這類行為的擔憂?
近期就有類似問題曝光,DeepMind 被指控通過非法交易獲取160萬份 NHS(英國國民醫療服務體系)患者病歷。英國國家數據監護機構(National Data Guardian) Fiona Caldicott 女爵於2月20日在致皇家自由醫院信託會醫療負責人 Stephen Powis 的信件中披露了這一信息。這封信被泄露給 Sky News 並於5月初被公之於眾。
如果DeepMind能夠解決這類問題,它將是人工智慧推向行業的無價之寶:一個演算法工廠。它將遠不僅僅是Google的AI研究機構和人才集聚地。DeepMind處理過的數據仍屬於原本的擁有者,但從數據中學習的軟體將屬於Google。無疑,在未來,DeepMind將把AI程序用來解決複雜問題,但它或許無法靠這種方式來創造大量營收。然而,AI軟體通過分析數據獲取的知識或技能將極具價值,讓Google為曾經的天價競標付出的一切努力物有所值。
人工智慧超越人類了嗎?
李世石在圍棋人機大戰第一盤中的失利,幾乎掀起了軒然大波,似乎一夜之間人工智慧已經戰勝人類智能,今天「人機大戰的第二場」讓大家繼續意識到人工智慧完全超越人類智能的那一天似乎也不會遙遠了。為此,需要對「人工智慧」的概念做一個簡單的澄清。
對於人工智慧的看法,一直分兩派不同的觀點,一派是強人工智慧,即通過不斷地發展機器終將獲得類人的自我意識,最終通過不斷地自我進化獲得遠強於人類的智能水平。而另一派則認為人工智慧只是對人類勞動的接管,僅在部分領域超越人類,全面超越人類智能只是一個夢想而已。
從目前的研究現狀看,強人工智慧的研究幾乎陷入了停滯,遠超過人類智能的強人工智慧是否存在依然是個很有爭議的話題,更不要說具體的研究方向了。而主流的機器學習技術,依然集中於對人類技能的學習,並通過學習的成果來解決實際的問題。比如說圍棋程序AlphaGo,儘管比起國際象棋機器深藍進步很大,然而本質上依然是在給定規則具體遊戲上的探究,一旦改變了規則,甚至換不同規格的棋盤,AlphaGo就必須推倒重來,重新搜集相應棋譜來獲得棋力了。很明顯,這和人類所認識的「舉一反三」類型的「創造知識」的智慧是不相符的。如果要問當今的人工智慧是否達到了三歲小孩的智力水平,那也是一件無法比較的事情,因為通過不斷地訓練機器可以在特定技能上完勝小孩子,但是在一些看似簡單的學習上,小孩子需要花費的精力卻遠小於機器。比如拿起桌子上的杯子喝水,對於小孩來說很容易學會,但對於智能機器來說,卻是件連問題是什麼都很難描述清楚的事情,更不要說自主學習了。因此,在未來很長一段時間內,所謂人工智慧,依然只是對人類技能的補充,好比工具,是對人類智慧的拓寬,即「機器使用人類的知識戰勝了人類」,而遠非到了遠超人類智慧的地步。
當然,人類對於智能的理解還很淺。就拿上文所提的深度學習舉例,雖然在實用中獲得了廣泛的應用,然而人們對其背後的數學機制依然不太清楚,不知道機器做出結論的依據是什麼,甚至連Hassabis本人也說不清楚AlphaGo的棋力到底幾何。或許直到人類對「智能是什麼」這種問題的本質了解透徹之時,對於「人工智慧能否超越人類」這個話題才能得到令人滿意的答案吧。
※重磅:中國人工智慧產業創新聯盟成員超百家—入盟通道持續開啟
※理解這25個概念,你的「深度學習」才算入門!
※NLP如何檢查拼寫錯誤?用Tensorflow,你也可以
※谷歌今天又開源了,這次是Sketch-RNN
※深度對抗學習整裝待發,或將改變傳統AI格局
TAG:機器人圈 |
※詳解AlphaGo到AlphaGo Zero!
※想當AlphaGo的 Open AI,玩刀塔時為何又慘敗給人類了?
※與前輩Alphago相比,openAI現在還只是個弟弟
※AlphaGo「兄弟」AlphaFold出世,DeepMind再創記錄
※Tomaso Poggio解析下個「AlphaGo」線索,再談「深度學習鍊金術」
※如何評價 AlphaGo Zero?
※人工智慧AlphaGo Zero是一個突破,那它呢?
※打敗柯潔的AlphaGo有了繼任者AlphaZero 國際象棋/圍棋/將棋通殺
※AlphaGo後再出神作!DeepMind打造AlphaFold擊敗人類,精度碾壓人類專家!
※最小化類 AlphaGo Zero 引擎——Nochi
※AlphaGo Zero又上《Science》封面!谷歌的人工智慧又干翻人類了!
※為什麼AlphaGo會掀起AI浪潮
※AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
※AlphaGo理解圍棋嗎?
※AlphaGo之父DeepMind再出神作,PrediNet原理詳解
※受AlphaGo啟發,AI重建量子系統新方法登上Nature Physics
※AlphaGo Zero代碼遲遲不開源,TF等不及自己推了一個
※馬庫斯再談AlphaGo Zero不是從零開始,AGI可能需要這十大先天機制
※遊戲AI是什麼?從AlphaGo到MOBA遊戲開發探索
※一天出道職業哥100次 OpenAI要做打遊戲界的AlphaGo