細思極恐:DeepMind讓人工智慧學會了「抄近路」,人類路痴們要小心了
小鹿創萌
聚焦「雲物大智」,提供前沿科技報道。
「從家出發到公司,再從公司返回家裡,並從中選擇儘可能的捷徑。」
作為人類,我們每天都在重複這樣的動作。這也是一個絕大多數哺乳動物都擁有的簡單能力。但你有沒有想過,這個動作的背後,是怎樣的一種大腦導航機制?
今天凌晨,DeepMind又在Nature發布了新的論文。這次,他們訓練出了一個AI智能體,學會了類似哺乳動物一樣的「抄近路」能力。這次研究的目的,是設法模仿人類大腦,用複雜的方式在周圍空間里導航,同時也用人工智慧體驗證了哺乳動物大腦中的「網格細胞」對基於向量的導航有支持作用。這是一個前所未有的探索,被認為是理解大腦的一次重大進步。
人工智慧實現的「網格單元」與哺乳動物的生物網格細胞非常類似
科學家們曾在動物和人類大腦中找到了三種跟「認路」相關的細胞,分別是:位置細胞、方向細胞和網格細胞。
當動物面臨一個特定方向時,方向細胞會得到激發。位置細胞能主要賦予對過往地點的記憶,當動物處於一個特定地點時,它的位置細胞會被激發。而網格細胞是最神秘的一種:它們能將整個空間環境劃分成蜂窩狀的六邊形網格,彷彿地圖上的坐標系。
發現網格細胞的的莫索爾夫婦因此獲得了2014年的諾貝爾生理學或醫學獎。一些科學家猜測,網格細胞也會參與矢量計算,輔助動物規劃路徑。
於是,DeepMind決定利用人工智慧檢驗上述猜想。
首先,他們模擬了大量草食性嚙齒類動物的移動軌跡,然後讓計算機去學習這些移動路線。
AI模擬了老鼠的網格細胞導航能力
他們採用長短期記憶循環神經網路(Recurrent neural network with long short-term memory,LSTM)技術,使計算機記住自己之前的位置、方向和速度,然後結合目前的位置和方向,來做下一步移動。換句話說,DeepMind想讓計算機像兔子一樣思考自己的行走路線。
在實驗中,他們發現,計算單元中自然地湧現了類似網格活動的六角形模式,正如他們在實驗室的真實老鼠大腦上所得到的結果,一種類似於網格細胞活動特徵的結構自動誕生了。在此前的訓練中,研究人員並未刻意引導神經網路產生此種結構。
隨後,團隊利用強化學習檢驗這種網格結構是否能夠進行矢量導航。研究人員將之前自動出現的網格結構與一個更大型的神經網路架構結合成了人工智慧體,置於虛擬現實的遊戲環境中。
這種神經網路被訓練用於探索虛擬迷宮
經歷強化學習後,該人工智慧在遊戲迷宮中向目的地前進的導航能力超越了一般人,達到了職業遊戲玩家水平——它實現了像哺乳動物一樣尋找新路線和抄近路的能力。
論文作者之一Dharshan Kumaran說道:「我們證明了網格細胞遠不只是給我們提供GPS定位信號,也是一種大腦賴以計算兩個地點間的最短距離的核心導航機制。」
英國帝國理工學院劉芳德博士稱,位置細胞和網格細胞的研究對人工智慧特別是機器人系統啟發很大。位置細胞其實是空間索引的資料庫,描述的是拓撲空間;而網格細胞是幾何計算器,描術的是歐氏空間。這種組織跟我們目前計算機科學中的技術完全不同,並有非常強的優勢。
DeepMind團隊相信,類似的研究方法還可以用來探索大腦聽覺和控制四肢的機制。在更遠的將來,神經科學家們甚至可以用人工智慧代替小白鼠來做實驗。
DeepMind位於倫敦國王十字火車站附近一棟不起眼的樓房中。2014年1月,谷歌以6.6億美元買下了這家AI公司。在此之前,谷歌在機器學習和AI領域已處在最前沿的位置。被收購後,DeepMind兩次登上《自然》雜誌的封面,並多次發表論文,一次是由於一個視頻遊戲AI程序,另一次則是因為轟動全球的AI軟體「AlphaGo」。
業內人士認為,DeepMind帶來的最直接的價值是,讓谷歌和Alphabet在全球科技公司的AI爭奪戰中奪得了戰略優勢。
素材來源:機器之心等
編審:小鹿君
※《頭號玩家》里的VR遊戲世界 其實不用等到2045年
※機器人摘草莓,比大媽們還會挑
TAG:微軟南京孵化器 |