當前位置:
首頁 > 新聞 > Nature再發DeepMind研究:AI復現大腦網格細胞模擬導航!

Nature再發DeepMind研究:AI復現大腦網格細胞模擬導航!

新智元報道

來源:DeepMind

編輯:肖琴

【新智元導讀】今天,DeepMind在Nature上發表的一篇論文引起AI領域和神經科學領域的極大震撼:AI展現出與人腦「網格細胞」高度一致的空間導航能力。這項發現有助於AI的可解釋性和把神經科學作為新演算法的靈感來源的重要意義。

大多數動物,包括人類,都能夠靈活地駕馭他們生活的世界——在新的地方探索,迅速返回到記憶中的地方,同時能夠「抄近路」。這些能力如此簡單和自然,以至於很少人在意其底層流程究竟有多複雜。相比之下,雖然AI在圍棋等許多任務超過了人類,空間導航能力對於人工智慧體來說仍然是一個巨大的挑戰

2005年,一項驚人的研究發現揭示了空間行為中神經迴路一個關鍵部分:當動物在探索它們所處的環境時,神經元的激發呈現出一種非常規則的六邊形網格

這些網格被認為有利於空間導航,類似於地圖上的網格線。

除了作為動物的內部坐標系之外,這些神經元——被稱為網格細胞(grid cell)——最近也被假設為支持基於矢量的導航。即:讓大腦計算出到達目的地的距離和方向,「像烏鴉飛行一樣」,即使以前沒有走過確切的路線,動物也可以在不同地點之間直接旅行。

首次發現網格細胞的研究團隊共同獲得2014年的諾貝爾生理學或醫學獎,他們的研究揭示了空間的認知表徵工作的方式。但從網格細胞被發現以來,經過10多年的理論論證,網格細胞的計算功能,以及它們是否支持基於矢量的導航,在很大程度上仍然是一個謎。

DeepMind今天發表在Nature上的論文「Vector-based navigation using grid-like representations in artificial agents」中,研究人員開發了一種人工智慧體(artificial agent)來測試「網格細胞支持基於矢量的導航」這一理論。

研究人員首先訓練了一個循環網路來執行在虛擬環境中定位自身的任務,主要使用與運動相關的速度信號。哺乳動物處於不熟悉的地方或不容易發現地表的地方(如在黑暗中行走)時,這種能力會自然地激發。

研究人員發現,類似網格般的表示(grid-like representation,以下稱「網格單元」)自發地出現在網路中,這與在哺乳動物中觀察到的神經活動模式驚人的一致,也與網格單元為空間提供高效代碼的觀點一致。

圖:用agent進行的實驗產生了類似網格的表示(「網格單元」),它們與哺乳動物中的生物網格細胞非常相似。

接下來,研究人員試圖通過創建一個artificial agent來作為實驗小白鼠,要測試的理論是:網格細胞支持基於矢量的導航

這是通過將最初的「網格網路」與一個更大的網路架構相結合,形成了一個agent,可以使用深度強化學習在具有挑戰性的虛擬現實遊戲環境中導航進行訓練。

這個agent的表現超過了專業遊戲玩家的能力,展現出動物一般的靈活導航方式,當遊戲環境中可以有捷徑時,agent會「抄近路」。

通過一系列實驗操作,研究人員發現網格單元對於基於矢量的導航至關重要。例如,當網路中的網格單元被掐斷時,agent的導航能力就會受損,而且對目標的距離和方向的判斷等關鍵指標的表示變得不那麼準確。

圖:具有網格單元的基於矢量的導航的圖示。底部的圓圈表示3個不同尺度的網格單元類群,有顏色的細胞是活躍的。當agent移動時,網格單元(表示「當前的網格代碼」)會發生變化,以反映agent進入了不同的觸發區域。網格單元用於計算目標的最短路徑。

DeepMind認為,這一研究是理解大腦中網格細胞的基本計算目的的重要一步,同時也突出了它們對人工智慧agent的好處。這些證據為「網格細胞提供歐幾里德空間框架,支持基於矢量的導航」的理論提供了有利的支持。

此前研究人員對網格細胞進行的廣泛的神經科學研究提供了在試圖理解其內部表示的線索,有助於agent的可解釋性——這本身就是人工智慧研究中的一個主要話題。

這項工作還展示了在虛擬現實環境中使用人工agent積极參与複雜行為,以測試大腦工作原理的潛力。

更進一步,類似的方法可以用來測試那些對感知聲音或控制肢體有重要意義的大腦區域的理論。未來,這樣的網路很可能為科學家們提供一種新的方法來進行「實驗」,提出新的理論,甚至對目前在動物身上進行的研究提供補充。

DeepMind的聯合創始人兼CEO、該研究的聯合作者Demis Hassabis說:「要證明我們現在致力於構建的通用智能是可行的,人類的大腦是我們現有的唯一證據,因此,把神經科學作為新演算法的靈感來源是有意義的。」

針對DeepMind這項研究,國內外眾多專家給與評價,新智元整理如下:

杜克大學陳怡然教授:

春鵬同學評論道:論文中提到的兩個細節值得注意。第一,如果神經網路的損失函數中不包括正則項,那麼神經網路無法表現出網格細胞功能。這一發現給了我們一個全新的角度去思考正則項的作用。第二,論文指出深度神經網路的「黑盒」特點阻礙了進一步分析網格細胞活動特性對路徑整合的作用。這一點再次印證了當前研究神經網路可解釋性的必要。

中科院自動化所何暉光:

在這項工作中,研究人員首先訓練循環神經網路基於運動速度信息在虛擬環境中定位。這與哺乳動物在不熟悉環境中運動定位所用到的信息非常類似。令人震驚的是,類似網格細胞的模式,研究人員稱之為網格單元,在神經網路中自然出現,如上圖所示!人工智慧的定位方案,與大自然億萬年進化所得到的答案,高度一致。

中科院計算所研究員、中科視拓創始人、董事長兼 CTO 山世光:

基於數據進行學習後得到的人工神經網路中的規律和模式與長期進化而來的生物神經系統有相似之處——出現這樣的可能性是偶然還是必然,這確實是很有趣,很值得探索的方向。

新加坡南洋理工大學黃廣斌教授:

這也再次說明AI發展突飛猛進,國內和國外在AI演算法上的差距越來越大。國內許多AI公司還處在重複使用開源演算法階段。除了講故事、描繪理想,專家們也需要帶頭低調踏實做研究。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

訊飛翻譯超英語六級挑戰專業八級,胡郁:做翻譯承載文化交流使命
【Ian Goodfellow親授】GAN論文投稿指南,從了解評審要點開始

TAG:新智元 |