機器學習新突破:谷歌研究人員利用AI自動重構大腦神經元
近日,谷歌與馬克斯·普朗克神經生物學研究所合作,在《Nature Methods》上發表了一篇重磅論文,使用一種循環神經網路演算法對神經元連接組進行自動重構,不僅可以對連接組進行高解析度的可視化成像,而且準確度提高了一個數量級,為連接組學的研究帶來了新的突破。
在神經系統中繪製神經網路的結構——這是一個被稱為「連接組學」的研究領域——無疑是計算密集型的。
人類的大腦中有大約860億個通過100萬億個突觸連接起來的神經元,而對一個立方毫米的大腦組織進行成像,就可以生成超過1000TB的數據(10億張照片)。
據《連接組:造就獨一無二的你》這本書中介紹,連接組學主要是通過分析神經元之間的連接和組織方式來達到分析大腦的運行機制這一終極目的的一門學科。連接主義認為大腦的工作機制就蘊含在神經元的連接中。如果兩個神經元之間,有一個突觸交會點,那麼這兩個神經元就是「有連接的」。通過突觸,一個神經元可以把信息傳遞給另一個神經元。
雷鋒網註:神經元的結構
AI助力神經元連接組可視化成像,準確度提高一個數量級
為了看到連接組,科學家們經歷了各種探索。比較常用的是給大腦組織染色,然後用電子顯微鏡來觀察大腦切片,以此獲得神經元連接的大量局部具體信息,再聚合在一起構成大腦的整個神經網路信息,但是在具體操作過程中要克服許多困難,耗費大量的人力物力。第二種是通過MRI(核磁共振)的方法對活體大腦進行觀測,但是解析度較低,只有毫米級。
如果我們能將大腦中突觸連接的信息和連接組信息進行高解析度的可視化成像,那麼一個人大腦是否受損就可以一目了然,對一些高難度的腦部疾病進行有針對性的治療將成為可能。
7月16日,在發表於《Nature Methods》雜誌上的一篇名為《利用泛洪網路對神經元進行高精度的自動重構》(High-Precision Automated Reconstruction of Neurons with Flood-Filling Networks)的論文中,谷歌和馬克斯·普朗克神經生物學研究所(Max Planck Institute of Neurobiology)的科學家們展示了一種循環神經網路演算法(常用於手寫和語音識別的機器學習演算法),專為連接組學分析量身定做。
谷歌的研究人員並不是第一個將機器學習應用於連接組學的人。今年3月,英特爾與麻省理工學院的計算機科學和人工智慧實驗室合作,開發了「下一代」大腦圖像處理系統。但谷歌聲稱,他們的模型比以往包括英特爾在內的企業發布的深度學習技術在準確性上提高了一個數量級。
雷鋒網註:谷歌的演算法在鳴禽大腦中追蹤一個3D的神經突觸
利用泛洪網路(Flood-Filling Networks)演算法進行三維圖像分割
在大型電子顯微鏡數據中跟蹤神經網路是圖像分割的常用方法。傳統的演算法將這一過程劃分為至少兩個步驟:使用邊緣檢測器或機器學習分類器找到神經網路之間的邊界,然後使用 watershed 或 graph cut 等演算法將未被邊界分割的圖像像素進行分組。
2015年,研究人員開始嘗試一種基於遞歸神經網路的替代方法,將這兩步結合起來。該演算法在一個特定的像素點上定點,然後使用循環卷積神經網路迭代「填充」一個區域,該神經網路可以預測哪些像素與初始像素相同。
雷鋒網註:在2D中分割對象的Flood-Filling網路
設定預期運行長度測量準確性
自2015年以來,研究人員一直致力於將這種新方法應用於大型連接組數據集,並嚴格量化其準確性。
為了檢驗準確性,研究小組設定了「預期運行長度」(ERL)這一指標,在大腦的3D圖像中隨機抽取神經元並進行跟蹤,然後測量演算法在出錯前跟蹤神經元的距離。
雷鋒網註:藍線表示使用ERL測量的結果;紅線表示「合併率」,即兩個獨立的神經元被誤認為一個目標進行跟蹤的頻率
研究小組報告說,在對100萬立方微米的斑胸草雀大腦進行腦部掃描,並用 ERL 進行測量後,該模型的表現比之前的演算法「要好得多」。
雷鋒網註:利用泛洪網路演算法自動重構斑胸草雀大腦神經元
「這些自動化產生的結果結合少量的額外人力投入就可以消除剩餘誤差,馬克斯普朗克研究所的研究人員現在可以研究鳴禽連接組,從而獲得新的深入了解,如斑胸草雀如何唱歌,如何學習唱歌」,這篇論文的作者Viren Jain 和 Michal Januszewski在一篇博客文章中寫道。
除了論文之外,團隊還在Github上發布了模型的TensorFlow代碼,以及他們用來進行數據集可視化和改進重構結果的WebGL 3D軟體。他們計劃在未來改進這個系統,以使突觸解析過程完全自動化,並「為馬克斯·普朗克研究所和其他機構的項目提供幫助」。
※寧德時代再下一城!不但在德國建了廠,還吞下寶馬 40 億歐元大單
※改進模型架構遇到了瓶頸?你該考慮改善自己的數據了!
TAG:雷鋒網 |