當前位置:
首頁 > 知識 > 你是如何識別人臉的?MIT科學家用機器學習再現了其中的神經過程

你是如何識別人臉的?MIT科學家用機器學習再現了其中的神經過程

麻省理工學院(MIT)的研究人員開發出了一種新的人類大腦面部識別機制的計算模型,似乎能讓我們了解到以前的模型未能提供的一些關於人類神經學的見解。

你是如何識別人臉的?MIT科學家用機器學習再現了其中的神經過程


MIT 大腦和認知科學教授、大腦,意識和機器中心(CBMM)主任 Tomaso Poggio 長期以來一直認為大腦必然存在面部和其他對象的「恆定(invariant)」表徵——即與物體方位、它們與觀看者的距離、它們在視場中位置無關的表徵。


研究人員設計了一個實現他們的模型的機器學習系統,並加入了圖像數據來訓練它識別特定的面部。他們發現,經過訓練的系統出現了一個中間處理步驟(intermediate processing step),該步驟表徵了面部的旋轉度——例如,從中間旋轉了 45 度,但無關左右方向。


這種特性事先沒有被編寫進系統中,它是在訓練過程中自發出現的。它複製了此前在實驗中觀察到的靈長類動物的面部處理機制特徵。研究人員認為這表明他們的系統的工作方式和大腦中的面部處理過程存在相似之處。


「這還不能證明我們搞清楚了什麼新機制。」MIT 大腦和認知科學教授、大腦,意識和機器中心(CBMM)主任 Tomaso Poggio 說道,「模型是對現實世界——特別是對生物而言——的簡單模擬。如果事實真的如此簡單,那才是一件值得驚訝的事。但我確信我們正走在正確的軌道上。」

事實上,研究人員的新論文包括了一個數學證明——他們使用了特定類型的機器學習系統,旨在提供 Poggio 所稱的神經系統的「生物上可信的(biologically plausible)」模型;這類機器學習系統將不可避免地產生無關物體旋轉角度的中間表徵(intermediary representation)。


Poggio 是這篇論文的主要作者,他同時也是 MIT 的 McGovern Institute for Brain Research 的主要研究者,他們的論文今天剛剛發表在《Computational Biology》期刊上。這一發現是 Poggio 與 CBMM、McGovern 和其他研究人員們共同努力的結果:第一作者 Joel Leibo 是谷歌 DeepMind 的研究者,他曾在 MIT 學習大腦與認知科學博士期間師從 Poggio;Qianli Liao 是 MIT 電氣工程與計算機科學專業研究生;Fabio Anselmi 是 IIT@MIT 計算和統計學習實驗室的博士後;Winrich Freiwald 是洛克菲勒大學的副教授。


湧現的特徵


「這一成果很好地展示了我們在 CBMM 想要實現的東西:一方面是與機器學習和計算機科學的整合,另一方面是神經生理學,以及人類行為上的研究,」Poggio 說道。「它不僅僅能告訴我們大腦正在使用什麼演算法,也告訴我們大腦中的迴路是如何實現這些演算法的。」


Poggio 長期以來一直相信人腦中必然存在「恆定」表徵——即與物體方位、它們與觀看者的距離、它們在視場中位置無關的表徵。對人類和靈長類動物大腦的核磁共振研究結果支持這一觀點,但在 2010 年,Freiwald 曾發表過一項研究,詳細解釋了獼猴面部識別機制的神經解剖學特徵。

Freiwald 表明來自來自這隻猴子的視神經的信息穿過了一系列大腦位置,其中每一個位置在面部方向上都比上一個更不敏感。在第一個區域中的神經元僅會響應特定的面部方向而放電;而最後一個區域中的神經元不管方向如何都會放電——這是一個恆定的表徵。


但是中間區域的神經元似乎是「鏡像對稱的(mirror symmetric)」:也就是說,它們對面部旋轉的角度是敏感的,而不會考慮方向。


在第一個區域,如果一張臉向左旋轉了 45 度就會有一個神經元簇放電;如果其向右旋轉了 45 度就會有另一個神經元簇放電。而對於最後一個神經元簇,不管面部旋轉了 30 度、45 度、90 度還是其間的任何角度,它都會放電。但在中間區域,當面部朝某個方向旋轉了 45 度時,一個特定的神經元簇就會放電;而當轉動度數為 30 度時,放電的又會是另一個神經元簇。


這正是這些研究者的機器學習系統所再現出來的行為。「這並不是一個試圖解釋鏡像對稱的模型,」Poggio 說,「這個模型在嘗試解釋不變性,而在這個過程中,會有這樣一種其它的性質出現。」


神經訓練

這些研究者所採用的機器學習系統是一個神經網路,之所以這樣叫是因為它粗略地模仿了人腦的結構。神經網路基於非常簡單的按層級排布的處理單元,神經網路與處理單元或是上下層的節點之間連接緊密。數據輸入神經網路的最底層,在這一層神經網路會通過某種方式對這些數據進行處理,並將它們輸入到上一層,以此類推。在訓練的過程中,最頂層的輸出會與一些分類標準密切相關,比如說它能夠正確判斷一個給定的圖像是否在描述某個特定的人。


在之前的研究中,Poggio 的團隊已經訓練神經網路展現出恆定表徵,從根本上來講,是通過記憶一系列有代表性的人臉特徵,Poggio 稱之為「模板」(templates)。當神經網路看到一張新的人臉時,它會自動判斷這張臉與這些模板的不同之處。如果這張新的人臉特徵與模板中人臉的特徵相同,那麼區別就會非常小,結果就會在最頂層分析後直接輸出。新的人臉和模板的區別也會為這張新面孔賦予可識別的特徵信息。


在實驗中,這種方法得到了恆定的表徵:不管其方向如何,一張臉特徵信息差不多都是一樣的。但是 Poggio 說,其中的機制——記憶模板(memorizing templates)——卻並不是生物上可信的(biologically plausible)。


所以這個新網路轉而使用了一種依據赫布定律(Hebb s rule)的變化——這一定律通常在神經科學文獻被描述為「一起放電的神經元是連接在一起的」。這意味在訓練過程中,為了得到更準確的輸出,隨著節點之間連接的權重的調整,會對特定刺激聯合做出反應的節點最終會比獨立反應的節點(並非所有)給最後的輸出貢獻更多。

這種方法也會產出恆定的表徵。但該網路的中間層也複製了靈長類動物大腦的中間視覺處理區域的鏡像對稱反應。


「這是個巨大的進步,」Allen 腦科學研究所的首席科學官 Christof Koch 評論道。「現在的科學研究一直注重大數據和大型計算機模擬,而這一研究顯示了原理解釋的重要性。他們正在謹慎地開展研究——目前只關注前饋通道——換句話說,前 80-100 毫秒的處理。猴子張開它的眼鏡,80 到 100 毫秒內,它可以看清一張臉並按下相應的按鈕作為表示。問題的一切都會在這一瞬間被解決,他們對這個過程的解釋看起來很棒。」


請您繼續閱讀更多來自 機器之心 的精彩文章:

好機器人是什麼樣的?為機器人評估設定統一標準
技術:斯坦福科學家無線操縱小鼠
為何機器人無法理解諷刺?
顛覆喬姆斯基的語言學習理論?沒那麼容易
量子計算新突破:英國科學家提出大大簡化囚禁離子的新技術

TAG:機器之心 |

您可能感興趣

MIT的新成果震驚了科學界,我們真的可以用意念控制機器人了
大腦如何思考?科學家正用機器學習解碼人類智能
如何讓普通人不再覺得科學家都是男性?
科學家可能發現了意識的神經來源
科學家用量子力學證明我們的世界並不存在?
不會玩耍的人,做不了科學家
科學家稱外星人很有可能是機器形態
SETI科學家說假如外星人真的來了會接管整個地球!
為了滾滾們的婚事,科學家是如何操碎了心的?
科學家在研究食物架構時同時比對了人類的器官,接著就發現了超越科學的驚人發現
植物學家教你如何科學的葉插多肉,你做對了嗎?
科學家警告人類現在尋找外星人不是最合適的時機!
對話科學家:機器何時真正超越人類?
美國最流行的STEM教育,就是多學科學和技術?不,你還不懂它的精髓
可能我們宇宙就是電腦虛擬的,科學家的回家讓人震驚
這些事情能證明存在時間機器嗎?科學家大哥別玩我們
科學家警告人類現在尋找外星人不是最合適的時機
看了會做噩夢,科學家發現能吃硫磺的巨型船蛆
這不是科幻片!科學家稱未來計算機或能刪除你的思想