《環球科學》專訪倫敦大學學院計算神經科學家李兆平
作者廖紅艷 (《環球科學》記者)
責編陳 斌
導讀
半個世紀前,麻省理工學院的一位計算機系教授給學生布置了一個暑期項目:編寫一個程序,讓計算機能夠識別出圖片上的簡單物體,即將圖片信息輸入計算機,由計算機輸出圖片上物體的名稱。結果出乎這位教授的意料,這個看似簡單的項目最終花了科學家幾十年的時間。直到最近幾年,由於計算速度的提高,以及大數據、深度學習演算法的出現,計算機的識圖能力才有了較大提升。
「科研圈」關注科研生態、推薦重要前沿論文與中文摘要、發布科研招聘、推送學術講座與會議預告。
credit:Where"s Wally?
半個世紀前,麻省理工學院的一位計算機系教授給學生布置了一個暑期項目:編寫一個程序,讓計算機能夠識別出圖片上的簡單物體,即將圖片信息輸入計算機,由計算機輸出圖片上物體的名稱。結果出乎這位教授的意料,這個看似簡單的項目最終花了科學家幾十年的時間。直到最近幾年,由於計算速度的提高,以及大數據、深度學習演算法的出現,計算機的識圖能力才有了較大提升。
相比而言,人類大腦在圖像識別方面的能力令人驚嘆。我們可以在半秒內準確分辨出貓和狗;在瞬間認出隱藏在一群鳥中的河馬;過馬路時及時發現一輛正向我們衝來的汽車;或是在安靜聽課時,用眼睛瞬間「抓」住突然出現的蝴蝶。這些由大腦視覺系統下意識做出的簡單行為其實並不簡單。
正常情況下,人的眼睛每秒可以接收幾十兆信息,相當於幾十張圖片或是幾十部長篇小說。但實際上,能被我們注意到的信息量上限只相當於兩三句話。也就是說,我們在過馬路時及時發現一輛闖紅燈汽車,這個動作,相當於視覺系統在 1 秒內就從幾十本長篇小說中找到最重要的兩三句話。
在完全無意識的狀態下,視覺系統就將我們的注意力引導到了最特別、最重要的位置。億萬年前,我們的遠古祖先正是憑藉這個超級本領,才在危機四伏的環境中生存下來,並繁衍至今。但其中的生物機制是什麼,科學家一直無法解釋。
新理論剛提出時,質疑聲很多。因為傳統觀點認為,建立顯著圖的應該是與智力緊密相關的前額葉或類似的腦區。而早前的兩項研究,讓科學家相信,V1是低級腦區,完成不了這麼高級的任務。一個是 1953 年美國神經生物學家史蒂夫·庫夫勒(Steve Kuffler)發現,視網膜神經元只能對圖像上很小一塊區域(即該神經元對應的感受野)有反應,並且只有當區域內有自己「喜歡」的點時,這個神經元才會有所反應。另一個是 10 年後,庫夫勒的學生戴維·胡貝爾(David Hubel)和 托爾斯登·魏塞爾(Torsten Wiesel)發現,V1 區單個神經元的感受野比視網膜的稍大,這裡的神經元開始能提取圖像上的「小線段」,並且不同神經元會偏愛不同屬性的線段,比如某一顏色、某一朝向、是否運動(因這一發現,兩人獲得了 1980 年諾貝爾生理或醫學獎)。
按照這個規律,科學家樂觀地推測,隨著視覺信息的深入,比 V1 高級的腦區(V2、V3、V4、V5等)的神經元能夠認出的圖像會越來越複雜,並最終在前額葉之類的腦區形成一個視覺顯著圖,引導注意力的方向。這個假設似乎也有道理,然而幾十年過去了,科學家照著這個思路開展研究,進展卻遠不像當年在視網膜和 V1 區那麼順利。而李兆平的理論指出,V1 區其實並不只是在提取圖像里的小線段,還能造出顯著圖來引導注意力。這個理論引起大家反思:注意力的介入,意味著部分視覺信息在大腦里被選擇或丟失可能已經在 V1 區附近發生,傳統思路沒有考慮這些因素,這很可能是高級視覺皮層難以理解的原因。
「V1 顯著圖理論」可以解釋很多我們司空見慣的現象。比如,當你面對「萬綠叢中一點紅」的場景時,為什麼我們的眼睛會在第一時間看向「一點紅」。
「V1 顯著圖理論」認為,V1 區有一個內部神經網路,網路中的神經元會相互作用——喜好相同的神經元相互抑制,即同性相斥。另外,注意力分配時遵循的是「競價原則」。可以想像成在 V1 的一個輸出區——上丘腦——有一個專門負責拍賣注意力的拍賣店,它不問其他,只看神經元的出價(發放脈衝的頻率),哪個神經元的出價高,就會把注意力賣給誰,然後指揮眼睛往這個神經元對應的感受野看。
舉個例子,當視覺輸入的是一張滿是綠棒僅有一根紅棒的圖片時,因為綠棒很多,喜歡綠棒的神經元會相互抑制;而喜歡紅棒的神經元,因為紅棒只有一根,不會被抑制,結果發放頻率最高,最後贏得了注意。這也可以解釋,為什麼我們總是會被最特別的事物吸引。此外,V1 區生成的視覺顯著圖,可以直接輸入上丘腦——視網膜負責輸入信息、V1 區負責生成視覺顯著圖、上丘腦負責輸出結果,一個完美的模型誕生了。
近年來,「V1 顯著圖理論」引起了學術界的極大注意,獲得了越來越多實驗的支持。這些實驗包括生理學、心理學和腦成像的觀察,包括李兆平和北京同事的合作項目。2014 年牛津大學出版社出版了她著的《理解視覺:理論、模型與數據》(Understanding vision: theory, models, and data),這也是計算視覺領域的第一本教科書。
最近,現為倫敦大學學院計算神經科學教授、北京師範大學認知神經科學與學習國家重點實驗室訪問教授的李兆平接受「未來論壇」邀請,在中國科學技術館做了一場名為《用人腦研究腦,是探索更是挑戰》的「理解未來」講座,向在場觀眾介紹了自己在探索視覺這個「心靈的窗戶」過程中的一些感想。講座結束後,《環球科學》對李兆平教授進行了專訪。
倫敦大學學院計算神經科學教授、北京師範大學認知神經科學與學習國家重點實驗室訪問教授李兆平
《環球科學》:你最早是在加州理工學院學習物理,為什麼會轉到計算神經科學領域?
李兆平:上大學的時候,我喜歡物理,也喜歡思考與大腦有關的各種問題。比如男人和女人的大腦有什麼不同,為什麼有人會認為女人不適合學習物理?小孩子的大腦為什麼可塑性那麼強,可以學會那麼多東西?不過,我真正進入神經相關領域,是緣於聽了當時加州理工學院物理系約翰·霍普菲爾德教授(John Hopfield,1982 年提出了著名的 Hopfield 神經網路)的一場講座,霍普菲爾德教授後來成了我的博士導師。我的博士論文名是《嗅球模型及延伸》(A Model of the Olfactory Bulb and Beyond ),當時的加州理工學院非常開明,雖然我的論文看起來與物理專業不太相符,但還是給我頒發了物理學博士學位。
《環球科學》:有人說,人工智慧「深度學習」中的「深」指包含了很多層虛擬神經元,靈感就來自於人腦視覺皮層的層狀結構。你認為這個說法準確嗎?為什麼?
李兆平:上世紀 80 年代我參與過人工神經網路的教學和研究,不過當時計算機太慢,只能實現淺度學習,比如實現二三層演算法,而現在已經能做到上百層了。上世紀 80 年代,研究機器學習和計算神經的其實是同一批人,每年在這個領域會召開名為「神經信息處理系統」(Neural Information Progressing Systems)的研討會。不過到了 90 年代,研究人員開始向兩個方向分化,一個是偏工程方向,也就是機器學習;另一個是偏理科(生物)方向,就是計算神經科學。
至於深度學習是否借鑒了人腦視覺皮層層狀結構這個問題,我覺得只能算是形式上的借鑒。現在人工智慧中用到的虛擬神經元和人工神經網路,工作原理與我們大腦中的神經元和神經網路很不相同。大腦的大部分機理,科學家都還沒有搞清楚,而且,即使機理搞清楚了,應用到計算機上,也還需要做大量的工作。比如,現在的計算機遠不能像人腦一樣,懂得引導視覺注意力方向。
《環球科學》:有人說,如果類比物理學的發展史,神經科學目前還處於牛頓力學之前的階段,你怎麼看這種觀點?
李兆平:從牛頓力學開始,物理學家幾乎可以在原理上去解釋很多自然現象。相比之下,在神經科學領域,還沒有出現像物理學中的牛頓力學那樣的、可以照亮一大片領域的理論,所以我覺得這種說法有一定道理。
但也可能在攻克大腦的這場戰役中,不存在一個大戰場,只存在許多小戰場,各個小戰場雖然不是互通的,但 10 個小戰場打勝後,也許能取得大戰場的勝利。目前,我們已經在許多小塊的領域做得非常漂亮,在許多小戰場上取得了勝利,比如大腦獎賞機制、大腦定位系統,等等。我還是非常樂觀,希望在有生之年,可以循著 V1、V2、V3、V4 深入地研究下去,搞清楚視覺系統。甚至更樂觀一些,既然猴子大腦里有50%腦區是專管視覺,也許通過視覺系統這個「心靈的窗戶」,我們可以獲得突破,窺見整個大腦的奧秘。
《環球科學》:你覺得計算機最終能夠模擬人腦嗎?
李兆平:只是模擬不去理解是沒有用的。試想一下,如果不能理解大腦運作的機制,擁有一個模擬的大腦又有什麼用?反過來,如果能真正理解原理,就不需要拘泥於形式生硬地模仿,比如,鳥與飛機的關係。人類雖然從飛鳥獲得靈感,但最終並沒有模仿鳥的形態,製造出所謂的機器鳥,當科學家搞清楚了流體動力學,他們就可以用鋼筋鐵骨製造出跟鳥完全不像的飛機。
《環球科學》:你提出的「V1顯著圖理論」非常漂亮,但正如你所說,這是一個小戰場的勝利,你的下一個戰場是什麼?
李兆平:V1 區還有許多奧秘值得我們探索。最近我和北京師範大學認知神經科學與學習國家重點實驗室的李武老師合作,首次發現在 V1 區,注意力的吸引使神經元的靈敏度得到提高(神經元因視覺輸入而發放的電脈衝越強,靈敏度越高)。而過去認為,只有在高級腦區,神經元才會發生因為獲得注意力,靈敏度提高的情況。最近還研究了 V2 是否也參與了建立視覺顯著圖。雖然目前在 V2 方面還沒有太大進展,但我比較樂觀,希望能用我的一生,破解視覺的奧秘,甚至大腦的奧秘。
《環球科學》:1999年,「V1顯著圖理論」剛提出時,受到了許多質疑,一些科學家甚至認為是天方夜譚,但漸漸地科學界開始接受這個理論,特別是最近幾年,越來越受重視,為什麼學界的態度會發生轉變?
李兆平:一個理論從提出到被大多數人接受,要經歷一段時間。偉大的麥克斯韋的電磁學理論也花了很多年才被接受。當然,我的理論不像他的理論那麼偉大,所以等更多年才被接受也很可能,我們也應該繼續對它進行實驗檢驗。在 2008 年,我用行為實驗驗證了「V1 顯著圖理論」的一個意想不到的預測。這可能是促使學界態度轉變的一個比較重要的因素。「V1 顯著圖理論」雖然可以解釋,為什麼與眾不同的事物會吸引我們的注意力,但所有理論都應該能用來推測未知現象,否則都只能算是「馬後炮」。
所以,我設計了一個行為實驗來驗證自己的理論的一個預測。首先,請自願者通過立體眼鏡,左右眼分別看兩幅不同的圖——左眼看到的圖上,幾乎所有的棒都向左傾,只有一根棒向右傾,右眼看到的是一張空白圖,要求自願者儘快找到唯一的右傾棒。然後,通過眼動跟蹤,記錄自願者看向右傾棒的時間。接下來,研究人員移動左圖上的一個左傾棒,到右圖的相應位置,得到兩張新圖。再請自願者戴上立體眼鏡,左右眼分別看兩張新圖,找出朝向不同的棒。結果發現,儘管兩種情況下,視覺認知最終看到的圖像是一樣的(都是左眼輸入圖和右眼輸入圖的疊加),但相比第一種情況,第二情況下,自願者需要花費更多時間,才能找到那根右傾棒。通過眼動跟蹤,我們發現,即使明確要求自願者儘快找到不同朝向的棒,自願者還是會不由自主地看向跟任務無關的、只有右眼可見的那根唯一的棒。
按照我們的理論,在第一種情況下,右傾棒是唯一的顯著點,但第二種情況,會出現兩個視覺顯著點——一個是唯一的右傾棒,另一個是唯一在右眼畫面中的那根棒。這也解釋了,為什麼自願者的眼動軌跡經常會先看唯一的右眼棒,後看唯一的右傾棒。而且,在所有視覺皮層中,只有 V1 區的神經元存在左右眼輸入偏好,有些細胞喜歡左眼輸入的信號,有些細胞喜歡右眼輸入的信號。這說明生成視覺顯著點的腦區,就在 V1 區。這個實驗還告訴我們,其實「看」和「見」是分開。
《環球科學》:「V1 顯著圖理論」的提出對神經科學領域意味著什麼?它對普通大眾的生活會產生影響嗎?
李兆平:長期以來,科學家對 V2 區的研究進展不如預期的那麼好,可能就在於對V1區了解還不足。我們現在知道,視覺信息被 V1 區作用而受到了過濾,有些信息被收錄,有些信息被刪除。如果信息在進入 V2 區前被大量篩除,我們還按照傳統的方法,去測量 V2 區的感受野,經常碰壁也就不足為奇了。接下來,「V1 顯著圖理論」也許可以指導對 V2 及以上視覺皮層的研究。
視覺注意力分配,可以用到很多生活場合,比如,在廣告和電影畫面中,如何引導注意力。 注意力分兩種,一種自上而下,叫有意識注意;另一種自下而上,叫無意識注意,我們的理論主要可以解釋無意識注意。在傳統電影中,導演一般利用攝影機視角、燈光、選擇性聚焦乃至音效等諸多手段,來引導觀眾的注意力。但如果電影工作者借鑒我們的理論,通過設計一些唯一的特徵——這些唯一的特徵在 VR(虛擬)環境下還有更多的設計途徑,引導觀眾的無意識注意,或許可以不露痕迹地讓觀眾的眼睛向某一方向看。
田松:從普及到傳播,從信賴到理解
呂行:蘇格拉底的「夢」——評楊絳譯《斐多》中的嚴重錯譯
吳國盛:為什麼要「言必稱希臘」
江曉原、劉兵:是「民科」,是「公知」,愛因斯坦若是在中國
於鳳琴:黑頸鶴當之無愧的國鳥
TAG:科學的歷程 |
※科學、計算科學與數據科學
※日本筑波大學華人科學家張振亞談科研與教學
※華南師範大學成立腦科學與腦康復行為醫學研究院
※中國科學院周家漢研究員到昆明理工大學做學術交流
※北京大學生命科學學院、生命科學聯合中心朱健課題組博士後招聘
※北京大學、浙江大學、華東師範大學、華中科技大學、雀巢健康科學研究院等
※浙江大學醫學院神經科學研究中心楊巍研究組高薪誠聘博士後
※陳履生先生為澳門城市大學人文社會科學學院特聘教授
※科學史與人類學
※楊培東等四名華人科學家當選美國科學院院士
※《環球科學》招聘兒童科學編輯
※曾紅葵:艾倫腦科學研究所的「大科學」
※華人科學家鮑哲南獲「世界傑出女科學家獎」
※科學巨星與科學傳播
※深圳大學生命與海洋科學學院陳雪梅院士課題組副研究員招聘
※上海交通大學,中山大學,中國農業科學院等
※華人學者在《科學》發文 助力精準醫學進程
※美國國家科學院新任院長:我為科學家代言
※南京審計大學統計與大數據科學研究院成立