想理解人類大腦工作原理,可以從我們的嗅覺系統開始
機器學習技術通常以視覺系統為基礎進行信息處理,現在為了超越這一局限,科學家們開始從嗅覺當中汲取靈感。
如今的人工智慧系統(包括受到神經元與神經系統連接而啟發的人工神經網路),已經能夠很好地完成具有已知約束條件的任務,此外,這些系統往往還需要配合大量計算能力與可觀的訓練數據集才能起效。憑藉這些特質,它們在對弈、特別是圍棋領域獲得了出色表現,能夠檢測圖像中是否存在車輛,並成功區分貓與狗等不同視覺對象。不過賓夕法尼亞大學計算神經科學家Konard Kording指出,「但它們在創作音樂或者撰寫短篇小說方面卻表現得相當糟糕。顯然,如今的人工智慧系統在以有意義的方式進行推理時面臨著重大的挑戰。」
為了克服這些局限性,一部分研究小組正在回歸從大腦中尋求新答案的方法。更令人稱奇的是,其中一些研究人員選擇了看似不太可能的起點:嗅覺。科學家們希望更好地理解有機體如何處理化學信息,並發現了似乎有望解決人工智慧問題的相關編碼策略。此外,嗅覺迴路與其它更為複雜的大腦區域間存在驚人的相似性,而後者則可能指引我們構建起更強大的智能機器。
計算機科學家們現在正著手在機器學習環境當中對上述發現進行消化。
僥倖與革命
時至今日,最為先進的機器學習技術至少在某種程度上仍然依賴於視覺系統模擬結構,即以信息為基礎進行分層攝取。當視覺層接收到感官數據時,其首先會選擇小的但定義明確的特徵,包括邊緣、紋理、顏色等與空間映射相關的元素。神經科學家David Hubel與Torsten Wiesel在上世紀五十年代到六十年代發現,視覺系統中的特定神經元與視網膜中的特定像素位置屬於一一對應關係,這一重大發現亦使他們成功拿下諾貝爾獎。
當視覺信息通過皮層神經元進行傳遞時,邊緣、紋理與顏色等細節信息彙集在一起共同形成愈發抽象的輸入表達:例如對象為人臉,且面部特徵顯示其身份為Jane。網路中的每一層都有助於有機體實現這一最終判斷目標。
深層神經網路會以類似的分層方式運作,並給機器學習與人工智慧研究帶來了一場深遠的革命。為了都會這些網路識別人臉等物體,研究人員會向網路當中傳入數以千計的樣本圖像。該系統會加強或削弱各人工神經元之間的連接,從而更準確地判斷特定像素集合所形成的更為抽象的人臉圖形。在充足樣本的支持之下,其能夠識別新圖像當中包含的人臉對象,以及此前從未見過的場景中的人臉模式。
研究人員在此類網路當中取得了巨大成功,除了圖像分類方面,其亦可在語音識別、語言翻譯以及其它機器學習應用領域帶來良好表現。華盛頓大學計算神經科學中心的研究人員Charles Delahunt表示,「我喜歡將深層網路視為貨運列車。其非常強大,但要求我們提供平坦的路面,從而鋪設軌道並建立龐大的基礎設施。但我們都很清楚,生物系統並不需要這些——它們能夠解決很多深層網路如今尚無法解決的難題。」
下面再來聊聊人工智慧領域的熱門話題:自動駕駛汽車。在汽車立足新環境進行導航時,周邊環境將始終不斷變化,且充滿噪音與模糊性因素。如此一來,受到視覺系統啟發的深度學習技術可能無法正常發揮作用。事實上,基於視覺的鬆散方法恐怕也不能很好地解決問題。在這方面,麻省理工學院的生物物理學家Adam Marblestone表示,視覺處理所代表的是一種在根本層面以偶然性為基礎的洞察獲取能力,這是一種「歷史的僥倖」。正是這種僥倖讓科學家們獲得了目前人工智慧領域最為成熟的系統,即基於圖像的機器學習應用方向。
加州索爾克生物研究所的計算機科學家Saket Navlakha則提醒稱,「每種類型的刺激都會以不同的方式進行處理。舉例來說,視覺與嗅覺就採用完全不同的信號類型。因此,大腦可能會使用多種不同的策略來處理不同類型的數據。我認為除了研究視覺系統如何運作之外,研究人員還有很多其它課題需要探索。」
圖:索爾克研究所計算機科學家Saket Navlakha開發出一種基於飛蠅的嗅覺迴路演算法,希望改善機器學習技術在相似搜索與新型檢測任務中的表現。
他和其他一些研究人員們發現,昆蟲的嗅覺迴路可能會帶來一些值得參考的經驗。直到上世紀九十年代,哥倫比亞大學的生物學家Linda Buck與Richard Axel才發現用於處理氣味受體的基因,這標誌著嗅覺研究工作正式起步。從那時開始,嗅覺系統開始變得極具特色,並指導著更多研究人員探索蒼蠅與其它昆蟲對氣味的處理方式。一部分科學家認為,其能夠輕鬆解決視覺系統所不能處理的多種常見計算挑戰。
Delahunt解釋稱,「我們之所以關注嗅覺,是因為這是一套有限的系統,因此能夠以相對完整的方式實現表徵。這是個值得為之奮鬥的好機會。」
英國赫特福德大學計算神經科學家Michael Schmuker補充稱,「人們現在已經能夠利用視覺完成一些奇妙的任務。也許我們也能夠通過嗅覺實現同樣神奇的效果。」
隨機與稀疏網路
嗅覺與視覺在很多層面存在著本質性的區別。首先,氣味是一種非結構化信息,其不存在邊緣; 換言之,我們無法在空間當中對具體對象進行分組。氣味屬於具備不同組成及深度的混合物,我們難以將其歸類為彼此相似或不同。因此,研究人員在探索中往往並不清楚應該對哪些特徵加以關注。
這些氣味將由淺層三層網路進行分析,該網路在結構上比視覺皮層複雜得多。此外,嗅覺區域的神經元會隨機對整個受體空間進行採樣,而非關注層次結構中的特定區域。研究人員們利用索爾克研究所神經生物學家Charles Stevens提出的所謂「反映射(antimap)」機制。在像視覺皮層這樣的映射系統當中,神經元的位置將提示其所攜帶的信息類型。但在嗅覺皮層的反映射體系下,情況則並非如此。相反,信息會在整個系統中分布,且對相關數據的讀取需要立足一些極低數量的神經元進行採樣。更具體地講,研究人員需要通過高維空間內的稀疏信息表達來實現反映射。
採取與果蠅相同的嗅覺迴路,研究人員利用50個各自對不同分子具有敏感性的投射神經元接收受體輸入。單一氣味會激發多個不同神經元,而每個神經元都代表著不同的氣味。這是一組信息的重疊表示,並在本示例中以50維空間表現。在此之後,該信息會被隨機投射至200個所謂凱尼恩(Kenyon)細胞中,該細胞通過編碼識別對應的特定氣味。(對哺乳動物而言,其體內的梨狀皮質細胞即負責處理此項任務。)其將形成40倍規模擴展,從而確保神經反應模式以更敏銳的方式實現氣味區分。
Navlakha表示,「我們假設有1000個人齊聚於某一房間當中,並嘗試根據業餘愛好對其進行分類組織。當然,在這個擁擠的空間內,大家或許能夠找到一些方法將其劃分成不同的團隊。但在實際場景中,人們相當於分散在廣闊的足球場上,研究人員需要學會處理這些額外的空間並構建起數據。」
飛蠅的嗅覺迴路構建完成之後,其需要找到一種切實可行的方法以利用非重疊神經元識別不同氣味。這套模型通過數據「稀疏化」實現這一點。在2000個凱尼恩細胞當中,只有約100個(佔總體數量的5%)對於特定氣味具有高活性(其它活性較低的細胞處於靜默狀態),並為各氣味提供唯一的標註。
簡而言之,雖然傳統的深層網路(同樣是從視覺系統中獲取線索)在「學習」時會不斷改變其連接強度,但嗅覺系統似乎通常不會以這種對投射神經元與凱尼恩細胞間連接進行調整的方式進行自我訓練。
隨著研究人員在新世紀中對嗅覺系統的不斷探索,他們開發出相應演算法以確定更高維度的隨機嵌入與稀疏性對計算效率造成的實際影響。英國蘇塞克斯大學的Thomas Nowotny與加利福尼亞大學聖迭戈分校的Ramón Huerta兩位科學家甚至建立起另一種與機器學習模型間的連接方式,並將其命名為支持向量機(support vector machine)。他們認為,自然與人工系統對信息的處理方式在形式上是等同的,二者都會利用隨機組織與維度擴展的方式有效表達複雜數據。在這方面,人工智慧與生物進化在同一類解決方案上實現了獨立融合。
圖:蘇塞克斯大學信息學教授Thomas Nowotny發現了嗅覺系統與一類所謂支持向量機的模型之間的相似之處。以此為基礎,他進一步探索嗅覺的實現原理並希望藉此指導更多潛在的人工智慧應用方向。
憑藉著這種連接方式,Nowotny和他的同事持續探索嗅覺與機器學習技術之間的關係,希望尋求二者之間更深層次的聯繫。2009年,他們表示最初用於識彆氣味的昆蟲嗅覺模型也可成功識別手寫數字。此外,除去其中的大部分神經元——用以模擬腦細胞的死亡與無替換過程——並不會對其表現造成太大影響。Nowotny表示,「這套系統中的某些部分可能會中斷,但系統整體仍能夠繼續工作。」在他看來,未來火星探測器等設備有望採用這種硬體類型,從而在惡劣的條件下長期保持運行。
不過在相當長的一段時間內,研究人員並沒有投入太多精力來跟進這些發現——直到最近,才有部分科學家重新審視嗅覺的生物結構,希望深入了解如何改善機器學習在某些具體問題上的表現。
硬連線知識與快速學習
Delahunt和他的同事們重複了Nowotny提出的實驗,以飛蛾的嗅覺系統為基礎,並將其與傳統的機器學習模型進行了比較。在樣本數量少於20個的情況下,基於飛蛾的模型能夠更好地識別手寫數字; 但隨著訓練數據的增加,其它模型則表現出更為強大且準確的判斷能力。Delahunt指出,「機器學習方法擅長在具備大量數據的前提下提供非常精確的分類器,而昆蟲模型則非常擅長利用少部分數據快速進行粗略分類。」
在學習速度方面,嗅覺系統的效果似乎更好,因為在這種情況下,「學習」的目的不再是尋找對於特定任務而言最佳的特徵與表達。相反,其基本目標會簡化為識別哪一組隨機特徵與正確結果間存在相關性,而哪些不存在相關性。中國南方醫科大學的生物學家Fei Peng表示,「只需一次點擊即可完成訓練,這樣的能力當然令人神往,對吧?」
實際上,嗅覺策略相當於把一些最基本、最原始的概念引入到模型當中,就像是把對真實世界中的某些一般性理解硬性接入我們的大腦之內。在此之後,結構本身即可執行一些簡單且無需指令引導的先天性任務。
其中一項最引人注目的例子來自Navlakha去年在他實驗室中得出的研究成果。他與加州大學聖迭戈分校的計算機科學家Stevenes及Sanjoy Dsgupta一道,希望找到一種以嗅覺激發的相似性搜索方式。正如YouTube網站能夠根據用戶目前正在觀看的內容生成側邊欄推薦視頻列表一樣,有機體也必須有能力在識彆氣味時進行快速且準確的比較。一隻飛蠅會很快意識到其應該趨近成熟水果的味道,而遠離醋酸等刺激性氣味的來源。但考慮到其所處的環境複雜且充滿干擾因素,因此其不可能遇到完全相同的氣味。一旦檢測到新的氣味,飛蠅會據此回憶起其此前遇到過的最相似的氣味,從而選擇出適用的行為反應。
Navlakha創建出一種基於嗅覺的相似性探索演算法,並將其應用於圖像數據集的處理領域。他和他的團隊發現,他們的演算法在實際表現上遠優於傳統非生物學方法,有時其降維效能甚至可達兩到三倍。(在這些較為標準的技術中,往往通過關注一些基本特徵或維度來進行對象比較。)Navlakha解釋稱,基於飛蠅的方法「可利用低於傳統方法約一個數量級的計算量獲得類似的準確度,因此其將能夠在成本或者性能方面帶來質的飛躍」。
Nowotny、Navlakha以及Delahunt的實驗結果表明,基本未經訓練的網路已經可用於執行分類計算與其它類似的任務。在這類編碼方案中構建出的系統也能夠更容易地完成後續學習工作。舉例來說,其可用於涉及導航或記憶的任務,且在這種情況下,系統能夠無需更多學習時間或大量示例即可順利應對條件的變更(例如道路阻塞)。
Peng和他的同事們已經開始研究這個問題,即通過創建一套螞蟻嗅覺模型以決定如何從一系列重疊的圖像當中找到熟悉的路線並實現導航功能。
在目前正在接受審查的工作當中,Navlakha採用了類似的、基於嗅覺的方法進行新奇檢測——即在接觸過數千個類似物體之後,成功識別出新的、具有關聯性的物體。
而Nowotny則在研究如何利用嗅覺系統處理混合物。他已經發現機器學習技術在此類應用方向上面臨的挑戰。舉例來說,有機體會將某些氣味視為來自單一對象,而某些氣味則源自混合物:某些人能夠在攝入數十種化學物質後,準確判斷出其嗅到的是一朵玫瑰; 或者可能會聞到來自附近麵包店的同等數量的化學物質並意識到其分別來自咖啡與牛角麵包。Nowotny和他的團隊發現,人們在進行嗅聞時不會刻意對氣味進行分離; 相反,咖啡與牛角麵包間的氣味識別將以非常迅速的交替方式完成。
這種洞察能力對人工智慧技術而言同樣非常重要。舉例來說,在酒會上的嘈雜環境中對多段同時進行的對話進行分離往往極為困難。如果房間中存在多位發言者,那麼人工智慧可以通過將聲音信號切換為極小的時間窗加以解決。而如果系統識別出來自某一發言者的聲音,其可能會嘗試抑制來自其他發言者的輸入信息。通過這樣的交替,神經網路即可順利解析對話內容。
邁入昆蟲機器人的時代
在上個月發表在科學論文預發表網站arxiv.org上的一篇文章指出,Delahunt和他來自華盛頓大學的同事J. Nathan Kutz所創造出的「昆蟲機器人」進一步推動了這項研究的進展。他們利用其基於飛蛾的模型輸出結果作為機器學習演算法的輸入內容,並藉此實現了系統對圖像分類能力的大幅改進。Delahunt表示,「其為機器學習演算法提供了強大的素材。飛蛾神經給我們帶來一系列不同類型的結構,而這種迥異於傳統的結構有助於機器學習演算法的提升。」
圖:華盛頓大學的Charles Delahunt(圖左)與J. Nathan Kutz(圖右)將飛蛾嗅覺網路的結構移植到機器學習環境當中,從而創造出他們所謂的「昆蟲機器人。」
一部分研究人員還希望利用嗅覺研究來確定如何在更深層的網路當中對多種學習形式加以協調。Peng表示,「但截至目前,我們在這方面只能說是略有涉獵。目前我還不太確定要如何藉此改進深度學習系統。」
除了實現基於嗅覺的架構之外,這一領域中的另一大重要課題在於如何對系統輸入進行明確定義。在剛剛發表在《科學進展》雜誌上的一篇論文當中,由索爾克研究所的Tatyana Sharpee所領導的小組正想方設法對氣味做出描述。具體來講,不同圖像在一定程度上存在著共性,即要求立足「視覺空間」對像素間的距離進行表達。但這種所謂距離概念對於嗅覺則完全不適用,且多種具有不同化學結構的氣味在表達與判斷方面可能被認為彼此相近。
圖:索爾克研究所神經生物學家Tatyana Sharpee最近發現,氣味可以映射至雙曲線空間之內。她希望了解這種洞察結論能否幫助研究人員找到為深度學習系統構建最佳輸入數據的辦法。
Sharpee和她的同事們希望根據在自然界中共同發現的頻率進行氣味分子定義(出於研究的目的,他們檢查了氣味分子在各類水果及其它樣品中共同作用的頻率)。在此之後,他們將氣味分子結合起來構建圖譜,包括觀察哪些分子傾向於共同作用,而哪些分子之間保持著涇渭分明的隔離性。他們發現,這就像是將城市點位映射到地球上一樣,氣味分子的映射呈現在一個雙曲線空間之內,其中的負曲率球體則為馬鞍狀。
Sharpee推測,將這種具有雙曲線結構的輸入饋送至機器學習演算法內,有助於對結構性較低的對象進行分類。她解釋稱,「深度學習當中存在著一項起始性的假設,即輸入內容應該以歐幾里德幾何度量完成。我認為可以嘗試將此項指標改為雙曲線指標。」也許這樣的結構能夠進一步優化深度學習系統。
共同點解析
就目前來講,嗅覺系統的大部分研究成果仍然處於理論階段。Navlakha與Delahunt的工作必須進一步擴展至更為複雜的機器學習問題當中,方能確定嗅覺模型是否有能力切實發揮作用。Nowotny表示,「我認為這是一項新興挑戰,我們期待觀察其能夠走多遠。」
令研究人員們感到振奮的是,嗅覺系統在結構上確實與許多物種大腦內的其它區域表現出驚人的相似度,特別是與記憶及導航相關的海馬體,以及負責運動控制的小腦。嗅覺是一種古老的系統,其歷史可以追溯到細菌生物對化學物質的感受,且所有生物都會利用某種形式的嗅覺探索周邊環境。
Marblestone指出,「這似乎更接近我們提出的所謂皮層概念的進化源點。」嗅覺很可能為一切生物的學習體系提供了共同點。神經學家Ashok Litwin-Kumar認為,「嗅覺系統為我們提供了一套非常保守的架構,且廣泛適用於各類生物體對多種物體的識別方式。其中一定存在著某些非常基礎的原理,因此值得加以深入探索。」
嗅覺迴路有望成為嘗試理解海馬體與小腦工作原理的、更為複雜的學習演算法及計算方案的解讀起點,甚至有可能引導我們將相關見解應用於人工智慧領域。研究人員已經開始關注注意力以及記憶等各類認知過程,希望藉此找到能夠改進當前機器學習架構與機制的方法。在這方面,嗅覺有可能提供一種更為簡單的方式,用以建立這些連接。Marblestone認為,「這是一個有趣的關鍵切入點,並可能成為下一代神經網路的實現基礎。」
※世紀大辯論:比特幣是數字時代的黃金還是早晚得崩潰?
※區塊鏈技術如何顛覆房產行業
TAG:科技行者 |