用細胞生物學破解人工智慧黑箱:揭示它的內部運作機制
AiTechYun
編輯:Yining
當今深度神經網路以一種神秘的方式運作。這種神秘的方式就是黑箱。我們可能不知道黑箱人工智慧系統是如何工作的,但我們知道它確實起作用了。
一項新的研究將神經網路映射到一個簡單的酵母細胞內的成分,這使得研究人員可以在工作中觀察人工智慧系統。在這個過程中,它讓他們了解了細胞生物學。由此產生的技術可以幫助人們尋找新的抗癌藥物和個性化治療。
首先,介紹一下當今的機器學習系統中使用的神經網路的基本知識。
計算機科學家通過設置層次來為神經網路提供框架,每一層都包含數千個執行微小計算任務的「神經元」。訓練者在數據集里輸入(數百萬張貓和狗的照片,數以百萬計的動作,數百萬的驅動動作和結果),系統連接了層中的神經元,從而形成了結構的計算序列。該系統通過神經網路來運行數據,然後檢查它執行任務的程度(它能準確地區分貓和狗,等等)。最後,它重新排列神經元之間的連接模式,再次運行數據集,檢查新的模式是否產生了更好的結果。當神經網路能夠非常精確地完成任務時,那麼訓練就是成功的。
如今,從簡單地為互聯網整理動物的圖片,在圍棋遊戲中擊敗了大師,再到讓自動駕駛汽車在高速公路上飛馳,黑箱人工智慧系統正在取得非凡的成就。
加州大學聖地亞哥分校的生物工程和醫學教授Trey Ideker說,儘管這些系統被稱為神經網路,但它們僅僅是受到人類神經系統的啟發。
「看看AlphaGo的程序,雖然它打敗了圍棋大師,但系統的內部工作是完全混亂的;它看起來不像人類的大腦,」Ideker說。
「它們已經進化出了一種全新的東西,恰好能做出正確的預測。」
目前,Ideker領導了一項關於細胞生物學的新研究,他開始著手做一些不同的事情。他不僅想要使用神經網路來得到想要的結果,還要向研究人員展示它是如何得出這些結果的。通過將神經網路映射到酵母細胞的組成部分,他的團隊可以了解生命的運作方式。「我們感興趣的是一種特殊的結構,它不是由計算機科學家優化的,而是由進化來優化的。」Ideker說道。
這種叫做DCell的神經網路可以準確地預測酵母細胞的生長和繁殖,就像實驗室實驗一樣。
這個項目是可行的,因為啤酒酵母(brewer』s yeast),一種單細胞生物,從19年代開始就被研究為一個基本的生物系統。「這很方便,因為我們有很多關於細胞生物學的知識可以被帶到餐桌上,」Ideker說。「我們對酵母細胞的結構了解很多。」
所以他的團隊的神經網路層映射到酵母細胞的組件,從最微觀的元素(組成DNA核苷酸),向上移動到更大的結構如核糖體(從DNA運行指令到和製造蛋白質),最後到細胞器,如線粒體和核(細胞的運行操作)。總的來說,他們的神經網路,被稱為DCell,利用了2526個來自酵母細胞的子系統。
DCell是一個功能完善的啤酒酵母細胞的模型,它可以作為一款在線應用程序供研究人員使用。
DCell允許研究人員改變一個細胞的DNA(它的遺傳密碼),並觀察這些變化是如何變化的,從而改變它的生物過程,然後是細胞的生長和繁殖。它的訓練數據集包括幾百萬個真實酵母細胞基因突變的例子,以及關於這些突變結果的信息。
研究人員發現DCell可以利用它的模擬酵母來準確預測細胞的生長。由於這是一個「可見」的神經網路,研究人員可以看到當他們在DNA上亂搞時,細胞機制被改變了。
這種透明意味著DCell有可能被用於細胞的硅研究,從而避免了昂貴和耗時的實驗室實驗的需要。如果研究人員能夠找到不僅僅是簡單的酵母細胞和複雜的人類細胞的模型,那麼其影響將是巨大的。「如果你能構建一個人體細胞的完整模型,並在其上進行模擬,」Ideker說,「那將徹底改變藥物和藥物開發的精準度。」
癌症是研究中最明顯的疾病,因為每個癌症患者的腫瘤細胞都有一種獨特的突變組合。Ideker說:「你可以用病人的基因組和突變啟動這個模型,它會告訴你這些細胞的生長速度有多快,以及癌症有多嚴重。」
更重要的是,製藥公司在尋找新的抗癌藥物時,利用細胞生長作為成功或失敗的標準。他們觀察大量的分子,這些分子會打開或關閉不同的基因,並要求每個分子:這種潛在的藥物是否會導致腫瘤細胞停止增殖?
從酵母菌升級到人類細胞並不是一件容易的事。研究人員需要收集足夠多的關於人類患者的信息,從而形成一個神經網路的訓練數據集——他們需要數以百萬計的記錄,包括病人的基因資料和他們的健康狀況。但Ideker預測,這些數據將很快積累起來。他說:「人們對測序病人基因組有了大量的關注。」
更棘手的部分是收集關於人類癌症細胞如何工作的知識,這樣神經網路就可以被映射到它的組成部分。Ideker現在是一個名為「癌症細胞地圖計劃」的組織的成員,該聯盟旨在幫助應對這一挑戰。對癌症細胞的生物過程進行編目是很困難的,因為突變不僅會改變細胞的功能,而且還可以上下移動,並且可以以複雜的方式進行協調。
儘管如此,Ideker仍然希望他能夠利用一種叫做遷移學習的機器學習技術,從一個將酵母細胞模型轉化為一個模擬人類細胞的神經網路。「這好比你建立了一個識別貓的系統,你就不需要再訓練整個神經網路來識別松鼠了。」他說。
※利用深度神經網路創建一個球星的臉 效果堪比真人!
※開發者的福音!英國晶元設計商Imagination公布了一種神經網路軟體開發包
TAG:AiTechYun |