機器學習在分子生物學領域大顯身手

知識 07-19

機器學習在分子生物學領域大顯身手

在生物技術新興公司Zymergen的一個由AI控制的探索生成更多化學物質的菌株中，機器手指正準備挑選微生物菌群。

如果這是未來的生物學實驗室，那麼它看起來與今天的實驗室似乎並沒有什麼不同。穿著白大褂的科學家拿著盛有冷凍玻璃管的箱子走過，架子上的化學物質——純酒精瓶、糖罐、蛋白質和鹽是培養和調節微生物的標準物件。如果不是耳朵聽到的機械聲音，你可能根本不會注意到這裡的機器人：它們在風扇的低嘯中像蟋蟀一樣彼此哼唱著。

這些機器人為生物技術公司Zymergen工作，這家公司在2014年搬遷到美加州舊金山東海岸一家原電子工廠所在地。這些機器人整日都在進行微生物實驗，尋找增加有用化學物質產量的方式。這是一個叫作「回聲」的機器人：它位於一堆雜亂的設備中間，一隻機械臂抓住一個塑料模塊，模塊上有數百個細微孔徑，其中盛著液體。一束激光掃描了模塊旁的一個條形碼，然後「回聲」將其運到一個托盤上。下一步發生的過程及其細微，用肉眼難以觀察到。

「這並非是人們如何動手用吸移管吸移液體的複製品。」該公司共同創始人之一、分子生物學家兼操作及工程副總裁Jed Dean說，「這是以完全不同的方式在執行這件事。」機器人無須用吸移管吸收並將數毫升的液體注入到每個孔中（在細胞層面液體量的漲落），且並不會碰觸它。相反，一束聲波脈衝會以每秒鐘500次的頻率讓液體自己泛起漣漪，並形成比人類可轉移的液體量小1000倍的液滴。

實際上，這些並沒有真正未來主義的部分。大型生物實驗室使用機器人和條形碼已有多年。即便是被稱作「聲微滴噴射」的液體去除技術也已經存在了數十年。當Dean被問到這台機器人通過什麼在做實驗時，他才透露了一點真相。實際上，這是一個計算機程序輸出。

「我想要說清楚的是，這個過程中有一位人類科學家在了解結果和現實，並核查它們。」Zymergen執行總裁Joshua Hoffman解釋說。他表示，對於解釋數據、生成推論以及計劃實驗來說，其終極目標是「擺脫人類的主觀直覺思維」。

Zymergen是若干家擁有相同目標的公司之一：利用人工智慧（AI）增加或替代科學過程中的人類角色。人們用「AI驅動的生物技術」來描述這一過程，但Zymergen共同創始人對這一說法表示擔憂。「『AI』聽起來像是機器人在下象棋。」該公司首席技術官Aaron Kimball說，「我覺得『ML』讓人更加舒服。」Hoffman說，ML指的是機器學習，即可以解釋最近幾乎所有AI進展的計算科學的分支。「這正是我們正在做的。」

自動化發現

科學是一個序列。日復一日的實驗室工作與工廠工作是如此不同。論文來了，啟發新的實驗，然後產生新的發現，結果又產生新的論文。如此循環。各種各樣的公司和研究機構正在拓展基於機器人和AI的工具，以增強甚至替代這個過程的每個步驟中人類的角色。

Zymergen實際上做的是調節可用於生物質燃料、塑料或藥物的產業微生物。為了提高產量，一些公司將它們的菌株送到Zymergen。那裡的機器人於是便探索和修復每個微生物的基因組，從而設計出一個使其合成產物更加高效的菌株版本。

Hoffman表示，問題在於被送到Zymergen的微生物已經「高度優化」。經過數年的研究育種之後，這些細胞非常擅長發揮自己的功能。因此，「擠」出更多的效率需要深入探索其基因組、開展實驗以及跟蹤相關數據，進行科學研究。

Zymergen正在設法加速這一科學過程。在傳統生物學中，Hoffman表示，「需要一個人站在工作台前測試有限數量的假設。可能每月可測試10個假設。」而機器人可以用更快的速度完成這一過程，Zymergen的機器人每周可以進行多達1000個實驗。但機器人只能遵循指令：給它們正確的指令是真正的瓶頸所在。

當被問這個算式如何設計實驗時，Kimball提到了一個簡單的前提。「比如說你得到了約5000個基因的原始微生物，而你改變每個基因的方式有10種，這就意味著你要做5萬個實驗。」他說，實驗「活動」從製作1000個菌株開始，每個菌株都有一個特定的突變。「每個菌株都生活在一個液滴中。你給它喂糖，然後讓它烹飪一會，接下來是測量獲得了多少產物。」可能有25個菌株會產生略多一些的靶標化學物質。這些菌株將會成為下一輪實驗的良種，而其餘的則會進入冷凍倉。

機器人定位

這一發現之路絕非坦途。Kimball說，找到適當的突變結合體需要漫長而艱難的基因「地形」探索之旅。如果只是盲目地朝著效率巔峰走，可能永遠不會到達主峰頂點。這是因為如果只是把所有產生小提升的突變結合到一個微生物中，它們加起來可能並不能形成一次大收穫。他表示，相反，微生物會「生病」，它們會比原來的菌株性能差得更遠。因此，選擇正確的道路，包括繞道進入更有潛力的谷地，也需要一張地圖從而一次性地展示所有突變效應，這張圖不是3個維度，而是數千個。因此就需要機器學習確定方位。

這是關鍵的差異：當機器人最終發現能夠提高化學物質產量的基因變化時，它們並不知道其效應背後的生物化學線索。

那麼，如果機器人實驗並不能加深人們對生物學工作的了解，它是真的科學嗎？對於Kimball來說，這樣的哲學界點可能並不重要。「我們是因為它的工作而得到了收益，並不是因為了解其中的原因而得到了收益。」

到目前為止，Hoffman說，Zymergen的機器人實驗室已經將製作化學物質的微生物的效率提高了10%以上。這樣的增加聽起來可能不多，但在每年依賴微生物發酵達到1600億美元的化學產業內，一小部分的提升也可以轉化為更多的資金，甚至比美國國家科學基金會每年70億美元的預算更多。

而機器人發現的先進遺傳變異代表著真正的發現，這些可能是人類科學家並未發現的變異。大多數提高產量的基因並未直接與合成想要的化學物質相關，例如，其中一半並沒有為人所知的功能。「我已經在若干不同微生物中發現了這種模式。」Dean說。不用機器學習找到正確的遺傳變異就像嘗試打開一個刻度盤上標著數千個數字的保險箱。「人類的直覺很容易被這種複雜性壓倒。」他說。

計算機作者？

如果機器真的已經準備好替代人類執行一些科學任務，很多科學家將會擁抱它們。不像工廠工人或是計程車司機，大多數實驗科學家會很歡迎讓他們的部分工作自動化。在分子和細胞生物學領域尤其如此，因為其中的手工勞動如噴射液體、電鍍細胞、計數菌落等都非常繁雜且成本高昂。一名研究生最細微的錯誤或不精確性都會浪費數周甚至數月的工作。

然而，也有一些生物學家提出了支持AI解釋數據和設計實驗的一些不足之處。「我們發現目前的機器學習方法並不能勝任這一任務。」加州斯坦福大學計算生化學家Rhiju Das說，他研究的是分子如何摺疊從而設計新的藥物。「與獲得同樣數據的人類相比，它們在RNA設計問題上嚴重落後於人類。」儘管他並不知道這是為什麼，但含有「設計」類的任務似乎需要人類的直覺。可能Zymergen正巧碰到了非常適應計算機控制的實驗的生物學部分。

即便AI控制的研究能夠起作用，人類是否會理解計算機發現了什麼？其結果背後的計算仍是一個「黑匣子」。「一個令人困惑的可能性是我們正在接近『可理解的』科學時代。」賓夕法尼亞州匹茲堡卡耐基·梅隆大學計算生物學家、與分子生物學家一起工作的Adrien Treuille說。研究人員可能不僅會依賴計算機做科學，還包括解釋科學：一些生物學理論證據如此複雜，接受它將需要對計算機抱有信心。

在這種情況下，科學家是否應該將其計算機作為論文的共同作者？「我不會這麼做。」波士頓將AI應用於科學發現的一家公司Nutonian的首席執行官Michael Schmidt說。但他隨後表示：「當計算機能夠閱讀並理解論文的意思之後，它們自己就可以成為作者。」

來源：科學網|晉楠

生物易構|更人性的生物化學試劑耗材採購平台

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 Science 的精彩文章:

※醫生的「處方之筆」怎樣管好？
※感染性疾病如何改變全球經濟、人類的文化、生活習慣以及語言？
※解讀人類機體如何與腸道微生物組共生共榮
※益生菌如何為人類健康保駕護航？

TAG:Science |

您可能感興趣

※質譜分析在生物醫學領域的應用
※切削模擬技術在生物醫學領域的應用
※一文讀懂生物醫學領域的感測器
※用途多、安全性高量子技術將在哪些領域大顯身手
※一文帶你深度領悟機器學習在量化領域的應用
※用半機械器官，打開發育生物學領域的黑匣子
※IBM發文闡述量子計算在機器學習領域的突破
※數學、心理學、生物、計算機等多領域
※腦科學將如何顛覆學習領域
※北京大學在納米生物學領域取得新進展
※我國科學家在人類精子發生研究領域取得重大突破
※永新光學發力生命科學領域
※在工程領域中，機器學習的數學理論基礎尤為重要
※哈佛大學機器人領域再獻創舉，誕生世界上最小的Delta仿生機器人
※南開大學團隊「抗癌幹細胞藥物化學」領域獲突破
※徐中玉先生，他是大學語文教育領域的靈魂人物
※專註於生物醫藥及化學信息學領域高端技術開發，宇道科創穫復星醫藥Pre-A輪投資
※生物醫學領域有關太赫茲輻射的新發現
※數學不好，進入機器學習領域還有戲嗎？
※生殖生物學：一個活躍的、充滿機遇和挑戰的研究領域