蛋白質的新「摺疊」!DeepMind重磅推出家族新成員AlphaFold
它們所有的小確幸都是,意料之中、精彩尤甚。
比如之前一戰成名的AlphaGo、後續傲嬌的AlphaZero,以及這兩天剛剛加入家族戰隊的AlphaFold,中文封號為,阿爾法摺疊。
生物醫學領域,一向都是冷靜與熱情並存,而這位AI新寵兒AlphaFold的性格雖然還不明朗,但至少目前看來,勢必會引發生物醫學領域新一輪的研究加速。
「小奇妙」阿爾法摺疊
據DeepMind介紹,阿爾法摺疊這項成果的重大意義就在於,你給它一段基因序列(生物學上稱其為蛋白質一級結構),在電腦上跑一下,就可以成功對這種蛋白質建模。
看似簡單,但意義非凡。
在過去五十年,和阿爾法摺疊起到相同功能的技術有冷凍電子顯微鏡、核磁共振或X射線晶體學等實驗技術。單看儀器,它們就需要高昂的價格,但最重要的是,其實驗成本也很高,需要專人做大量的實驗,器材損耗不說,實驗用料就要花費數萬美元。
花錢不說,最主要的是,整個過程太慢,需要耗費研究者幾年甚至數十年的光陰。
有了阿爾法摺疊就不一樣了,生物學家再也不用在實驗器材面前耗費數十年的光陰,只需要簡單錄入數據就好。
當然,阿爾法摺疊的好處不僅這麼點,最終它還是惠及到我們普羅大眾的身上。
以老年痴呆症(學名為阿爾茨海默氏症)為例,它在人體的潛伏期長達十幾年之久,且病因複雜,以目前的醫學技術,臨床上甚至很難在發病前幾年檢測出這一疾病。
在生物學研究上,科學家普遍認為蛋白質的變化是引發老年痴呆的病因。換句話說,老年痴呆患者的某一部分蛋白質長得一定和正常人不一樣。但是由於我們的研究速度太慢,所以生物學家不知道身體中所有的蛋白質形態,因此檢測哪一部分不一樣就難如登天。
想像一下,通過阿爾法摺疊,提前十年檢測老年痴呆就容易多了,只要通過電腦看下蛋白質長得是否有差異就可以了。
人工智慧對蛋白質結構的「深度寵愛」
這一次,讓阿爾法摺疊一戰成名的還是一項比賽。
在1994年,為了促進研究和衡量最新方法在提高預測準確性方面的進展,蛋白質結構預測技術關鍵評估社區範圍實驗(CASP)的雙年度全球競賽被設立。演變至今,其比賽結果已經成為行業標準。
雖然沒有AlphaGo當年成名那麼壯觀,但作為阿爾法家族的一員,阿爾法摺疊一出手就是不凡。在今年的CASP比賽上,它不出所料的成功拿到了第一。
據DeepMind官網上的介紹,基於深度神經網路,他們設計了兩種方法以用來構建完整而精確的蛋白質結構。
首先,他們先採集氨基酸對之間的距離和連接這些氨基酸的化學鍵之間的角度數據,接著將這些數據設計成用以評估蛋白質結構準確度的分析工具。
使用這一分析工具,研究團隊想出第一種方法,就是在現有蛋白質資料庫里找到最匹配的蛋白質,如果找不到,他們就基於最接近的搜索結構上,用新的基因片段不斷替換,以創造出匹配要求的新結構。
而這第二種方法要更簡單一些。據他們介紹,研究人員主要用的就是梯度下降 -a數學技術,它的精度相較於第一種會更高一些。相較於第一種方式,這種技術一步就可以預測整個蛋白質鏈,而不用經歷組裝的過程,整個過程更簡單。
DeepMind沒有公布更多細節,但經過這樣「簡單」的設計,奇蹟就這樣發生了。
最後,科普來了
在人體內,蛋白質是一種神奇的存在。
眾所周知,蛋白質是構成人體結構的主要成分,其含量僅次於水,約佔一個人體重的五分之一。我們身體所要執行的幾乎所有功能,包括肌肉的收縮與拉伸、身體對光線的感知和食物的轉化,都需要蛋白質在其中起關鍵作用。
而科學家指出,蛋白質的結構很大程度上決定了一種蛋白質的特性,因此研究蛋白質3D結構的重要性就顯而易見了。在我們的身體里,這樣的案例比比皆是,如構成我們免疫系統的抗體蛋白質是「Y形」的;膠原蛋白的形狀像繩索;用於基因編輯的CRISPR和Cas9,它們則像剪刀一樣。
但是純粹從基因序列只能夠找出蛋白質的三維形狀是一項複雜的任務,按照傳統的研究方法,科學家需要從一級結構、二級結構來一層層研究,花費幾十年甚至千百年才能夠完全建立蛋白質的形態模型。
而阿爾法摺疊的出現,讓生物學家省去了不少功夫。
在DeepMind官網上,他們是這麼介紹這一重大成果的面世的:「我們很高興與大家分享DeepMind在展示人工智慧研究如何推動和加速新科學發現方面的第一個重要里程碑。DeepMind彙集了來自結構生物學、物理學和機器學習領域的專家們,通過跨學科方式將尖端技術運用其中,設計出了僅根據其基因序列就可以預測蛋白質3D結構的AlphaFold。」
※科技向西「出海」,得靠什麼船?
※格力電器參與聞泰科技收購半導體,推進500億「造芯」計劃
TAG:鎂客網 |