當前位置:
首頁 > 知識 > 前沿:清華學者在《自然》子刊提出新演算法,用於精準預測藥物標靶

前沿:清華學者在《自然》子刊提出新演算法,用於精準預測藥物標靶

通過演算法,構建藥物、蛋白、疾病以及藥物副作用關聯的網路圖

整理 | 常春藤

知識分子為更好的智趣生活IDThe-Intellectual

  

在知識高度專業化的今天,不同學科的交叉合作,會帶來令人意想不到的發現。

9月18日,清華大學交叉信息學院曾堅陽課題組、藥學院陳立功課題組與美國伊利諾伊大學香檳分校彭健教授研究組合作,開展的關於大規模異構網路中藥物—標靶相互作用預測的論文發表在《自然·通訊》(Nature Communications)雜誌上。

清華大學和伊利諾伊大學香檳分校學者在《自然》子刊提出新演算法,用於精準預測藥物靶標,論文共同第一作者為交叉信息研究院計算機科學實驗班(姚班)2012級本科生羅宇男(目前在美國伊利諾伊大學香檳分校攻讀博士學位)、藥學院博士生趙心彬以及藥學院2012級本科生周鏡天(目前在美國加州大學聖地亞哥分校攻讀博士學位)。

在這項研究中,研究者提出了一套新穎的預測藥物—標靶相互作用的機器學習演算法,預測並發現了新的藥物—標靶基因相互作用關係,並且得到了濕實驗驗證。該工作對大規模生物數據整合及預測、藥物開發與重新利用具有很大意義。

據高盛此前公布的一份報告顯示,機器學習和人工智慧可顯著地推動藥物發現和開發過程,每年可以為藥廠減少數以百億計的研發成本。

DTINET演算法模型的示意圖

雖然大規模基因組、化學和藥理數據的出現為藥物—標靶相互作用預測提供了新的機會,但如何系統且高效地整合大規模異構數據是當前的研究難點。

這項研究的通訊作者對《知識分子》表示:

「此前的演算法大多局限在對單一類型數據的處理,沒有考慮到生物數據高維度、多噪音等問題。而我們的工作系統地整合了多種類型的異構網路數據,通過壓縮特徵學習,克服了生物數據高維度、多噪音特性帶來的問題,取得了比之前演算法更高的預測準確率。」

在這項研究中,研究者從目前已有的大規模資料庫出發,構建了一個涵蓋描述標靶基因、藥物、藥物副作用、疾病等相互作用或者聯繫的大規模異構網路。其次,在這個異構網路數據的基礎上,提出了一個基於網路擴散的藥物—靶標相互作用預測的機器學習演算法。該演算法使用特徵學習演算法,用低維表示刻畫了每一個藥物及基因的拓撲性質,從而去除生物數據中的噪音,提取出藥物和基因的功能信息,並提升預測的準確性。

「我們為資料庫中的所有藥物構建了一個異構網路,網路中的不同節點代表了這些藥物,藥物之間有邊相連,這些邊有著不同的含義,比如代表被相連的藥物能治療相同的疾病,或者是具有相同的副作用,或者是具有相似的化學分子結構。同樣地,我們為資料庫中的標靶蛋白也構建了這樣一個網路。我們的演算法在構建的異構網路上進行學習」,這項研究的第一作者羅宇男進一步解釋到,「該演算法主要分為無監督學習和有監督學習兩步。在無監督學習步驟中,我們使用一項壓縮特徵學習技術,它首先利用網路擴散過程整合了異構網路中的不同數據,然後通過一個降維操作去除了原始數據中的噪音,並為網路中的每一種藥物或者標靶蛋白都計算出了一個低維的特徵向量表示。這些特徵向量刻畫了藥物或者標靶蛋白在網路中的拓撲特徵和功能特徵。之後我們採用有監督學習的方式,利用已經被發現的藥物—標靶作用關係,學習了一個投影矩陣,將藥物和標靶蛋白的特徵向量都投影到同一個空間下,使得能夠發生相互作用的藥物和標靶蛋白的特徵向量在該空間中位置更為接近。通過利用異構網路,再結合上述整套的演算法,我們實現了對藥物—標靶作用關係的預測。」

與現有常見的預測演算法比較,該方法在預測準確率上取得了顯著的提高。此外,該方法所預測的新相互關係大部分能夠從已知的資料庫或者近期文獻中的新結果獲得證實。

基於演算法,篩選出來的三個小分子藥物對兩種與炎症有關蛋白的抑制作用

這項研究還對該方法預測的、且未被之前研究工作所報道的藥物—靶標相互作用關係進行了濕實驗方面驗證,發現該方法預測的存在於Alendronate,Telmisartan和Chlorpropamide這三種葯以及PTGS1和PTGS2這兩種標靶基因之間的作用關係,確實顯現了相互作用現象,能顯示它們可能具有抗炎症的功能。

對不同類型的藥物,如小分子葯和生物葯,該演算法的預測精準是否一致?未來是否會有進一步的提升空間?研究者表示:

「目前,我們的演算法主要針對化學小分子藥物,不適用於生物葯。演算法還有繼續提升的空間,在演算法層面,我們能進一步優化代碼設計,提升運算性能,使得該演算法更為高效和精確,並成為一個能被研究者和相關從業人員所廣泛使用的易用工具;在數據層面,我們的演算法有著很好的擴展性,可整合更大規模和更多種類的生物數據,當前生物數據的規模正在不斷增大,數據種類也在不斷增多,這將為我們的演算法提供了更多的訓練數據,使得模型預測準確率的可以進一步提升。」

研究者表示,該演算法可快速地在上千個候選化合物中預測出最有可能與給定標靶蛋白髮生相互作用的若干種藥物,極大地減小了搜索的空間,縮減生物實驗的成本和時間,加速新葯研發的速度。同時該演算法也可用於預測已有藥物的新用途。

至於這項研究的下一步工作,曾堅陽和陳立功表示:

主要是不斷優化演算法,整合更多不同類型的數據,如基因表達數據和藥物敏感性數據等,同時也計劃基於演算法的預測結果進行不同類型的生物實驗,幫助研究者對藥物之間的相互關係、藥物的作用機制,有一個更全面的理解。

註:本文圖片由作者提供以及來自論文。

參考文獻

Luo YN et al. A Network Integration Approach for Drug-Target Interaction Prediction and Computational Drug Repositioning from Heterogeneous Information. 2017. Nature Communications. 10.1038/s41467-017-00680-8.

製版編輯: 常春藤|

本頁刊發內容未經書面許可禁止轉載及使用

公眾號、報刊等轉載請聯繫授權

知識分子為更好的智趣生活IDThe-Intellectual

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 知識分子 的精彩文章:

斯坦福教授臨終發聲:別再阻撓博士後的成功之路!
朱邦芬:回歸後楊振寧先生所做的五項貢獻 附楊振寧最新演講
張天蓉專欄:喝醉的酒鬼會漫無目的地遊盪,花粉也會
NSR專欄:對話國際機器學習協會創始主席:人類哪些工作不會被機器取代?
前沿:中外學者發現阿爾茨海默症關鍵蛋白與腦卒中關聯

TAG:知識分子 |