科學家利用多任務深度神經網路建立藥物調控激酶譜的預測分析方法
蛋白激酶(protein kinases)是細胞功能的關鍵調節分子,是生物體內最大且功能最多樣的基因家族之一。因此,激酶是開發治療癌症、炎症、糖尿病、心血管疾病和阿爾茲海默症等相關疾病藥物的重要靶標。然而,由於激酶家族蛋白質(特別是催化域)結構的高度保守性,給高效選擇性激酶抑製劑的開發帶來了巨大挑戰。
二十一世紀以來,隨著計算機計算能力的迅猛提升和大數據的湧現,深度學習在機器學習演算法的基礎上快速崛起,並在藥物研發領域得到廣泛應用。然而,對許多尚未經過充分深入研究的激酶靶標,目前已有的數據還遠遠達不到訓練中等規模神經網路所需的量級。因此,傳統的單任務神經網路模型通常難以取得較好的泛化性能。
為了解決這一問題,中國科學院上海藥物研究所蔣華良、鄭明月團隊採用了多任務深度神經網路(multitask deep neural network)建立分類模型解決化合物的激酶譜預測問題。多任務深度神經網路通過任務間的遷移學習,可以高效解決具有相關性的多類別分類問題,對於眾多激酶靶標,共享的保守催化域使得多重活性預測任務緊密相關。因此,利用多任務深度神經網路可以有效減少特定激酶數據不足對模型泛化性能的限制。此外,多任務神經網路只需建立一個模型即可對整體激酶譜進行預測,無需多次建模,並且通過使用共享表示減少了模型參數的規模,可以使模型的訓練學習過程更加高效。
上述研究結果近期在線發表於Journal of Medicinal Chemistry,題為Deep Learning Enhancing Kinome-Wide Polypharmacology Profiling: Model Construction and Experiment Validation,並被選為封面論文。上海藥物所藥物設計與發現中心(DDDC)鄭明月為論文通訊作者,第一作者是藥物發現與設計中心博士研究生李敘潼。
基於多任務神經網路的藥物激酶譜預測流程
多任務神經網路與隨機森林預測表現對比
(左)對五個化合物預測與實驗得到的激酶圖譜,標記為紅色的激酶表示預測或實驗測定為活性。(右)預測與實驗得到的激酶家族選擇性,當一個家族的odds ratio顯著大於1(紅色),認為化合物對該激酶家族具有選擇性。
來源:中國科學院上海藥物研究所
※磁共振全身脂肪定量成像技術研究取得新進展
※自支撐正滲透膜的製備及其應用研究獲進展
TAG:中科院之聲 |