基於蛋白結構的ADMET預測
關注殷賦科技,科研計算更簡單!
導語
藥物化學項目最理想的目標是實現高效力和理想的安全性,為了達到這些目標,候選分子必須與主要靶點或靶標形成最佳的相互作用,並避免與反靶點不必要的相互作用。與非靶標的相互作用導致不期望的毒理事件。吸收(absorption)、分布(distribution)、代謝(metabolism)、排泄(excretion)和葯代動力學(pharmacokinetics,PK)對功效和安全性都有顯著影響,它們通常縮寫為ADMET。
大多數藥物屬於口服給葯,首先將藥物溶解在胃腸道中,通過腸壁吸收,然後通過肝臟進入血液循環。在分布過程中,活性藥理成分通過生物屏障,到達身體各個部位、組織和器官;中樞神經系統藥物通過血腦屏障進入大腦;分布使得藥物能夠結合其分子靶標,例如酶、受體或離子通道以發揮其藥效學作用。然後將化合物再循環到肝臟中並代謝以增加其極性;最後通過尿液排出,或者在一些特定情況下經過腸肝循環通過糞便排泄。
過去十多年蛋白質工程和晶體學領域中的突破使得大多數蛋白質的原子水平結構信息被揭示,其在ADMET過程中具有突出相關性的靶點,例如血漿蛋白結合、活性轉運體、細胞色素P450(CYP)介導的代謝,其抑制和誘導一些毒性相關的靶標。
考慮到ADMET相關蛋白的蛋白質建模,重要的是強調這些蛋白進化優化具有多種人血清蛋白或柔性結合位點能夠識別和結合多種化合物。CYP酶家族例證了配體結合過程的複雜性,因為至少六種同工酶負責約75%市售藥物的代謝。具有酮康唑的CYP3A的晶體結構包含配體的兩個拷貝,為多重結合提供原子級參數,並指示相關聯結合位點柔性的高水平。類似地,活性轉運蛋白(P-gp)的晶體結構含有環狀六肽配體的兩種立體異構體;通過多個非特異性接觸實現了多種化學品的結合。
藥物發現是一項多維任務,需要在期望和不合需要的特性之間實現良好的平衡,以達到目標產品屬性的藥效和安全標準。維持與主要目標的最佳相互作用限制了化學修飾的自由以優化葯代動力學特徵。 因此,在計算機中,ADMET預測成為藥物發現程序的一部分,例如代謝位點預測、代謝建模和轉運蛋白(CAR,PXR)的誘導或HSA結合評估。
1
基於結構ADMET預測的計算方法
蛋白質構象的原子水平信息對於基於結構的藥物設計至關重要。高解析度蛋白質結構可通過X射線晶體學、NMR方法或計算方法獲得。如果蛋白質結構不可用,但已知序列的同源蛋白的結構可以使用同源模建。實驗蛋白質結構的最重要的公共存儲庫是RCSB蛋白質資料庫。
基於實驗研究得到的蛋白質模型的模擬具有原始數據的錯誤,數據集中的錯誤限制了後續建模的準確性,與所應用的技術無關。因此,蛋白質模型的質量評估對進一步的結果有重要的影響。在X射線實驗的情況下,用傅里葉逆變換推導出電子密度。因此,電子密度圖包含關鍵信息。結構的解析度(Resolution)是廣泛使用的全局描述符,定義了可以在特定實驗中解決的原子對象的特定大小限制。結構模型的質量可以通過量化測量數據與模型預測數據之間的差異的R因子進行評估,故較低的R值表示更一致的模型,優化過程中的交叉驗證是為了避免過度擬合數據。
A.能量評估的基本方法
量子力學(QM)在計算過程中要明確表示核和電子,因此解決核心是時間依賴性的薛定諤方程完全描述了所研究的分子的性質和能量。分子力學(MM)模型的原理是系統的能量僅依賴於核的構象,電子的作用是用簡單的函數建模的。由於分子力學計算的速度,它是模擬蛋白質結構和結合配體的關鍵方法。水合效應可以通過隱式溶劑化或使用顯性水分子納入模型。
混合QM/MM方法採用兩種方法來模擬基本生物過程的優點是具有嵌入蛋白質結構或溶劑環境中的電子的精確建模的基本貢獻。典型如酶催化反應,在這些計算過程中,使用QM方法對電子細節感興趣的次區域進行建模,而使用快速MM方法計算系統的其餘部分。以CYP家族為例,催化中心由血紅素鐵和卟啉結構構成,其中卟啉結構協調分子氧形成高反應性化合物,電子和空間因子都具有重要作用。因此,催化反應的原子級解釋需要使用混合QM/MM方法。
B.分子動力學(Molecular Dynamics)
蛋白質的構象動力學和功能之間存在重要的協同作用。分子動力學模擬將結構和動力學聯繫起來,以探索蛋白質分子可以獲得的構象能量景觀,促進原子水平理解蛋白質如何工作的原子細節。分子動力學模擬通過整合牛頓運動定律來計算系統的連續配置。記錄的軌跡指定系統中顆粒的位置和能量作為模擬時間的函數。
分子動力學模擬在ADMET相關蛋白建模中具有重要的作用,例如探索柔性蛋白質的蛋白質構象或使用自由能微擾(free energy perturbation ,FEP)法計算ΔΔGbind。
2
同源建模
儘管蛋白晶體結構快速生長,但是已知蛋白質的數量仍然大大超過相應結構數量。另一方面,蛋白質的結構僅由其一級序列決定;進化過程中,序列變化不會直接轉化為重要的域結構變化。具有高序列相似性的已知結構採用大致相同的結構模型,同源模建就是基於這些基礎研究。
同源建模包括四個主要步驟:
(i)摺疊分配;
(ii)序列比對;
(iii)模型構建;
(iv)模型優化。
沒有可用3D結構的已知序列稱「靶」,具有可用結構的順序同源蛋白被稱為「模板」。摺疊分配的目標是基於與目標序列的序列相似性來識別可能的模板。選擇正確的模板對預測模型的質量有重要影響;另一方面,參與ADMET建模的許多蛋白質都採用不同的構象。在CYP酶家族中,根據共結晶配體的存在和類型,活性位點在同種類型的晶體結構之間存在巨大的變異性。
模型建立過程通常包括構建骨架,隨後構建同源模型的側鏈。恢復模板中保守區域的構象,優化步驟的主要目的是提高生成的粗糙模型的有效性。可以進一步的環重建、能量最小化或分子動力學模擬。優化步驟中,模型的質量通過立體化學參數(如Ramachandran-plot,基於統計的電位和基於物理的能量函數)不斷監測。
3
分子對接
對接是預測蛋白質活性位點內配體結合構象以及結合自由能的一種方法。為了預測結合模式,要對分子的內部構象和六個平移和旋轉自由度進行採樣。
配體-蛋白複合物的預測有兩種不同的應用:
首先,研究單個配體-蛋白質相互作用以及精確結合自由能的預測,或為分子動力學或QM/MM計算準備分子結構需要的高度準確的模型。在這些情況下,兩個約束伴侶的構象被認為是靈活的,因此對接研究是計算密集型的。
第二個應用是虛擬篩選。由於結合位點的高度靈活性和相關的採樣計算成本,在大多數高通量對接方法中,蛋白質被認為是剛性的。因此虛擬篩選的對接被實現為在剛性蛋白質結合位點的邊界內的配體的特殊構象搜索。
4
總結
具有或不具有結合配體的蛋白質結構模擬對於解釋蛋白質功能的生物化學和生物物理學研究的結果具有根本的重要性。
由於建模依賴於實驗數據,故理論和實踐必須相互滲透。大概的模型可以是非常有用的工具來設計新的實驗條件來測試各種假設。實驗獲得的結果可以指導反饋微調計算模型。除了計算機和體外技術之間的協同作用以了解許多生物現象的複雜性之外,蛋白質建模對藥物發現有直接的影響。由於對蛋白質結構的了解不斷擴大,ADMET相關靶標將成為近期計算機輔助藥物設極具吸引力的領域。
參考資料:
1.Warren G L,Do T D,Kelley B P,et al.Essential considerations for using protein–ligand structures in drug discovery[J].Drug Discovery Today,2012,17(23):1270-1281.
2.Mulholland A J.Computational enzymology:modelling the mechanisms of biological catalysts[J].2008.
3.Pisani P,Caporuscio F,Carlino L,et al.Molecular dynamics simulations and classical multidimensional scaling unveil new metastable states in the conformational landscape of CDK2[J].PloS one,2016,11(4):e0154066.
4.Moroy G,Martiny V Y,Vayer P,et al.Toward in silico structure-based ADMET prediction in drug discovery[J].Drug discovery today,2012,17(1):44-55.
5.Schmidt T,Bergner A,Schwede T(2013)Modelling three-dimensional protein structures for applications in drug design.Drug Discov Today.
TAG:殷賦科技 |