AI加速藥物研發過程:從7000874個小時變成幾天
原本當時是研究心血管疾病,但男性受試者看到美女護士意外有反應,因此轉研究男性勃起功能障礙。
「偉哥之父」穆拉德在一次座談會上講述其藥物開發過程時,這樣講道。這番話讓在場的觀眾驚訝得合不攏嘴,但這確實是藥物發現的一個主要方式:偶然發現。
藥物發現、生物標誌物篩選等環節均是一種苦苦尋覓的過程,要在自然界無數種物質中找到一種能治療某種特定疾病的物質。大多數情況下,科學家是無限擴大篩選對象以期邂逅目標分子,人們通常利用高通量篩選(HTS)進行篩選,HTS成本十分昂貴,它由機器人自動完成,通過在同一時間進行數以百萬計的試驗,找出最有潛力達到目標的化合物,提高藥物發現的「命中」幾率。目前,業界嘗試利用人工智慧開發虛擬篩選技術,以取代或增強傳統的高通量篩選(HTS)過程,並提高篩選的速度和成功率。
那麼,AI可用在哪裡?具體怎麼用呢?
用在哪裡?
AI可應用於藥物開發的不同環節,包括新葯開發、藥物有效性/安全性預測、構建新型藥物分子、篩選生物標誌物、研究新型組合療法等。
新葯有效性、安全性預測
一種物質變成藥物,必須要具備安全性、有效性的特徵,而在新葯研發過程中提前預測,則可以極大程度地提高研發成功率。
Atomwise是藥物挖掘與人工智慧結合領域比較有代表性的初創公司,其通過IBM超級計算機分析資料庫,並用深度學習神經網路分析化合物的構效關係,於藥物研發早期評估新葯風險。
不僅如此,Atomwise還自己研發了深度學習網路AtomNet,以識別了醫藥化學中的基礎模塊,並且聲稱自己在新葯發現、結合親和力預測和毒性檢測上得到了世界上最好的結果。
2015年,公司宣布在尋找埃博拉病毒治療方案方面有一些進展,在已有藥物中,有兩種或許能用來抗擊埃博拉病毒,找到這兩種藥物用時僅一周,而用傳統藥物研發方法尋找則可能要耗費好幾年的時間。
目前,Atomwise的商業模式是:為製藥公司、創業公司和研究機構提供候選藥物預測服務。除此之外,公司與Merck公司和Autodesk也合作進行一些保密項目。
藥物挖掘
據了解,藥物挖掘是AI應用最早且進展最快的領域。通過計算機模擬,可以對藥物活性、安全性和副作用進行預測。
BenevolentAI是英國的一家人工智慧公司,公司旨在將人工智慧應用於醫學研究的龐大資料庫以快速篩選和組織數據,並且有一個「小目標」:用AI顛覆整個藥物研發過程。
BenevolentAI公司顛覆的具體過程是這樣的:
數據分析:通過深度學習和自然語言處理理解和分析大量的生物科學信——專利、基因組數據和所有生物醫學期刊和資料庫每天上傳的10,000多份出版物。
深度學習軟體攝取、分析信息,找出關聯並提出相應的候選藥物,進一步篩選具有對某些特定疾病有效的分子結構,比如可用於神經退行性疾病但沒有心臟或肝臟副作用的分子。
2016年11月,強生旗下楊森公司與BenevolentAI達成協議,用後者的人工智慧技術評估小分子化合物的臨床潛力。據雷鋒網了解,目前BenevolentAI已經獲得了一定數量的臨床階段的新藥物,以及相關專利的獨家許可證。
設計新型藥物分子
藥物作用於體內特殊部位,有如鑰匙與鎖的關係,科學家們通常通過研究構效關係或研究靶標生物大分子的結構,進行藥物分子設計。
一家位於Baltimore的生物信息公司—— Insilico Medicine,顯得與眾不同,公司使用了一種較新的深度學習技術:生成式對抗網路(GAN)來構建藥物分子。
對此,Insilico公司CEO說道,「不同於通過不斷試驗試錯來尋找先導化合物,你可以告訴這個網路產生這樣的化合物分子。」
GANs 通過使用兩個競爭神經網路模型,創建不同於真實數據的新數據,生成模型產生「看起來像」真實數據的數據,鑒別模型輸入生成數據和真實數據,並且區分他們。生成模型通常用於創建圖像、語音或文本,也有公司將其應用於癌症藥物開發。
GAN,概率生成模型的目的,就是找出給定觀測數據內部的統計規律,並且能夠基於所得到的概率分布模型,產生全新的,與觀測數據類似的數據。GAN的或者一般概率生成模型的訓練目的,就是要使得生成的概率分布和真實數據的分布盡量接近,從而能夠解釋真實的數據。
據雷鋒網了解,這種用生成對抗網路(Generative Adversarial Networks ,GANs)發展、訓練新的分子結構的方法,能大幅度減少尋找有潛在藥物特性物質的時間和其他成本。
據雷鋒網了解, Insilico與美國保健品供應商Life Extension合作,幫助後者開發具有新型營養作用的分子結構,並且Insilico公司也與Novartis、Champions Oncology和其他多家合作夥伴密切合作。
篩選生物標誌物
生物標誌物(Biomarker)是指可以標誌系統、器官、組織、細胞及亞細胞結構或功能的改變或可能發生的改變的生化指標。在醫學領域,生物標誌物可用於疾病診斷(例如前列腺特異性抗原PSA可用於前列腺癌診斷)、判斷疾病分期(例如惡性腫瘤的分期)或者用來評價新葯或新療法在目標人群中的安全性及有效性。
2016年10月,美國國防部宣布與生物製藥公司「博格健康」合作,利用人工智慧技術開展新葯研發,以尋找應對現有藥物不起反應的侵入性乳腺癌治療方案,將篩選多達25萬個樣本來尋找早期癌症的新生物學指標和生物標記。
博格健康有一個人工智慧平台,該平台篩選過程是這樣的:
研究人員首先將對來自健康供體的樣品和各種乳腺癌亞型的樣品進行基因測序,從而對存在於癌細胞和正常細胞中的突變、蛋白及細胞過程建立基因組信息。
這些數據將與患者的已知病史結合起來送入人工智慧平台,並利用數萬個數據點建立起健康及患病組織的不同模型。
該平台的演算法最終將找出橫跨這些模型的分子簽名中的熱點。這些熱點或可代表生物標記或藥物靶點。
新型藥物靶點、組合療法
藥物與機體生物大分子的結合部位即藥物靶點,而選擇確定新穎的有效葯靶是新葯開發的首要任務。
2016年12月,醫藥巨頭輝瑞與 IBM Watson Health簽署一個協議:將Watson的超級計算能力用於其研發新型抗癌藥中。
輝瑞用到的是其基於雲端的人工智慧平台:Watson for Drug Discovery,輝瑞的研究人員通過這個工具分析大量孤立的數據來源,包括許可的和公開的可用數據以及公司自己的數據,並且可以驗證假設,實時交互得到有證據的結果,用於免疫腫瘤領域新藥物靶點的發現、組合療法的研究和患者治療策略的選擇中。
怎麼用?
數據處理:
處理巨大的資料庫,利用不同的實驗數據,提高多種疾病的預測精度。
尋找生物標誌物或藥物靶點。
研究特定疾病的療法等。
生成模型
分析藥物構效關係,取代或增強傳統的高通量篩選(HTS)過程,並提高篩選的速度和成功率。
「在許多靶點上,它都實現了接近完美的預測質量,使其尤其適合被用作虛擬篩選裝置。總之,深度學習提供了建立虛擬篩選並將其作為藥物設計管道中標準步驟的機會。」
評估藥物副作用:當存在成千上萬個化合物都可能對某個疾病顯示出某種療效,評估藥物的副作用。
按需構造分子或設計新型藥物分子。
傳統的藥物開發是一個不斷試驗、不斷試錯的過程,在這種思路下,藥物從最初的實驗室研究到最終擺放到葯櫃銷售平均要花費12年時間,需要投入66.145億元人民幣、7000874個小時、6587個實驗、423個研究者,最後得到1個藥物。
AI助力的藥物研發從數據開始,並通過數據生成假定藥物,並且顯示出更快、更有效率開發新葯的潛力。以Atomwise為例,其超級計算機可以在幾天之內評估820萬種化合物,找到多發性硬化症可能的治療方法。
2016年底,美國高盛集團發布的人工智慧報告:《人工智慧、機器學習和數據將推動未來生產力的發展》(AI, Machine Learning and Data Fuel the Future of Productivity)中提到:「隨著人工智慧和機器學習的不斷整合,人們將有望在新葯研發的過程中顯著地實現「去風險」,不但將節約每年約260億美元的研發成本,同時還將提高全球醫療信息領域的效率,節約的成本價值超過每年280億美元。」
※馬化騰解答:小程序的未來在哪裡?公眾號會推付費內容嗎?微商為何這麼亂?
※1 億美元投資蔚來汽車,百度在打什麼算盤?
※馬化騰兩會關注個人信息安全保護 QQ去年查處4700多個相關群
※特斯拉之後,第二個擁有電池「超級工廠」的企業有望在中國誕生
TAG:雷鋒網 |
※一個普通文玩核桃從100到10000的巨變過程
※1938.5.10-5.13,歷史照片展示廈門淪陷過程
※連載-1972年本田XL250 K0修復翻新過程
※1979-2017 說唱的演變過程,求普及!
※NBA 相信過程!76人5年1億4800萬留住恩比德
※日本網民吐槽:新垣結衣2005年-2017年的變化過程
※1928.5.4-5.11,歷史照片還原濟南城失陷過程
※【1928.5.4-5.11】老照片還原濟南城失陷過程!
※網友8個月減肥80斤 4個階段過程
※雷迪克同意1年2300萬簽約76人,相信過程
※2006年5月17日,美國海軍炸沉一艘退役航空母艦全過程
※國外小白賣家:7天從0到$1000的一步步操作過程
※T-54型在最初的量產過程中進行了1490項改進
※肥妹分享135斤-90斤減肥過程
※在首飛過程中,C919的最大高度為1萬英尺,最大速度170節。
※從145到102的脫變過程,瘦身秘笈堅持1個月就能成功
※他年過半百,為拍新片暴漲194斤,再減脂從 37% 降到 9.6%,重回肌肉男的逆天過程!
※用延時攝影來欣賞64000個方塊製作D.VA的過程
※老照片:1946-1949,國軍視角下內戰全過程