十項觀察!藥物開發中的AI現狀
今年十月底在哈弗醫學院由Corey Lane Partners,LLC創辦的BioPharma AI應用峰會已經圓滿落幕。這次峰會堪稱是人工智慧和生命科學相交的一個顯型快照。本文我們將總結一下這次峰會的十項觀察結果。
打開今日頭條,查看更多精彩圖片1. 藥物開發企業問題逐漸暴露 ,AI應用潛力很大
傳統的製藥公司在藥物開發方面都會存在時間長、花費多的問題,這也是人工智慧介入的重要原因之一。塔夫茨(Tufts)藥物研究中心最新數據顯示,開發一鍾新葯平均費用為26億美元;新葯的平均上市時間為12年;目前大約有10%的候選藥物開始從測試階段進入市場。很顯然,這些數字被改進的空間還很大,人工智慧有很大的助力潛力。
2.藥物開發中的AI應用預見火熱
目前很多公司都開始將人工智慧應用到藥物研發過程中,例如創業公司Berg Health,該公司正在收集前列腺癌症患者的相關數據,作為新藥物研發的測試數據。Insilico Medicine被評為全球人工智慧百強公司,該公司的首席執行官Alex Zhavoronkov在大會上表示,我們都沒有能力去評估Insilico背後的科學,該公司擁有人工智慧所有的外在跡象,發表過多項論文,以及GANS等先進技術(生成對抗網路,深度學習方法),並且還擁有傑出的合作夥伴,以及「先進的端到端藥物AI」目標。
3. AI藥物領域,小公司勝過大公司
在AI藥物領域,很多初創公司的發展速度都遠遠超過大型製藥公司,例如Berg和Insilico。這些初創的製藥公司正在不斷的將新藥物推向市場,發展前景不可估量。大會上多位發言人表示,大型製藥公司對創業生態系統的推動並不明顯,甚至還會出現被投訴的現象。眾人多抱怨大型製藥公司費時又費錢。但在人工智慧領域,大型製藥公司憑藉豐富的內外資源,其發展速度和規模勝過小型公司,但AI藥物研發應用的幅度卻不是很大。據了解,輝瑞(Pfizer )目前正在進行著150多個人工智慧項目的研發工作,但是涉及到藥物發開的項目卻很少。
4. 高投注,低信度
如今,很多藥物企業傾向於投注高期望的AI項目,即便他們對自己的需求並不明確。大會上,大型製藥企業和一些初創公司的高管一致認為,在建立未來人工智慧項目時,必須優先考慮好模型性能監控和項目規劃的問題,包括假設定義和測試標準。一個好的人工智慧項目不僅要關注狹義的研究問題,更需要觀測更大的圖景,以確保項目的可持續性和擴展性。
5. 數據是製藥和生命科學中人工智慧的關鍵
製藥和生命科學中的人工智慧應用,數據是最核心的所在。其中大部分涉及「組學」數據——基因組學、蛋白質組學、生物組學、代謝組學等。越來越多的數據被應用到製藥領域,作為各種測試中的「假設」。很難想像在沒有人工智慧的情況下,怎樣分析這些數據。當然也可以想像,在這樣的大數據時代,擁有極強數據分析能力的公司佔據了多大的優勢。
6. 在這段旅程中,沒有人會單獨行動。
在藥物領域,一個組織想要獨自進行人工智慧的研發是很難的,因為會涉及到很多夥伴關係和生態系統之間的關係。很多小公司都開始跟大公司聯手組建醫療保險人工智慧聯盟,圍繞該項技術進行合作和倡導。即便是一家大型的製藥公司在早期發展中也需要得到外界的幫助。
7. Watson AI已失寵
會議上,沒有多少人提到過IBM的Watson,因為大家認為它在癌症治療方面效果不是很好。Watson AI似乎不再被視為改善藥物開發的一個因素。據了解,輝瑞利用沃森進行藥物開發的試點工作仍在進行中,但該公司正在「冷卻」」這項技術。
8. 藥物領域的AI預測≠自動化預測
與人工智慧許多預測不同的是,在人工智慧藥物開發領域中,似乎沒有人會說人類科學家和護理提供者在未來將不被需要。相反,在醫藥領域,他們都是同等類型的人,除此之外,該領域還會增加大量的數據科學家和AI工程師。Flatiron Health就將這一問題解釋的很好,在這家數據驅動的癌症治療公司,AI 「增強」不等同於自動化「增強」。今年年初,Flatiron Health被瑞士製藥巨頭羅氏收購,目前主要負責的任務是從醫生的筆記和電子健康記錄中的其他非結構化數據中提取關鍵信息。Flatiron使用自然語言處理AI工具不是為了減輕工作任務,而是為了提高生產力。
9. 數據質量問題仍在,仍需著重關注
雖然藥物開發中的人工智慧應用正在有禮有條的進行著,但是數據質量的問題仍需著重關注。會議上經常發表聲明「數據不良,數據不良」的說法。雖然很多企業正在努力改進他們的演算法和人工智慧基礎設施,但數據質量問題始終存在。眾所周知,金融風險很高,有偏差的數據標準和粒度會導致演算法偏見,從而即便是再多的努力也是浪費時間和資源。因為這個問題,很多的數據採集者在數據收集階段就致力於提高數據質量。
10. 知識共享及數據質量比數據收集更重要
會議上的幾位發言者提到,製藥公司傾向於根據資料庫的數量來囤積數據並評估其未來的成功。Sanofi首席數據官Milind Kamkolkar在大會上表示,知識共享和提升數據質量的合作比收集數據更重要。但藥物領域的競爭非常激烈,任何公司都不願意向競爭對手分享他們爭取到的數據。預計不久的將來,醫療保健和製藥利益相關者將不得不與數據所有者(即,醫療保健提供者,患者和其他醫療保健消費者)協商數據的使用權。
人工智慧在製藥行業的應用還處於早期階段,目前已經有大量的企業投注於這個領域,但是未來如何,我們還需持續關注。
※像樂高積木一樣,數據中心可以「拼」出來嗎?
※惡意軟體日均進攻百萬次!三大方法保護Hadoop集群免遭攻擊!
TAG:IT168企業級 |