結合人工智慧的高性能醫學:現狀、挑戰與未來
選自Nature
作者:Eric J.Topol
機器之心編譯
參與:Panda
醫療領域存在一些長久以來的弊病,現在很多人相信人工智慧技術有望為這些問題帶來根本性的解決方案。近日,Nature Medicine 發布了斯克里普斯研究所(Scripps Research)Eric J. Topol 的「高性能醫學」綜述論文,文中認為醫學領域內 AI 的發展目標是人類智能與機器智能的結合。
有標註大數據的使用以及顯著提升的計算能力和雲存儲實現了人工智慧在各行各業的應用,尤其是其中的深度學習子類別。在醫學領域,人工智慧開始在三個層面產生影響:臨床(主要是通過快速、準確的圖像解讀)、健康系統(通過改善工作流程和降低醫療錯誤的潛力)、病人(讓他們能處理自己的數據,從而提升健康狀況)。本文也將會討論當前的局限性(包括偏差/偏見、隱私和安全、缺乏透明)以及這些應用的未來方向。隨著時間的推移,準確度、生產力和工作流程方面很可能能夠實現顯著的提升,但這會被用於改善醫患關係還是導致其惡化,這一點還有待觀察。
醫學位於兩大主要趨勢的交叉口。第一個趨勢是業務模式的失敗——雖然與醫療保健相關的支出和工作崗位都在增加,但關鍵的結果卻每況愈下,包括美國預期壽命下降以及較高的嬰兒、兒童和孕產婦死亡率。這體現了一個悖論,一個並不僅限於美國醫學界的悖論:投入更多人力資本卻得到了更糟糕的人類健康狀況。第二個趨勢是數據正大規模地生成,其來源包括高解析度醫療成像、具有持續的生理指標輸出的生物感測器、基因組測序和電子病歷。僅靠人類很顯然已經難以分析這些數據,也就必須增加對機器的依賴。因此,為了提供醫療保健,在對人類的依賴超越以往的同時,我們也迫切需要演算法提供幫助。然而,在醫學領域,人類與人工智慧(AI)的整合才剛剛開始。
從更深層次看,醫療保健領域存在顯著的長期缺陷,正是這些缺陷導致其回報越來越低。其中包括大量嚴重的誤診、治療方法錯誤、資源的極大浪費、低效的工作流程、不平等、患者和臨床醫生之間時間不足。帶著改善這些問題的渴望,醫療行業的領軍者與計算機科學家聲稱 AI 也許能幫助解決所有這些問題。也許最後確實會如此,但研究者才剛剛開始使用神經網路來改良醫療實踐中的弊病。在這篇回顧中,我收集了很多在醫學領域使用 AI 的已有證據,並列出了其中的機會和陷阱。
臨床醫生使用的人工智慧
幾乎每種類型的臨床醫生(從專科醫生到護理人員)未來都將會使用 AI 技術,尤其是深度學習。這很大程度上涉及到使用深度神經網路(DNN)的模式識別,這可以幫助解讀醫療掃描結果、病理切片、皮膚病變、視網膜圖像、心電圖、內窺鏡檢查、面部和生命體征。我們通常使用一種真陽性與假陽性比率的圖表(被稱為受試者工作特徵曲線(ROC))來比較神經網路的解讀結果與醫生的評估,使用該曲線下的面積(AUC)來表示神經網路的準確度水平。
放射科
病理學
皮膚科
眼科
心臟病學
消化內科
心理健康
表 1:與醫生比較的經過同行評議的 AI 演算法論文
表 2:美國食品藥品監督管理局(FDA)正在加速審批 AI
人工智慧與健康系統
理論上而言,預測關鍵性結果的能力能讓醫院更有效和更準確地使用姑息療法。
使用電子病曆數據,機器學習和深度學習演算法可以預測很多重要的臨床參數,涵蓋阿爾茨海默病到死亡等許多情況。
表 3:這裡選擇性地展示了一些用於預測臨床結果和相關參數的機器學習與深度學習演算法
除了電子病歷的數據,也可以使用影像來提升預測準確度。有多項研究試圖預測生物學年齡,而結果已經表明使用基於 DNA 甲基化的生物標誌物來完成這一任務是最佳的。
人工智慧與患者
深度學習演算法的發展讓公眾可以將自己的醫療保健掌控在自己手中,但這方面的工作目前落後於臨床和健康系統。這類演算法中有一些已經獲得了 FDA 的批准,正處於後期臨床開發階段。
圖 2:AI 在人類生命周期中的應用實例。dx 表示診斷;IVF 表示體外受精;K 表示血鉀水平
研究者也在尋求通過 AI 藉助智能手機完成一些醫療診斷,其中包括皮膚病變和皮疹、耳部感染、偏頭痛和視網膜疾病(比如糖尿病性視網膜病變以及與年齡相關的黃斑變性)。
科學家也在研究如何整合有關人體健康狀況的多模態數據。最終,當可以整合一個個體的所有數據與醫療文獻語料庫時,就有可能實現全面系統的預防方法。
圖 3:使用多模態數據輸入和演算法的虛擬醫療教練模型,能夠提供個性化的指導。使用來自個體的全面輸入的虛擬醫療教練經過深度學習後,可以為人們提供保持健康的建議。
人工智慧與數據分析
在臨床實踐的上游,生命科學領域內的 AI 進展明顯要快得多,也有廣泛的有同行評議的出版物,這是在沒有監管監督時更容易驗證的道路,而且科研界有遠遠更強的實現意願。正如聽診器是醫生的標誌一樣,顯微鏡是科學家的標誌。科學家目前正在研究一些「無圖像的」顯微方法。除了改進無圖像顯微方法和細胞分析,深度學習人工智慧也已被用於恢復或修復失焦圖像。而且計算機視覺也已經幫助實現了單個細胞內的 40-plex 蛋白質和細胞器的高通量評估。
研究者也在使用 AI 工具來提升對癌症演化方式的理解——他們將一種遷移學習演算法用在了多區域腫瘤測序數據上,將計算機視覺用於通過微流體隔離的在單個細胞解析度上的活體癌細胞分析。
既然我們已經在用「神經網路」描述 AI 了,那麼生物神經科學與人工智慧互相提供靈感也就不足為奇了。
AI 已被用於重建神經迴路,能讓我們根據電子顯微成像理解連接組。AI 帶來的一個最激動人心的進展是理解人類大腦的網格細胞。反過來,神經形態計算(通過對大腦逆向工程來研發計算機晶元)不僅能實現更高效的計算,還能幫助研究者理解大腦迴路和構建腦機介面。使用遷移學習演算法實現人類和動物行為的機器視覺跟蹤是另一個正在進行中的進展。
AI 正在多個層面上改寫藥物發現的方式,包括對生物醫學文獻的複雜的自然語言處理搜索、對數百萬分子結構的數據挖掘、設計和製作新的分子、預測脫靶效應和毒性、預測實驗藥物的合適劑量以及進行大規模的細胞檢測分析。
局限和挑戰
儘管 AI 技術有望實現所有這些成就,但也存在艱巨的障礙和陷阱。AI 當前的炒作熱潮已經遠遠超出了 AI 科學的當前現狀,尤其涉及到病患護理中的實現的驗證和可讀性時。IBM Watson Health 的癌症 AI 演算法(被稱為 Watson for Oncology)就是近期的一個案例。這個演算法已被全球數百家醫院用於為癌症患者推薦治療方法,但該演算法卻基於少量合成的、非真實的案例,僅有非常有限的腫瘤專家的輸入(真實數據)。實際輸出的很多治療方法建議都被證明是錯誤的,比如建議嚴重出血的患者使用貝伐珠單抗(Bevacizumab),這是一種明確的禁忌癥狀和該藥物的「黑箱」警告。這個例子說明有缺陷的演算法有可能會給患者造成重大的傷害,導致醫療事故。不同於一位醫生的錯誤只會傷害到一位病人,機器演算法有可能帶來巨大的醫源性風險(iatrogenic risk)。因此在將 AI 演算法用於醫療實踐時,需要進行系統性的調試、審計、廣泛的模擬和驗證以及前瞻性的審查。還需要更多證據和穩健的研究以達到 FDA 近期已經降低了的審批醫療演算法的監管要求。
有關演算法的黑箱的內容已被寫了很多,圍繞這一主題的爭論也有很多;尤其是在 DNN 的情況中,我們有可能無法理解輸出的決定因素。這種不透明帶來了可解釋性需求,比如,歐盟的《一般數據保護條例》要求在將演算法用於患者護理之前需要有透明性——打開演算法的黑箱。儘管是否可以接受為患者護理使用不透明演算法的爭議尚未解決,但仍需指出醫學實踐的很多方面都是不可解釋的,比如在不知道作用機制的前提下的藥物處方。
不平等是現今最重要的問題之一,尤其是在美國,也就是醫療護理並不向所有公民提供。大家都知道社會經濟地位是過早死亡的一個主要風險因素,有產者和無產者對 AI 的不成比例的應用可能拉大兩者之間的現有差距。這種已經存在的不平等之所以會加大,一個原因是現今很多演算法中嵌入的偏見,這又源自於數據集中缺乏對少數群體的覆蓋。比如,有的診斷黑素瘤的皮膚科演算法沒有覆蓋不同膚色以及使用基因組數據語料庫,這樣的演算法在代表性不足的少數群體上存在嚴重問題。儘管有人認為演算法偏見還比不上人類偏見,但仍然還需要很多工作以消除嵌入的偏見,也需要爭取讓醫療研究提供真正有代表性的人口情況。
AI 在醫學領域的未來的一個最重要問題是能在確保數據的隱私和安全上做到多好。鑒於普遍存在的黑客攻擊和數據泄露問題,人們將不會有什麼興趣使用有風險泄漏患者病歷細節的演算法。此外,也存在故意攻擊演算法以造成大規模傷害的風險,比如為糖尿病過量使用胰島素或刺激除顫器在心臟病患者的胸腔內放電。通過人臉識別或基因序列從大規模資料庫中識別個人身份的可能性正越來越高,這又會進一步阻礙對隱私的保護。與此同時,生成對抗網路也可能模糊真相,幾乎有無限的操縱內容的可能性,從而可能對健康非常不利。我們需要新的個人健康數據所有權模式、高度安全的數據平台和政府立法(正如愛沙尼亞已經實現的那樣),這樣才能應對迫在眉睫的安全問題,否則 AI 在醫療領域的發展就會遭遇阻礙或失去機會。
考慮未來
我在這篇回顧中強調的一個關鍵點是將 AI 帶入醫學領域的故事才剛剛開始。對於機器能夠執行的幫助臨床醫生或對健康系統有用的預測臨床結果的任務,前瞻性的驗證真的非常少,對於以用戶為中心的演算法就更少了。這個領域的承諾確實很多,而數據和證明相對較少。錯誤演算法的風險極大高於單個醫生-病患交互的風險,但是降低誤差、低效和成本的回報也很大。因此,醫學領域的 AI 不能有例外——在患者護理中推出和實現之前,它需要嚴格的研究、在有同行評議的期刊上發表結果以及在真實世界環境中的臨床驗證。
圖 4:呼籲醫學領域中 AI 研究應有正當的程序。在患者護理中實現之前,必需先在有同行評議的期刊上發表結果,在真實世界醫學場景中驗證。
有了這些警告,對 AI 最終將如何整合進來要有合理的預期,這一點也很重要。現今有一種廣泛的炒作,說是醫生會被機器取代,我們可以將其與現實測試的自動駕駛汽車模型類比看看。大多數人都同意自動汽車是到目前為止 AI 最頂尖的技術成就,但「自動」一詞頗具誤導性。汽車工程師協會(SAE)已經定義了五個自動化層級,其中第 5 級表示在所有情況下都完全由汽車控制,人類沒有任何可能性作為後備或接管汽車。現在普遍認為這種定義的完全自動化很可能永遠無法實現,因為某些環境或道路條件會使得我們無法安全地使用這種車輛。基於同樣的原因,醫學可能永遠無法突破第 3 級,這是一種有條件的自動化,因為其中肯定需要人類來監管演算法對圖像和數據的解讀。很難想像在治療病人時僅有非常有限的人類後備(第 4 級)。人類的健康太寶貴了——除了風險極小的日常事務之外,還遠遠不能將其託付給機器。
圖 5:自動駕駛汽車與醫學自動化的類比。第 5 級是不存在人類醫生作為後備可能性的完全自動化,這不是目標。第 4 級是僅在非常有限的條件下使用人類備份,這也不是目標。目標是協同,將機器做得最好的功能與那些最適合臨床醫生的工作結合起來。
激動人心的發展就在前方,但可能會比很多人預測的更遠——軟體將快速、準確和低成本地消化和有意義地處理大規模數據,機器將有能力實現人類無法看到或做到的事情。這一能力最終將成為高性能醫學的基礎,這是真正由數據驅動的,能減輕我們對人類資源的依賴,並最終將讓我們超越人類智能和機器智能單純相加之和。在生物醫學領域和發現中已經實現的進展在被接受和廣泛實現方面遇到的挫折要小得多,這些上游進展將引領這一人機共生。
本文為機器之心編譯,轉載請聯繫本公眾號獲得授權。
------------------------------------------------
※特朗普簽署啟動美國AI計劃,加速與中國、加拿大AI競賽,爭奪全球領導權
TAG:機器之心 |