當前位置:
首頁 > 新聞 > 谷歌與全球頂級醫學院聯手,Jeff Dean等首篇電子病歷論文解讀

谷歌與全球頂級醫學院聯手,Jeff Dean等首篇電子病歷論文解讀

谷歌與全球頂級醫學院聯手,Jeff Dean等首篇電子病歷論文解讀

【新智元導讀】本周谷歌在ArXiv上公開了一篇眾人期待已久的論文,也很可能是谷歌在電子病歷建模分析方面的首篇文章,使用深度學習模型,由Jeff Dean率隊,聯合UCSF,斯坦福,UChicago等知名機構的眾多大牛,從題目到作者都堪稱豪華。不過,康奈爾大學威爾醫學院助理教授王飛認為,文章寫得中規中矩,並無太多驚喜,其中關鍵一點,便在於基線選擇從計算模型的角度講「太弱」,再次印證了電子病歷分析相關問題無法輕易解決,但這也為我們指明了要攻克的難關。

谷歌與全球頂級醫學院聯手,Jeff Dean等首篇電子病歷論文解讀

一篇萬眾矚目,期待已久的論文:谷歌聯合全球最好的醫學院能做出什麼來

本周,Jeff Dean大神帶領一票人馬,在ArXiv上掛出了一篇文章,題目叫「Scalable and Accurate Deep Learning for Electronic Health Records」。這篇文章從題目到作者都吊足了大家的胃口。

從題目上看,深度學習就不必多說了,電子病曆數據也是近些年來研究的熱點,尤其是醫學信息學領域。與醫學圖像相比,電子病曆數據量更大,包含的信息更多,並且有時續性,當然,由此帶來的挑戰也更多,例如隱私性,數據噪音,異質性,等等。這些挑戰促成了近些年一大批用機器學習方法分析電子病歷的文章,這些文章發表在各大頂級會議上,例如NIPS,ICML,KDD,以及更偏應用的AMIA。

從作者上看,Jeff Dean就不用多說了,Quoc Le等人也是深度學習界耳熟能詳的人物。此外,Nigam Shah是Stanford生物醫學信息中心的終身教授,他是醫學信息學界非常活躍,一直大力推動機器學習、數據挖掘技術在醫學信息學中的應用,並在KDD 2014受邀作為industry keynote speaker。而Atul Butte則是醫學信息學界最有影響力的學者之一,當初UCSF把他從Stanford挖過來的時候就引起了不小的轟動。他本人也是UCSF計算健康科學中心(Institute for Computational Health Science)的首任director,美國醫學院院士。2017年夏天,小扎與他夫人專門給Atul捐了1000萬美金做為Gift來支持他的研究,可見此人的影響力。因此,不論從題目還是作者陣容,此文絕對稱得上豪華。

本文的誕生也並非偶然,2017年5月的時候,Google就廣發英雄帖,號召有醫療數據的醫學院、醫院、各種研究中心等來貢獻他們的數據和Google合作,利用Google豐富的計算資源挖掘數據中的價值。而Google一開始則選擇了UCSF,Stanford,UChicago做為合作單位,這些單位在當時也都發了新聞作了報道。因此,這篇文章也可以是稱得上是萬眾矚目,期待已久——大家都想看看Google與這些最好的醫學院聯合能做出什麼來。果不其然,文章一出,就收到很多圈內朋友的消息。

研究概述:用深度學習分析電子病歷,預測4大關鍵指標

文章開篇寫得也很大氣,基本是想要一統江湖的架勢。文章在兩個大的醫院系統,UCSF和UChicago的電子病曆數據上,用深度學習模型想要預測四件事情:1)住院期間的死亡風險;2)規劃之外的再住院風險;3)長時間的住院天數;4)出院的疾病診斷。

這四件事情都是醫學中非常重要,非常有代表性的事情,就像作者在文章中說的,第一件事代表了臨床結果,第二代表了醫療質量,第三代表了醫療資源的利用,第四代表了病人情況。記得當初,Heritage fund曾組織過一個競賽來預測住院天數,並且懸賞300萬美金獎勵優勝者。

文章很仔細地介紹了一些實驗信息,例如如何建病人隊列,特徵如何變換,演算法如何評價等等。對於每一個預測任務,作者也都選取了臨床上常用的演算法來進行比較,例如評價死亡風險的EWS分數,以及評價再住院風險的HOSPITAL分數等,作者對這些模型做了微小的改進。最終通過比較,作者的模型都顯著好於這些傳統模型(AUC普遍提高0.1左右)。

論文插圖:使用深度學習預測病人住院期間死亡風險,深度學習(實線)在前後24小時時間範圍內,都比基線水平(虛線)準確率更高。

關鍵的深度學習模型:LSTM、前饋神經網路和決策樹

下面簡要介紹一下作者採用的三種模型。要提的一點是,在輸入模型之前,所有電子病歷中的事件全都被嵌入到一個統一的低維空間中。

首先就是傳統的長短記憶網路。由於在同一時間點可能有多個事件發生,若這些事件屬於不同類型(例如診斷和藥品),那麼作者就把它們拼接起來;若這些事件屬於同一類型,那麼作者就把它們進行加權平均,而權重則是通過學習獲得,因此作者將該模型稱為加權的循環神經網路。

第二則是傳統的前饋神經網路。為了使用這種方法,我們需要將病人的電子病歷事件序列轉換為向量表示。為了達到這一目的,作者將每一序列的所有事件進行加權平均,並提出了幾種不同的策略來設計權重,而這些權重均與該事件的發生時間到預測時間點的時間間隔相關。儘管具體的設計不同,但這種與時間相關的加權策略在基於電子病歷的預測建模中非常常見,例如筆者去年與UCSD的蔣曉謙老師寫的關於時間序列中的事件嵌入,以及與MSU的周家雨老師寫的時間敏感的長短記憶網路的文章中均有採用。

第三則是提升的基於時間的決策樁。這裡的決策樁即是單層決策樹,在文章中就是一大批二值的決策規則。在實際決策中,每一決策規則被分配一個權重,而最終的預測即是這些決策規則的加權組合的softmax。提升方法(Boosting)被用來選擇合適的決策規則。最終,這些規則又被嵌入到一個1024維的空間中,並通過一個兩層的前饋神經網路進行非線性變換。

為了得到最好的效果,作者最終又對三種方法的預測進行了集成

中規中矩,並沒有太大驚喜

本文據筆者了解,是Google在電子病歷建模分析方面的首篇文章,並且作者陣容十分豪華。文章寫得中規中矩,並沒有太多的驚喜。總結起來,我們可以從文章中看出如下一些值得關注的點。

第一, 數據規模十分有限。儘管作者利用了UCSF和UChicago的數據集,然而總共的病人數量也只有11萬。這與其他領域動輒上億的數據量有著天壤之別。在這種情況下如何有效的訓練出有很強推廣性的深度學習模型還是一個問號。在筆者之前的相關研究中,過擬合是一個很常見的問題。我們發現一些常用的神經網路中避免過擬合的方法(例如dropout),在這種情況下也不是特別有效。

第二,模型的互操作性很弱。文章一上來就提到,作者用FHIR標準來對電子病歷進行映射,而不必將電子病曆數據進行標準化和歸一化。說實話,這裡寫的確實讓筆者有點摸不著頭腦,在筆者看來作者只是用FHIR標準對電子病歷中的事件進行了歸類,該是什麼事件,還是什麼事件。這樣在一個數據上訓練出來的模型,在第二個數據上還是不能用。而作者也說了這是他們模型的一個局限性,文章中也是在UCSF和UChicago的數據集上分別訓練模型,分別評價結果好壞。那麼這樣的話,數據標準化就仍然是必要的關鍵步驟,不然如何保證模型的互操作性呢?

谷歌與全球頂級醫學院聯手,Jeff Dean等首篇電子病歷論文解讀

論文插圖:研究中,醫療數據經過處理後按照時間順序放置,這種處理並非將其統一或標準化,而是將其映射到合適的資源,深度學習模型進行預測時使用的都是相同的數據。

第三,效果提升並不是非常令人振奮。為什麼這麼說呢?AUC提升0.1,從絕對數值上來講確實是不小,但我們要看baseline,也就是跟誰比。從演算法的角度講,本文選取的baseline都很弱。當然這也無可厚非,因為這些baseline都是在實際臨床決策中採用的方法,它們大都是基於規則的,並且已被使用了很多年,而本文主要強調的是深度學習方法可能對現代醫學產生的影響,因而和它們比較。但是,從另一個角度講,非深度學習的機器學習方法有很多,文章要展示深度學習演算法的優勢,筆者認為也應該選取一些機器學習方法做為baseline。此外,這些臨床上使用的方法,前面提到的互操作性以及後面要提到的可解釋性都很強,而這也是深度學習方法的短板。

第四,模型的可解釋性很弱。文章作者也承認了這一點,並提出了一套歸因(Attribution)的方法來試圖解釋學習到的模型。然而正如作者所說,作者在做歸因的時候也只是基於一個模型(前饋神經網路)和一種類型的數據(例如只關注診斷或是藥物)。

第五,計算資源十分強大。作者在文章中提到模型的超參數是由Google Vizier自動調試所得,花費時間大於20萬GPU小時

電子病歷分析,任重道遠

當然,以上提出的這些點也是電子病曆數據分析的一些常見的挑戰,Google的這篇文章也再次印證了這些問題不是很容易輕易被解決,而這也為我們指明了要攻克的難關。還有一些挑戰,例如數據質量如何評估,數據隱私性如何保護等等,由於本文的關注點並不同,並未觸及這些問題。

當然,筆者非常高興看到Google也開始關注電子病曆數據分析,印證了這確實是一個有意義的方向。該文章是Google與這些頂級醫學院合作的第一篇文章,相信更深層次的研究和合作正在進行中,讓我們拭目以待。同時,按照本文的結構和寫法,筆者猜測文章應該是投向了某醫學類的頂刊,筆者也十分期待該文章的最終歸屬,因為這也從一定層面上能反映醫學界對這類研究的認可程度。

論文地址:https://arxiv.org/pdf/1801.07860.pdf

新智元AI技術+產業社群招募中,歡迎對AI技術+產業落地感興趣的同學,加小助手微信號: aiera2015_1 入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名-公司-職位;專業群審核較嚴,敬請諒解)。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

新智元被聘為首批中國人工智慧產業發展聯盟特約媒體之一

TAG:新智元 |