死亡和數據科學:看機器學習如何改善臨終關懷
KenSci是一家為醫療行業開發機器學習風險預測平台的公司,該公司最近發表了一篇關於預測臨終死亡率並改善護理的論文。
這篇論文針對的是一個非常棘手的話題,對患者的最近六至十二個月內的死亡風險進行預測,它已經被人工智慧促進協會(Association for
the Advancement of Artificial
Intelligence)接受。處於危急關頭的是,在個人生命最後一年的護理花費了2050億美元。但這不僅僅是成本的問題。以下內容摘自《死亡與數據科學:預測生命的終結》(《Death vs. Data Science: Predicting End of Life》)這篇論文。
使用姑息治療服務的美國人的人數持續增長,估計已經有170萬人,即死亡人數的46%(NHPCO
2016)。然而,這些服務被利用得太晚了:2016年病患在臨終關懷醫院停留時間的中值只有23天。此外,28%的臨終關懷患者在入院後7天內出院或死亡(NHPCO
2016)。在Christakis及其同事的工作中,他們認為臨終關懷醫師覺得80-90天的臨終關懷護理最適合患者及其家屬的需求(Christakis
1997)。對死者家屬進行的調查表明,對臨終關懷的滿意度與他們對臨終關懷轉診及時性的看法相關(Teno等人的研究。2007)。最後,那些在那些經常遇到住院病人死亡的醫療機構中,緊急醫護人員和重症監護護士等醫護人員的職業倦怠比例非常高(Embriaco
等人的研究。2007)。因此,最終得出的結論是,及時和適當的臨終關懷護理會影響Quadruple
Aim醫療保健的所有方面(質量、滿意度、成本節約和提供者滿意度)。
我們正在組織一系列關於數據科學家及其使用的方法的文章,作為這個系列的一部分,我們「抓住了」KenSci的首席技術官及該論文的作者之一——Ankur Teredesai,這篇論文在這個新興的技術類別中得到了認可。
你用什麼數據集來建模?
預測六至十二個月內的死亡率風險是一項非常複雜的挑戰。在美國,這是一個價值2050億美元的問題。在KenSci,我們有一個旨在提高機器學習的規模和運營效率的平台,以解決諸如此類有巨大社會影響的問題。在這個特定的環境中,我們已經有了根據以前的努力預測六至十二個月內死亡率的機器學習模型。我們與美國西北部的兩家主要的醫療系統進行了合作,並重新訓練了我們的模型,並且用新數據創建了更多的模型。
來自Health System A的數據包含的是患有心力衰竭(HF)病史的患者群體,其中包括4,888名病患,以及他們的各種電子病曆數據,這些數據包括:
人口統計學上的特徵
病人停留的時間長度
總體成本相關特徵
具體的費用相關特徵(住院病人、門診病人、家庭健康、臨終關懷、熟練護理機構)的再入院信息
通過醫療保健通用程序編碼系統(Healthcare Common Procedure Coding System,包括救護車、醫療設備和假肢等)對所執行的程序進行跟蹤
Health System B的數據包含了48,365名患者,這些患者患有各種類型的疾病。Health System B只有醫療索賠數據可用。
這篇論文詳細介紹了用於建模的數據元素。
大數據技術如何應用於你的研究?這項工作缺少了哪些夢想中的數據集?
我們使用了微軟的Azure雲來運行一些底層組件。我們還與現有的企業大數據投資無縫集成,以確保醫療保健行業可以從大量數據源中受益。
KenSci與世界各地的醫療保健合作夥伴進行了合作,收集了從EMR(電子醫療記錄)、社會心理學數據到醫療索賠和財務信息等各種數據集,從而實現了對患者和整個醫院人口狀況的縱向觀察。該系統基於雲,因此可以在新的數據源可用時連接到這些數據源。
對六至十二個月的死亡率進行預測,並根據據此獲得的見解幫助醫生將患者轉為姑息治療,在這種情況下的預測是一項非常複雜的工作。諸如人口統計學和共病的數據提供了良好的結果,但諸如醫生輸入或處方中的變化之類的額外數據源經常也可以提供額外的信息。歸根結底,機器學習中從未有過一個理想的「夢想中的」數據集。EMR中包含的關於一個患者的信息傾向於少於10%。在日益聯繫的世界中,我們將繼續生成額外的數據資產,從而增加數據驅動型決策的複雜性。機器學習的優勢在於能夠逐步學習,並通過更多的數據和反饋進行改進。
你是如何建立這個模型的?在建立它的過程中,人類輸入起到了什麼作用?
我們在腦海中建立了具有輔助智能的模型。我們在KenSci開發的每一種模型都建立在這樣的理念之上:人的輸入將成為提供護理的每一個步驟的關鍵因素。KenSci機器學習(ML)平台有利於可解釋的機器學習模型,這些模型可以解釋其正確性並進行驗證,然後KenSci的醫生和臨床醫生不僅僅會驗證機器學習模型的輸出,還會幫助確定臨床工作流中的輸入特徵,然後再將其集成到任何工具中。整個過程非常嚴格,我們一直在尋找方法使其更具輔助性,同時還要保持嚴謹。
這個話題是一個非常敏感的話題,對於用演算法決定護理的做法自然會引發種種擔憂。什麼方法最適合用來決定在臨終護理過程中應該採取哪些護理措施呢?
在KenSci,我們致力於通過提高醫院和護理人員的效率來提高患者治療結果的質量。使用人工智慧演算法可以提供誰可能會生病、如何生病、何時生病,以及在整個護理持續過程中如何有效地服務患者方面的見解。雖然人工智慧仍然是醫療保健的新丁,但它的智能可以被看護人和醫院系統用來提高效率。醫生永遠是決策者,演算法不會介入醫生和患者之間的關係。廣義的智能是我們需要使用的一種工具,但是當涉及到醫療保健和臨終問題的時候,決定權在醫生和患者手中。
在KenSci,我們將人工智慧視為輔助智能,即它旨在幫助正在使用該技術的專家,而不是要替代他們。這也適用於這裡討論的臨終關懷轉變的問題。這些模型旨在幫助醫生注意到可能疏忽掉的屬性,因為機器學習可以在分層中注意大量變數,因此人工智慧可以提供額外的知識以做出更明智的決定。
如果沒有EHRs,這項研究是否可能?您如何處理醫療系統中尚未結構化的數據(即紙張上的數據或者是更糟糕的一些數據)?
EHR數據是必要的,但不足以在醫療領域中產生深刻的見解和預測。儘管非結構化數據可以為預測模型增加有用的附加信息,但即使是醫療系統內一些簡單的問題也仍未得到解決,因為即使是結構化的數據也還沒有發揮它們全部的作用。結構化數據提供了足夠的豐富性來提供描述性統計數據,並為再入院風險、死亡率預測、急診部門利用率預測等問題提供足夠好的預測模型。然而,EHR和其他結構化數據尚未發揮的其最大潛力。
這些預測從本質上來說是因人而異的,既然如此,你是如何在宏觀層面上處理像成本節約這樣的話題的呢?
儘管臨終關懷本質上是個性化的,但預測高成本患者隊列並確定導致高成本和高利用率的模式對醫院和衛生系統來說是至關重要的。KenSci的解決方案可以通過分析縱向的醫療記錄來幫助確定高成本人群,通過對疾病進行建模並預測生命終點來提高姑息治療的利用率,從而預測未來高用量人群。
然而,一個像這樣的系統可以做的可不僅僅提供生命終點預測這麼簡單——它還可以讓醫護人員探索患者的風險狀況,並且預測潛在的再入院可能。雖然降低成本對於醫療系統顯然極具吸引力,但是這樣的系統也能夠在各個領域中為患者提供更好的護理。在各種情況下,機器學習系統可以幫助減少醫生的職業倦怠,協助人員配置並提示出可能需要進行醫療干預的患者。從機器學習系統中獲得的見解可以幫助看護者就客戶對於臨終關懷的願望與其進行知情程度更高、更為積極主動的交流。
※麥肯錫:使用人工智慧技術的五大障礙
※哈佛研發出蛇形柔性機器人,複雜地面無腳行走關鍵在「人工皮膚」
TAG:科技行者 |