當前位置:
首頁 > 最新 > 薛萬國:醫療大數據應用的核心是服務能力建設

薛萬國:醫療大數據應用的核心是服務能力建設

導讀

醫療大數據服務是一項高層次服務,需要對醫院自身需求和信息化流程極為熟悉,難以通過外包形式長期持續發展。

醫療大數據的本質是服務

醫療大數據應用的本質是一項服務,這與傳統的信息化應用有所不同,它不是一項或幾項系統應用。以下是兩個醫療大數據應用場景實例。

一是病歷檢索。比如醫生希望查找「腫瘤化療後白細胞下降的患者」,或「30天內二次住院的患者」,而原有的病歷檢索系統功能很難直接支持這些比較複雜的檢索條件,需要技術人員通過SQL來人工檢索。即使建立了自動化的數據檢索系統,但在真正面對大數據應用時也總是難免「掛一漏萬」,通常需要人工檢索服務。

二是數據分析。比如「65歲以上老年人患兩種以上疾病的排名前三的共病組合」或「老年下肢關節手術全麻/非全麻與術後肺部感染的相關性研究」的數據分析過程,從數據的抽取、整合到分析都需要IT技術和數據分析人員人工完成,特別是需要對業務數據十分熟悉。這說明醫療數據分析是一個不能自動化的個案服務過程,無法通過一個系統幫助用戶直接完成。

因此,在現階段,人工處理是醫療大數據應用最主要的工作,SQL 是最簡單有效的處理工具。

在整個大數據分析的流程里,通常包括這樣幾個階段,依次為:數據抽取、數據整合、數據清洗、格式轉換、數據分析以及結果呈現。其中,90%的工作量是在準備數據,10%的工作量才是做數據分析,準備數據需要人工處理,數據分析所用的建模工具同樣也屬於人工處理。

根據不同類型大數據分析的技術特徵,通常可把大數據分析分成四個層次:第一階段也是最低層次是描述型分析,通常需要報表、BI工具;第二階段是診斷型分析,主要通過相關性分析、數據挖掘來完成;第三階段是預測型分析,根據既往歷史數據來預測未來,通常用到機器學習模型、建模分析;第四階段是指導型分析,即在預測型分析的基礎上進一步給出如何行動的指導,需要人工智慧、機器學習等技術。其中,除第一類可藉助自動化報表工具實現半自動分析外,後三種類型是大數據相對高階段分析,需要專業分析人員通過人工分析的方式解決問題。

綜上所述,開展醫療大數據應用是一項多學科融合的技術服務,其本質是一項服務。與相對規律、低層次的信息化的運維服務相比,醫療大數據服務是一項高層次服務,需要對醫院自身需求和信息化流程極為熟悉,難以通過外包形式長期持續發展。因此,做好醫療大數據應用的關鍵是醫院要具備自己的服務能力。很難想像醫療大數據應用可以委託給某個公司長期提供創新式服務,至少現在還沒有這種模式。


醫院開展醫療大數據應用至少需要六個方面能力,包括提出問題的能力、數據資源能力、數據平台能力、數據處理能力、數據分析能力、數據治理能力。這六個能力又可分為四個層面:一是提出問題能力,這是需方能力,可通過示範應用、培訓、設置課題來激發臨床人員的創造性;二是數據資源能力和數據平台能力,這是基礎支撐能力;三是數據處理能力和數據分析能力,這是核心服務能力,也是供方能力;四是數據治理能力,是為保障大數據應用所需的管理保障能力。

如何做好大數據服務能力建設?大數據核心服務能力是人工服務能力,第一步就是要做好團隊建設。大數據利用需多學科技術人才協同完成,服務過程至少需要三類人才:

第一類是信息技術人員,主要職責是數據抽取、整合、預處理,數據資源管理、授權,數據平台管理等與IT緊密相關的工作,通常所需的技能包括SQL、傳統及大數據技術平台管理、深度學習框架等基本技能。同時,除純技術人員外,還需要部分人員對業務信息系統及數據流程非常熟悉。

第二類是數據分析人員,主要職責是提供各種類型數據分析、建模、撰寫研究報告等,需要掌握數理統計方法、機器學習演算法(數據挖掘演算法)、R、SQL、Python 、深度學習框架等技能。同時,還需要流行病學與公共衛生統計人員方面專業人才,對整個統計分析提供指導。

第三類是生物信息人員,主要職責是提供組學數據處理分析,技能包括掌握各類開源的組學處理分析工具。


人才是硬條件,除了團隊建設外,對於大數據中心來講,還要有軟條件,就是服務流程的建設。要建立一個規範化服務工作流程對服務進行管理。主要包含三個部分內容:

首先是建立規範化的服務工作流程,依次是需求描述、分析方案設計、數據抽取、數據清洗和預處理、數據分析、形成報告等步驟;其次是建立服務質量保證機制,數據分析方案、分析過程、最終報告需經過技術評審;再次是建立多學科人員協同工作模式,要有縱、橫結合的工作模式,多專業人員的討論機制。在此過程中,臨床人員充分參與溝通,必要時諮詢病案等領域專家。

在數據利用平台方面,醫療大數據有其特殊性,具有「小」數據多、「大」數據少以及結構化、自有文本、醫學影像、組學數據並存等特點。因此,傳統資料庫往往更為簡便成熟,技術生態也更完善,在整個平台建設中,更適宜傳統技術平台+大數據平台的混合架構,並不需要統一的一體化平台。

其中,小規模結構化數據的處理與分析可採用傳統架構來處理,結構化數據的自由檢索沒有索引,可採用列資料庫並行演算法來支持,對於自由文本檢索,可採用ES集群或Hadoop集群。同時,需面向技術人員提供各類工具支持,包括數據抽取、去隱私、結構化特徵提取、統計建模工具等。

此外,數據治理十分重要。醫院信息化已經開始由傳統的IT治理向數據治理髮展。IT治理關注的重點是圍繞信息系統應用來展開,如何最大程度地發揮信息系統的作用,怎樣配合實現醫院戰略目標是傳統IT治理所強調的內容,其關注點是IT應用。在大數據時代,數據被當做資源看待,數據治理關注的重點是數據資源管理與應用,主要內容包括對數據資源整合、數據利用、數據質量、數據權益、數據安全等方面的職責與管理體系做出明確規定,以最大程度發揮數據資源的作用。

數據治理能力是醫療大數據應用能力的重要構成,是開展醫療大數據服務、提高數據質量的重要管理和保障措施,可保證數據資源的集中統一管理,避免分散割據和人為壁壘,保護數據安全。同時,還可為醫療數據質量提供管理保障,以提高數據質量為目標來持續改進信息化應用。

目前,解放軍總醫院國家醫療大數據工程實驗室在如下幾個領域開展了一些應用研究。

一是針對胃癌患者生存分析的研究。基於包含1749例隨訪患者的1937個胃癌專病病例數據,根據病理分型、胃癌不同部位、不同分期或不同手術方法等對不同人群生存期進行分析比較,實現對某一類患者生存期的預測。

二是開發出針對二型糖尿病用藥智能推薦模型。基於2萬多例糖尿病病例和機器學習模型,針對患者用藥模式六分類,建立了一個預測模型,目前準確率達到72%。

三是PCI術後MACE預測模型分析,依據2萬人臨床與隨訪數據對PCI術後MACE進行預測分析,以此實現評價六種主流機器學習的方法。

四是合作開發肝臟腫瘤影像識別系統,目前進行肝臟分割的準確率達到95%,在此基礎上,下一步將進行腫瘤部位標註和腫瘤識別。

五是針對皮膚病理圖像識別研究,惡性皮膚黑素瘤識別率達到90%。

六是在組學數據分析領域,一方面是腦膠質瘤,基於TCGA和NCBI數據,發現可用於精準分型的甲基化Panel;另一方面是急性髓系白血病,基於實際病例的基因數據篩選,發現一個耐葯標識基因。

七是臨床智能輸血決策系統,基於8萬例輸血病例,建立紅細胞輸注量個性化預測評估模型,準確率接近90%,已將該模型嵌入醫生工作站,實現醫生輸血申請的智能化管控。

同時積極探索數據開放共享。2017年,解放軍總醫院主辦了急診大數據分析大賽,在急救醫學資料庫中整合2.3萬人次的急救數據,去隱私後開放利用,從全國24個申報項目中篩選出11個單位13支代表隊,自擬題目,自定方案,在兩天開放時間內做出結果。現場氣氛非常熱烈,最後成果大家也是非常滿意,效果超出預期。通過這樣的活動,倡導了數據開放利用的理念。

通過這些例子,我們也能進一步看到,大數據在醫院的應用,根本上來講,需要提升自身的服務能力。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 HIT專家網news 的精彩文章:

心醫國際CEO邰從越:著力探索分級診療的可持續運營服務

TAG:HIT專家網news |