當前位置:
首頁 > 最新 > 中國精準醫療大數據現狀與挑戰

中國精準醫療大數據現狀與挑戰

更多資訊,敬請關注

前言

來自中國科學院計算技術研究所,國防科技大學計算機學院,北京中科晶雲有限公司,中國科學院生物物理研究所的研究者聯合撰寫了From big data to knowledgein precision medicine一文,闡述了精準醫療大數據發展的現狀與挑戰。文章發表在2月2日Science 推出的增刊Precision medicine and cancer immunology in China上,此前研究院已編譯過兩篇同期文章,分別為肝癌靶向治療:挑戰與機遇並存與中國肺癌的精準醫療、新臨床試驗設計和免疫治療,闡述了王紅陽院士團隊與吳一龍教授團隊對當前中國靶向治療與免疫治療的現狀分析與未來展望。

醫療和組學大數據爆炸性增長

由於收集了大量臨床、生物分子和健康數據,生物醫學領域正處於爆炸性增長時代。電子病歷系統在全球普及,便於採集和存儲大量臨床數據。這些數據包括篩查、診斷和治療結果,以及病史、家族史、生化檢測、影像和隨訪數據等。此外,從統稱為「組學」的基因組學、轉錄組學、蛋白質組學、表觀基因組學、代謝組學、宏基因組學和暴露組學中收集生物分子數據的先進技術,可在幾小時或幾天內提供結果,大大加快了臨床分析。多組學分子數據被廣泛應用於精準醫療及相關臨床應用領域,構成生物醫學領域增長最快的數據類型之一。可穿戴設備和智能手機也不斷收集大量與個人健康有關的日常生物數據。為成為探索疾病與健康奧秘的工具,這些多維數據必須擁有有效的存儲和分析方法。

中國精準醫療的大型隊列研究

隨著基因測序技術巨大進步,已在全球範圍內啟動精準醫療的項目,旨在提高篩選、診斷、干預和治療的精度。世界各地,尤其是美國、英國和中國的科學家,正在收集上百萬人的基因組數據,建立遺傳變異資料庫。2016年,中國科技部成立精準醫療研究重點專項項目(PMRSP),宣布到2030年前投資數十億元。作為這一工作的一部分,目前已展開3類大型隊列研究。首先是自然民族人口研究,對7個主要區域覆蓋中國24省4直轄市的數以百萬計參與者進行分析;第二項是對涉及心血管、腦血管、呼吸、代謝、神經、精神和免疫系統等疾病及7種常見惡性腫瘤的8項隊列研究,基本目標是從70萬人群中收集樣本;第三項是針對50種罕見疾病的臨床隊列研究,在單項隊列中收集超過50,000名患者樣本。此外,中國科學院(CAS)也宣布了精準醫療研究計劃,四年內將在4000名中國志願者中收集遺傳信息。

從大數據到信息知悉

對大數據的細緻分析,獲取準確信息並最終轉化為知識,有助於臨床決策和衛生管理(圖1)。為支持這一轉化,中國政府制定了一系列計劃,重點關注處理大數據所涉及的關鍵技術。由國務院發布的「十三五」國家科技創新計劃,將大力發展精準醫療技術,整合多層次知識資料庫,創建國家生物醫學大數據共享平台。PMRSP還啟動了一系列研究項目,著眼大數據整合、存儲、使用和共享等關鍵技術。該方案採取三個轉化步驟:數據—信息—知識。首先於2016年構建數據管理、處理系統和疾病資料庫等基本數據的基礎框架;2017年初,著手處理從PMRSP得到的原始數據,形成多層生物分子信息庫,協助整合患者臨床信息及其相關基因組、蛋白質組、代謝組和其它組學數據的詳細標準信息和元數據;2018年初,在前兩個階段結果開始進行知識挖掘,發現重要的遺傳疾病、關鍵突變位點和表觀遺傳信息。該項目將極大促進疾病精準診斷和治療的研究,引導精準醫療的發展。

圖1. 精準醫療中大數據的採集研究及應用

構建精準醫療大數據平台

醫療大數據的能量

醫療和組學大數據將數據轉化為知識,提高醫療質量和效率。有三方面最能描述大數據的潛在價值。首先,通過在複雜數據中發現隱藏的關聯和模式、闡明分子機制、揭示生物標誌物、識別疾病相關遺傳因子、評估治療效果,大數據能描述疾病的整個過程;其次,基因組和臨床數據相結合,可預測遺傳疾病風險、癌症發生和針對新疾病靶點的治療臨床效果;最後,大數據可通過個人健康監測設備每天收集到的動態多維數據、實時健康和疾病信息,幫助醫生給出預防疾病的個性化處方。

精準醫療中大數據面臨的挑戰

數據分享

為最大限度發揮大數據的作用,產生可再現結果,改進研究實踐,需要機構間開放和共享數據。PMRKSP要求臨床研究數據必須通過國家大數據中心無條件共享,但又有必要成立互惠互利聯盟,鼓勵科研機構和企業共享PMRKSP外生成的關鍵數據。

數據安全性和隱私性

未來,大數據平台將存儲人群大量多組學信息和電子醫療記錄。如果個人隱私不能得到保障,必然會產生倫理問題。為避免隱私糾紛,政府應制定強有力的數據保護法。此外,不披露個人信息的多方計算方法不可或缺。

數據生成和標準化

目前基於新一代測序(NGS)的臨床數據研究還缺乏對樣品採集、存儲、處理和分析的規範和標準,導致數據質量差、分析錯誤和結果誤讀。2016年,中國臨床腫瘤學會發布《二代測序技術應用於臨床腫瘤精準診治的共識》首版,促進NGS臨床檢測的標準化;次年,四川大學華西醫院和北京協和醫院的專家推出《臨床分子病理學實驗室二代基因測序檢測專家共識》。這些文件將大大加快NGS數據生成和解讀的標準化。但仍需要更翔實的行業標準確保精準醫療數據的可靠性和可重現性。

多維組學數據的整合

為彌補單一組學的不足,生成冗餘的多重組學數據很關鍵,它們能提取不同類型生物分子互作的信息。此外,通過納入非編碼DNA區域數據等擴大數據收集範圍,將進一步提高大數據分析的能力。

信息技術的深度整合

醫療大數據在存儲和計算方面提出了重大挑戰,迫切需要提供創新信息技術來解決問題。大數據知識挖掘的關鍵是信息網路的規模和複雜性的快速增長,已成為現有計算速度的瓶頸。最近,中國科技公司寒武智能提出了一個解決方案,通過使用稱為「深度學習」的專用處理器分析數據,提高計算速度。這表明,解決與醫療大數據處理相關的獨特問題,需要一系列尖端信息技術,可能需要在大數據平台中嵌入專用硬體和軟體。

精準醫療大數據未來趨勢

未來大數據技術將與人工智慧(AI)技術緊密結合,提高精準醫療的發展和應用。IBM沃森超級計算機的臨床應用表明,AI通過對大數據的集成和分析,能快速而準確地作出臨床決策。中國目前面臨著醫療資源不足、醫療系統結構不合理和醫療資源分布不均衡的問題,使得公民就醫困難重重,國務院在《深化醫藥衛生體制改革2016年重點工作任務》中已進行了深入闡述。為解決這些問題,政府正在制定診療和治療指南、加強基本服務,以求更好地為中國公民配置優質醫療資源。大數據構建的智能診療系統結合AI,將吸收專家經驗,有效提升基層服務的質量,解決中國醫療資源短缺的問題。

參考資料

From big data to knowledge in precision medicine


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!

TAG: |