當前位置:
首頁 > 最新 > 閉關4年,投入8億資金,500位頂級數據科學家完成了一個「臟活兒」

閉關4年,投入8億資金,500位頂級數據科學家完成了一個「臟活兒」

許多人有所不知,國內現有的信息化系統已經超過4000個,平均每家醫院使用的超過100個,這些系統對數據的結構和表達存在很大差異,這其中有超過半數數據是自然語言的文本,而每家醫院的科室甚至醫生對信息的書寫方式都可能不同,這種極度複雜性讓計算機無法理解數據且進行計算。

如果換成人工執行,500人終其一生也無法處理數十億的病歷。

但是有這麼一家公司,確實做到了。經過4年的不懈努力、8億元的巨額投入,500位科學家的執著,縱深大量疾病研究,「在泥濘中砥礪前行,打造未來數字醫療的基礎設施」,最終獲得了近百家中國頂級醫療研究機構(排名前150)和政府機構的信任。這家公司就是醫渡雲。

「20人、8億元、12億份、2000萬個」

2013年,醫渡雲成立了一支20人的團隊。他們憑著一股「以可用數據作為基礎的新型醫療才是未來」的信念,花了近4年時間、8億資金只做一件事:埋首於醫療大數據、人工智慧基礎平台研發。

至今,他們協助醫療機構完成超過12億餘份病歷資料的數字化與數據化處理,從中建立超過2000多萬個診斷名的標準化,這意味著每天的病歷處理數量高達70萬份、每天至少需建立超過1.5萬個標準化診斷名。國內排名前150家醫院中三分之二是它的合作客戶。今年,他們還將與10個省市政府機構,合作建立起區域化醫療數據平台。

「20人、8億元、12億筆、2000萬個」,這些數字,代表著一家中國原創公司的崛起。或許這些數字在大多數人眼中並不特別,但正是這些數字背後的力量在推動中國醫療改革,用數據人工智慧改善民生。

醫渡雲正在改變中國醫療行業的樣貌。

這一波人工智慧的復興,在中國出現了許多贏得巨額融資的初創公司,沒有鎂光燈照射的醫渡雲在公眾界顯得有點「默默無名」。儘管獲得大型投資機構投資,從技術開發、落地、到串起產學研三大環節,早已超過獨角獸的身價,但他們從未對外公布。

而且,他們所做事情的起點,實際上也是整個醫療過程中相當辛苦的部分--把原始數據變成可用數據,即「大數據的基礎處理」。

「醫療這件事,大家都想做,比如說挂號、幫你找專家等,我不否認他們的價值,但最最基礎的工作,把原始數據變成可用數據這種『臟活』,沒人願意做」醫渡雲創始人宮如璟開玩笑的說。但事實的確如此,建立基礎的活最難做,就像蓋房子打地基一樣,因此很少有初創公司會像醫渡雲一樣選擇切入技術門檻很高的基礎系統。

他們為中國醫療體系打「地基」的進展如何呢?醫渡雲處理病曆數累計12億餘份,整理出2000多萬個診斷名。能把分散的、非結構、非標準化的數據自動轉化成標準可用的,而且聚集起來,這就是醫渡雲的技術本事。

有了這個一致化的數據集後,基礎架構平台可以發揮效用的空間就被徹底打開了。

敢啃「硬骨頭」,才能構建起龐大規模平台

在諸多公司里,大多數是選定一、兩個領域切入,鮮少看到一家公司像醫渡雲一樣,戰線拉得這麼遠:開發的「醫學數據智能平台」(DPAP)涵蓋從基礎科研、臨床系統、醫院管理系統,再到跨院跨區的合作共享,但卻又能全盤統籌、協作有秩,而非「PPT造車」式的紙上談兵。

在數據領域產生質的突破,才能解密整個產業鏈。這也是產業鏈中最「硬」的骨頭。原因除了重視隱私保護的行業特性,使得對科技的評估、導入相對較慢之外,很多數據是屬於非結構化甚至醫生個性化的自然語言文本,例如醫生主觀撰寫的病歷、巡診紀錄,而且信息散落院內各部門,也導致了數據運用之難。

要突破這個瓶頸,第一件事就是得有一個基礎設施平台,接著再讓平台上長出各種智能模塊,並且能與醫院現有的系統對接。

因此,醫渡雲用三年半的時間專註開發出一個整合性極強的醫療數據處理系統,能把原始零散的不可計算數據變成高質量可計算可應用數據,平台上聚集了大量知識圖譜、300種以上的智能處理模塊以及二十餘種專病庫。

這件事有多難?醫渡雲首席技術官(CTO)徐濟銘舉了一個具體的例子,同一個疾病,每位醫生的寫法可能都不同,例如「二型糖尿病」的「二」,有人寫漢字、阿拉伯數字等,還有人會寫糖尿病二型、或是Type2Diabetes,這還只是最簡單的一種,很多拗口的疾病有更多複雜的寫法,儘管在醫療診斷里有所謂的國際疾病分類編碼標準(ICD),不過也才2萬多種,不足以應付實際情形的發展。

想要解決這個問題,就必須讓機器看懂不同說法其實都是指同一種疾病。而這個問題還只是DPAP平台上數不清的問題中的一個「小」問題,解決它都需要計算機對自然語言中詞語的結構和語義有深刻的理解才能做得到。

而醫渡雲開發的基礎平台可以把過去分散的、來自不同廠商的數據等,快速轉變為標準化,而且符合CFDA和美國食品藥物監督管理局(FDA)認可的數據。

300個模塊功能背後的超長戰線

醫渡雲的四位創始人不斷提及的一個理念就是:「改善人類與疾病的關係」,但具體要如何「改善」?這個重任實際上就落到了他們的醫療大數據平台上。

真正制約醫療大數據發揮價值的主要瓶頸,在於數據平台從集成到處理,再到應用這三個維度的能力。這就意味著,僅僅將數據從不可用變為可用,只是醫渡雲使命的起點,如何在可用數據的基礎上構建出相應的應用,同樣是至關重要的一個環節。

如今,在數據智能驅動下,其核心基礎「醫學數據智能平台」已經搭載了300多個應用模塊,貫穿整個醫療過程。

例如在臨床輔助診療上,結構化數據按照不同的功能模塊呈現,準確反映每個患者在其整個治療周期中的病情進展,DPAP通過對散落的數據整合,構建患者的時間軸模塊,以診療事件時間為主線,完成疾病數據建模;從疾病的角度來看,DPAP還能夠提供疾病數據模型。而無論是疾病數據模型,還是患者診療模型,這都是臨床科研、路徑挖掘、療效評價、輔助診斷應用的基礎。

根據國際國內醫學標準,目前醫渡雲已經完成了對不少疾病的不同核心信息的整合和識別,構建出25個大病種、3000多個疾病的模型,而這個成果數字還在不斷擴大。

目前,支撐醫渡雲所擁有的300多個功能模塊的技術,涵蓋了近年來頗為關鍵的基礎演算法和人工智慧技術,涉及到醫學自然語言處理、醫學影像處理、醫學知識圖譜構建、醫療大數據挖掘、大規模(深度)機器學習模型及應用等,這其中有多個項目,更是目前全球學術研究發展的熱點所在。

爬過15座山之後迎來質變

系統開發完成後,新的挑戰就是落地。醫渡雲在2017年開始將產品推向商業化,現在國內排名前150的醫院有超過三分之二成了它的客戶。

「究竟是怎麼辦到的?」得到的答案很誠實且很誠懇,「就是慢慢做,第一家是最難的,花了1年2個月才上線,前15家幾乎沒有網路效應,產能上不去,很痛苦,」宮如璟回憶說。

醫渡雲在2013年成立時,儘管行業能接受這種大數據、AI創新的理念,但部分醫院的策略仍偏保守,更大程度上是出於與商業公司進行數據合作在數據安全性與合規性上的擔心和不安。醫渡雲的數據安全技術、數據合規保障機制一步步被醫院感知,這一瓶頸才被打破。

就這樣,醫渡雲的應用產品一步一步吸引了許多專家、醫院,磁吸效應逐漸產生,而且「機器」看多了、學多了,系統就變得更聰明。例如中山大學附屬腫瘤醫院攜手醫渡雲進行大數據戰略合作,並在業內知名的《柳葉刀》(TheLancet)期刊上發表了與鼻咽癌相關的論文。目前雙方在鼻咽癌、結直腸癌和肺癌等方面都有科研合作。

「在跨越了15家客戶後,平台網路的價值快速擴大,量變產生質變」。現在醫渡雲已處理醫院10幾年的數據,完全不用人工,最快兩周就可以完工上線。

醫療行業是一個門檻很高的行業,再加上科技巨頭、初創公司全都聚集於此,競爭更加激烈,但宮如璟毫不畏懼,她的信心來源很簡單也很困難,就是團隊的技術實力。

宮如璟在英國求學期間蟬聯了五年全英數學冠軍,在華爾街投行14年的歷練;CEO孫喆曾聯合創立北京惠旭金信,主要關注醫療行業投資,在醫療行業有豐富的投資和經營實踐經驗。

CTO徐濟銘則是中國科學院研究生院計算機應用專業碩士,曾負責百度搜索服務團隊、框計算團隊等核心技術團隊,也曾獲選百度最有價值員工。首席戰略官(CSO)何直,早先曾是阿里巴巴集團產品總監,領導了天貓大數據平台建設,在連續創業的歷程中,先後創立了專攻大數據挖掘的精準營銷軟體及服務的杭州數雲信息等四家公司。

宮如璟笑著說,現任首席數據科學家彭濤,「還是當時跟今日頭條搶的,他加入的原因是他覺得我們的東西更難,有挑戰」。很多員工都是基於想要一起改變中國醫療現狀的這股熱情而加入。

去年底,醫渡雲找來了前微軟亞洲研究院資深研究經理,專攻自然語言處理與知識工程研究的閆峻,出任首席人工智慧科學家,並且延攬了美國斯坦福大學統計系教授王永雄,擔任首席數據科學顧問,強化了這家學霸公司的陣容。

隨著業務快速增長,團隊人數過去幾年都是翻倍的增長,到了今年底預計會達到800餘人,其中研發團隊佔比高達60%以上,大部分都是來自全球/國內的知名互聯網公司和頂尖實驗室;還有20%的團隊是完全專註在醫學領域,因此整家公司有高達80%以上的人力資源都是在做醫療領域研發。

跨區整合,數據智能輻射至藥物研發和醫保

在與醫療機構的順利合作之後,醫渡雲將目光放得更遠。孫喆透露,建立跨區的數據中心將是今年的工作重點,預計建立10個左右省級層面的區域醫療數據中心。

醫療數據中心會把當地的三甲醫院、二級、三級醫院的數據通通集中到這個區域的雲平台上,因為跨院數據的集中共享,幫助患者能夠建立起一個完整的患者健康檔案,患者不必帶著病歷到處跑,醫院之間也能有效的為患者做全面的健康類服務。

對於藥物研發的效益,醫渡雲希望推動醫院和醫院之間的聯合。例如每一家醫院現在都有自己的新葯研發基地,當製藥企業某個新葯研發項目聯合區域的時候,承接能力會變得更強,將會加快新葯上市。「同時也可對政府提供整個公共決策的支撐」孫喆強調。

去年,醫渡雲與重慶醫科大學聯合共建了重慶醫科大學醫渡雲醫學數據研究院,成為國家首個醫學數據二級學院。一同與國家食品藥品監督管理總局(CFDA)展開了藥品不良反應的合作,基於整個重慶區域人群分析基礎之上,有效分析出該區域的藥品使用情況、具有重慶特殊性的不良反應等,這就是區域平台的龐大效能。

通過這樣的合作,除了了解中國藥品不良反應的發生情況,還有一個很大的意義在於拉動製藥產業,以及建立一個聚集產管學研力量的優質監測機制。

由此可見,醫渡雲的服務已經從最初只面向醫療機構,走到了區域平台、輔助公共決策的層次上。

不久前,醫渡雲也與南京醫科大學簽約,作為合作夥伴承建江蘇省轉化研究院國家級新葯創製項目的信息平台,致力於「讓藥品的研發必須朝品質更好、更安全、更便宜」。

除了臨床試驗外,新葯上市後的不良反應監管一直也是業界的難題。

傳統模式下,這種監管依賴於醫生的主動上報,或者企業需要調動非常多的人力資源,在新葯上市後去醫院採集相關的信息。整個過程高度容易產生錯誤、疏漏。為了解決這個問題,醫渡雲承接了重慶醫科大學和CFDA不良反應管理中心的專項課題,研發基於大數據和演算法的智能監察系統。

而制約醫療行業變革的另一個核心因素則是醫保的管理。只有醫保作為支付方能更加科學的去評估一個疾病的支付方式和定價,才能從根本上幫助整個醫療市場形成良性循環。

近期,醫渡雲即將宣布與清華大學自動化系合作建立智慧醫療自主系統聯合研究中心,針對醫保領域的應用從理論和方法上進一步深入創新。未來面向醫保的應用不論是核心技術或系統架構設計將會不停向上升級。

醫渡雲現在正在做的,就是幫助醫療產業和外部產業融合。近日,醫渡雲與人民健康在醫療大數據領域在推動醫療創新產業發展、共同搭建人民健康雲平台、醫療數據質量評價體系研究與評價標準制定等方面開展廣泛合作,在醫療健康服務創新領域開展積極探索,助力「健康中國」戰略實施和「國家大數據戰略」落地。這不僅牽涉到14億人的健康,如果發展得順利,還可以為全人類做出貢獻。畢竟,互聯網+醫療健康已經成為中國醫療行業變革的重要舉措,醫渡雲將披荊斬棘、砥礪前行。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 最新聞 的精彩文章:

互聯網金融投資成熱潮 浣熊理財平台受歡迎

TAG:最新聞 |