當前位置:
首頁 > 最新 > 50萬獎金終有歸屬!天池醫療AI大賽背後的產業邏輯究竟是什麼?

50萬獎金終有歸屬!天池醫療AI大賽背後的產業邏輯究竟是什麼?

10月11日,雲棲大會的前一天,杭州阿里雲基地內,一位國內高校的參賽者,正在演講台上神情嚴肅地進行最後的項目演講。耗時半年,天池醫療大賽終將在這一天決出贏家。50萬獎金池,也將迎來最終的歸屬。

作為國內首個醫療AI大賽,天池大賽獲得了多個行業第一,包括世界最多的參賽隊伍(2887個)和最大的數據集(超過2000份標註後的CT)。

這場大賽,吸引的團隊除了北京大學、浙江大學、上海交通大學、早稻田大學等國內外知名高校,還不乏國內知名企業的隊伍,如點內科技、宜遠智能、聯氪雲影、掌中全景、百納(武漢)信息等。

究竟這場大賽有著怎樣深刻的意義,對於主辦方的三家企業(阿里雲、英特爾、零氪科技)來說,各自的想法又是什麼?帶著這些疑問,動脈網對這次大會的各方進行了一番採訪調查。

這場大賽的意義在哪兒?

「我們把這件事叫做『開球』。一場體育競賽,開球的動作非常重要。在中國提供一個全球領先的影像診斷數據級演算法、運算平台非常具有意義。」這是決賽賽場,零氪科技CEO張天澤的開場白。

按照他的的觀點,影像數據只是醫療數據中的一個很小的類別,目前,影像AI大致可以分為三個階段:

1、檢出病灶5-10毫米(需要大量統一標準和質控的醫生標註的影像病例)

2、鑒別病灶良惡性及病灶分型分期(需要大量的含有準確病理結果並標註精準的影像病例支撐)

3、腫瘤病人治療方案優化推薦及預後評估(不僅需要大量的含有病理結果及精準標註的影像資料,同時還需要病人的治療、手術、用藥、隨訪等連貫的病例數據作為支撐,且不斷進行更新)

利用人工智慧檢測出肺結節,僅僅是影像中特徵的提取階段。而結節的良惡性、分期以及治療方案是什麼,這些都是人工智慧下一步需要實現的功能。

這需要更多的數據幫助系統進行判斷,包括患者的檢驗檢查、CT、內鏡等數據。根據不同患者不同的併發症,將影像報告、病理報告和患者後續手術的配套用藥以及後續存活等數據串聯起來,人工智慧才能得出個性化的治療方案、周期以及存在的風險。

也只有這樣,人工智慧才有機會真正成為臨床應用。

張天澤認為:「毫無疑問,這是實現安全可控的大數據交易模式的一次成功試驗。天池平台為圖像、聲音等敏感數據的擁有者和深度學習技術的開發者搭建了跨界協同的橋樑,為未來將此類合作演進成為一種新型的商業化數據交易模式提供了技術和經驗的參考。」

阿里雲提供了什麼樣的雲計算服務?

據阿里雲天池技術平台項目經理之毓介紹,數據、演算法、計算力是人工智慧的核心三要素,在本次大賽中,阿里雲平台將這三者有效結合在了一起。

該平台包括基礎設施層、飛天分散式雲操作系統層、雲和大數據層三層架構,雲和大數據層由阿里雲自主研發的雲計算產品(ECS,NAS,SLB,VPC)以及大數據產品(ODPS,PAI)構成。

「阿里雲就像是搭建了一個舞台,參賽選手可以盡情的釋放在醫療影像演算法方面的才能,讓數據在雲中飛舞。 」

醫療行業的數據敏感性是一大難題,安全性永遠是醫院關心的首要問題。本次天池大賽,阿里雲團隊專門開發了一個數據安全「籠子」,經過「籠子」的清洗與禁錮,可以把影像數據中的敏感數據過濾掉,並保證它們不會被泄露。

之毓繼續談道,「一開始,阿里雲認為80%的團隊都會使用2D方案,只有20%的團隊會使用3D的方案。結果我們發現,有90%甚至95%的團隊都用的3D方案。」

阿里雲飛天的PAI基於強大的線性擴展能力,提供了針對3D的解決方案。參賽隊伍可以每次迭代中高速處理32張以上128x128x128甚至更大規模的3D圖片,提升結節檢測精度和效果。

英特爾提供了什麼樣的算力?

對於算力,英特爾雲計算事業部人工智慧資深專家胡瀟舉了一個形象的例子:「如果將雲平台比作土地,土地要長好莊稼,不僅土地要肥沃,而且還要有趁手的耕地工具。所以,英特爾一方面為天池雲平台這塊『土地』配備了英特爾至強融核高性能計算集群,另一方面還提供了專門的『耕地工具』,名為天池定製版Caffe框架。」

首先,關於高性能計算平台,胡瀟認為:「平台的『算力』不僅僅是單純的計算能力。用於醫學影像分析的AI模型同其他一般的深度學習模型相比有一個很大的不同。儘管其模型本身的規模並不是太大,但是在訓練時常常需要一次性處理很大規模的多維圖像數據,因而在傳統的GPU架構上極易超越顯存的容量。所以,對於這些醫療AI應用而言,『算力』不僅僅指高計算能力,還要求有高存儲能力。如今,醫療AI行業以及其他具有類似多維圖像數據分析需求的相關行業,大內存架構的重要性已越來越成為共識。」

本屆大賽採用的第二代英特爾至強融核處理器作為深度學習計算引擎,配備了192GB(最高可達384GB)的超大內存,正是為了滿足當前醫療AI對大規模3D神經網路的需求。

而關於深度學習框架軟體,胡瀟介紹,公版Caffe框架由於抽象級別較高,可以比喻為所使用的耕地工具不是待組裝的零件,而是組裝好的「拖拉機」,因而具有性能較高的優點,但也造成靈活性較差的局限。

並且,公版Caffe框架基本上不支持3D神經網路功能。因此考慮到參賽者對醫療演算法都有很多定製化的需求,尤其是對各種3D神經網路操作的需求,英特爾又貢獻了近35000行代碼,推出了天池定製版Caffe。

它包含各種3D神經網路操作在內的43項超新功能。是英特爾專門為此次大賽定製的新型「拖拉機」,極大保障了選手在天池平台上耕耘創新的靈活性。

零氪科技提供了什麼樣的數據?

任何AI技術的基礎都是高質量、大規模的結構化數據集,而醫療領域恰恰缺乏這一條件。作為本次大賽的主辦方之一,零氪科技提供了目前全球最大規模的「科研級胸部CT數據集」。

本次大賽的原始數據包括影像數據的搜集、脫敏、轉化、統一化的工作。

賽前,零氪科技與16家全國知名三甲醫院專家進行了溝通合作,並組建了以素有「東方神眼」之稱的復旦大學附屬華東醫院張國楨教授和北京大學腫瘤醫院影像科唐磊教授等為代表的數十人的中國頂尖影像專家指導團,讓他們在後續的數據接入、脫敏、標註等環節提供醫學影像支持。從而確保參賽選手拿到的數據是最頂尖、最精確的數據。

正是這16家合作醫院和這個數十人的中國頂尖影像專家指導團,合作提供了2000多份經過安全脫敏處理和精準標註的胸部CT掃描科研級數據集。

據零氪科技CTO羅立剛透露,這2000多份數據集的投入至少在百萬以上。

「如此大的數據量絕對是全世界所有醫療AI比賽前所未有的,可以毫不誇張地講,這是全世界最大規模的肺部薄層CT數據集。」零氪科技CTO羅立剛表示。

在數據的搜集過程中,零氪科技專門開發了定製版數據採集系統。同時針對不同的醫院的影像工作站廠商,分別定製開發了專用自動脫敏工具,把CT的敏感信息去掉,保證不泄露患者的隱私信息。

在數據標註環節,為了儘可能的讓影像專家快速地進行標註,零氪科技定製開發了若干針對性數據標註軟體,開發了來自不同影像工作站的標註信息統一轉化為普適開放標註格式。

為了加快標註的速度、降低標註人員的訓練成本,零氪科技還提供了全套培訓服務和錄像資料,幫助參與標註的醫生快速上手。

在數據處理階段,零氪科技提供的每份數據都是由三位影像專家分別獨立標註,最後處理階段與其進行比對。

如果各自差異很大,就集中起來進行重新標註,反覆迭代五六輪,最終才得到了大賽能夠使用的較高質量的數據信息。

零氪科技首席架構師王曉哲表示:「深度學習模型現在能夠達到的天花板是人類的最高水平,我們的數據級只能儘可能地保證接近頂尖專家水平,但由於是人標註的,所以其中難免存在一些潛在的問題,這會隨著陸續開展的數據標準化和天池大賽得到改善。」

為什麼國內的團隊願意來參賽?

一位學院派的參賽隊伍導師告訴動脈網:「其實我們每年的科研經費都很充足,來參賽肯定不是為了獎金。作為學院派,我們主要還是想來鍛煉一下學生的個人能力,學習一下目前人工智慧先進的操作環境和技術。」

一家企業參賽方的創始人則表示:「英特爾提供的是算力,阿里雲提供的是平台,零氪科技提供的是數據,而我們的優勢就在於場景。我們團隊已經從前期的腫瘤檢出、良惡性判斷,發展到了輔助診斷結果。包括治療方案的優劣、風險預判等因素。用過天池大賽與他們建立合作,對於我們項目的協同來說具有很大的價值意義。」

作為評委的醫院方,怎麼看AI的落地?

企業要想訓練AI,需要到醫院採集原始數據、驗證演算法。作為天池醫療大賽的評委之一,上海肺科醫院影像科主任孫希文告訴動脈網:「我們是全國最大的一家肺癌治療的單體醫院,與其他醫院相比,我們治療的病種最全,每年有12000多例手術,如此的龐大的醫療數據,就像一塊肥肉一樣,幾乎所有的AI公司都想和我們合作。」

人工智慧其實最關鍵的一點是數據的結構化,很多醫院的數據量很大,但是沒法用,就是因為數據是非結構化的。對此,上海肺科醫院與零氪科技在病歷結構化方面也開展了合作,從數據源頭保證醫療數據的可利用性。

「臨床數據結構化這一塊非常難,一般單純做人工智慧的公司很難做到,所以我們看好零氪科技這種既有大數據,又涉及人工智慧的企業。」

談到人工智慧在醫院的接受度,孫希文認為:「這要看站在誰的角度,對醫院普通醫生來說,基本是拒絕的,因為人工智慧就像是搶飯碗的一方。而對醫院管理層來說,則是樂於接受的,因為它能降低醫療的差錯,減少漏診誤診,既提升了醫院醫療服務的水平,又降低了醫患糾紛的發生率,相當於加了一層防火牆。」

在協調人工智慧和醫生的關係方面,上海肺科醫院也有著自己的解決方式:「目前人工智慧產品不成熟,就像一個處於公測階段的遊戲一樣,有著大量的BUG需要解決。所以我們可以讓醫生參與修改和設計遊戲(人工智慧),通過這種參與感,降低他們的排斥感。過去企業更多提的是挑戰醫生,現在大家都改成輔助醫生了,就像警察和緝毒犬一樣,這就是角色定位的轉變。」

上海肺科醫院影像科在人工智慧影像應用方面基本有兩種形式,一是先由人工智慧在當天晚上將患者所有的體檢數據跑一遍,並將疑似病例篩選出來,第二天醫生只需要確定人工智慧正確與否即可。

第二種則是醫生在白天完成病歷報告的書寫,晚上由人工智慧跑一遍,並與醫生的報告進行匹配,看是否有出入。

第二種方式,人工智慧像一位監督裁判,與醫生之間是對立的關係。而第一種方式,人工智慧更像助手,能夠幫助醫生減輕壓力。

目前醫院採用人工智慧企業的產品,更多是考慮兩個方面,一是行業內口碑,考慮的是公司的產品在哪家醫院用過,同行的評價如何;二是試用情況,醫院提供幾份脫敏數據,讓公司的人工智慧產品現場演示,從誤診率、漏診率數據就可以得出結論。

對於人工智慧目前的診療水平,孫希文表示:「過去很早就已經有人工智慧的概念,那個時候叫CAD(計算機輔助診斷),包括西門子、GE、飛利浦等國際大公司都會在自己影像系統的工作站內集成一套肺結節識別CAD,但那時候的準確率不高,不要說臨床醫生,就連住院醫生的水平都很難達到。但現在人工智慧企業產品已經非常接近臨床醫生的水平,目前上海肺科醫院影像科所使用的人工智慧產品,在肺結節檢測方面幾乎沒有漏診。」

大賽後的一點感悟

總體上看,天池大賽對於阿里雲、英特爾和零氪科技的意義,更多在於建立和走通一條醫療人工智慧的產業模式。

以目前人工智慧的發展曲線而言,隨著代碼的開源化,純演算法已經很難成為未來企業的核心競爭力。對於分別佔據著人工智慧算力和數據的三方而言,希望通過這次大賽獲得優秀的演算法,絕非它們的根本目的。

首先,我們可以把參賽企業想像成網路遊戲的試玩員。對遊戲公司來說,要找到合適的試玩員,並且讓他們付出時間和勞動為其尋找BUG,往往是需要支付費用的。但如今通過一場大賽,就能夠很輕鬆地實現。

其次,阿里雲、英特爾、零氪科技所組成的三叉戟,堪稱國內現階段最強的醫療AI產業聯盟。

縱觀其他行業,一個強大的聯盟,往往能夠把控產業上下游。以安卓為例,作為智能手機的底層操作系統,安卓佔據了全球最大的手機系統市場份額。

聯盟化、平台化、免費化是安卓能夠得到大規模普及的關鍵因素。而一旦聯盟內的使用者對開發生態產生了依賴感,那麼作為聯盟的把控者,必然能夠獲得極高的產業價值。

50萬獎金很多嗎?看似很多,但對發起方來說,這項投入著實划算。

當然,我們不應該忽視醫療機構在其中扮演的角色。

作為醫療AI產業真正的裁判,醫療機構一方的強勢地位更多來源於數據的把控。

無論是零氪科技還是阿里雲,都是國內醫療機構的信息化服務提供商之一,它們都是醫療機構數據的參與方之一(存儲、結構化)。

與它們合作,AI團隊能夠與產業裁判(醫療機構)產生更加緊密的聯繫,無論是對於成果的轉化和市場化,都將有直接的好處。

文|郝雪陽

添加時請註明:姓名-公司-職位

後台發送關鍵詞即可獲得相關好文

網站、公眾號等轉載請聯繫授權

長按識別上方二維碼,即可報名參與

2016年,動脈網首次面向醫療健康產業發布了「2016年年度未來醫療100強榜」。

相較2016年,2017年的醫療健康產業將呈現怎樣的態勢?這些態勢是讓各領域的企業受益還是受阻?在2017年的未來醫療100強榜中,哪些領域的企業會上榜?哪些會落榜?……解開種種問題的鑰匙,就是長按識別上方二維碼

近期推薦

回顧2016「未來醫療100強」

聲明:動脈網所刊載內容之知識產權為動脈網及相關權利人專屬所有或持有。文中出現的採訪數據均由受訪者提供並確認。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 動脈vcbeat 的精彩文章:

我們提出蝴蝶結產業模型和產業技術成熟度曲線,真實還原醫療人工智慧產業
初探國內已建成的Medical Mall,在8個城市落地,總投資逾41億元,100%投入使用
淺析20年來十大IVD巨頭在國內的戰略布局,國內體外診斷企業還有哪些機會?
阿里雲唐超:ET醫療大腦究竟能為醫療行業帶來哪些能力?
梳理30家Medical Mall 在50多年來的發展脈絡,這會是國內地產商轉型醫療最簡單的方式嗎?

TAG:動脈vcbeat |