當前位置:
首頁 > 知識 > 18歲NIPS Workshop一作,用目標檢測評估手術技能點

18歲NIPS Workshop一作,用目標檢測評估手術技能點

選自Stanford Medicine

作者:Ruthann Richter

機器之心編輯部

由李飛飛教授創辦的公益機構 AI4All 致力於提高人工智慧領域的多樣性和包容性。該組織提供教育和導師計劃為美國和加拿大的少數群體人才提供學習途徑,AI4All 為高中學生提供儘早接觸 AI 的機會。剛剛,李飛飛發推讚揚 AI4All 成員 Amy Jin、斯坦福大學博士 Serena Yeung 和斯坦福 PAC 團隊的合作者一道在 AI+醫療領域做出的貢獻:他們合作設計了一款軟體來評估外科醫生的技能。

PAC 團隊的負責人是李飛飛和醫學教授 Arnold Milstein,其整合了斯坦福以及其他醫學院的一系列跨學科資源,主要是想用 AI、計算機視覺等技術解決一些醫療健康中的難題。

該研究論文已在 arXiv 上發布,一作 Amy Jin 今年 18 歲,最近剛剛高中畢業,是個喜歡 hip-hop、小提琴和英國文學的女孩。而她對計算機科學的熱情使她成為人工智慧領域的 superstar。

據斯坦福大學醫學院的報道,Amy Jin 六年級時就對 AI 產生了興趣,但直到成為高中生,她對 AI 的熱情才開始燎原,當時她聽到 IBM 科學家介紹 Watson 超級計算機能夠通過人工智慧擴展人類在醫療及其他領域的能力,教會機器「思考」和「看見」。「Watson 能夠成為醫生的第二雙眼睛」,這使 Amy 震驚又興奮,她認為 AI 領域可以產生很多跨學科的可能性,因此非常有潛力。

Amy Jin 其它兩位斯坦福的導師共同設計了一款軟體,可以評估外科醫生的技能。

過去兩年,Jin 與斯坦福大學的導師共同設計了一款新的軟體,用於評估外科醫生的技能。該軟體的工作原理是:「觀看」外科手術的視頻,然後追蹤手術過程中的動作、計算每個步驟中使用器械的時長。該創新成果獲得了 NIPS 2017 Machine Learning for Health 研討會的頂級研究獎項。斯坦福大學醫學院 Clinical Excellence Research Center 負責人、醫學博士 Arnold Milstein、研究論文共同作者預測該方法將在客觀評估臨床醫生的多項臨床技能中實現新突破。

Milstein 表示:「它提供了一種方式,根據醫生的學習速度定製外科訓練的時間。以及它提供了一套更客觀的方法來定期評估外科醫生的技能,或者在醫生大手術期間及時提醒 Ta 需要休息。」

Serena Yeung(左)和 Jeff Jopling(右)與 Amy Jin 合作設計該軟體。

Amy Jin 在讀高中時參加了斯坦福 AI 實驗室舉辦的 Outreach Summer Program,該項目旨在鼓勵年輕女性投入科學研究。在該項目中,她與 Serena Yeung、Jeff Jopling 等人合作開展了利用 AI 技術改善醫療衛生的研究。

Serena Yeung 在 AI4All 導師計劃中負責指導 Amy Jin,當時她仍是李飛飛和 Arnold Milstein 的博士生,看過 CS231n 2017 的讀者可能會對她比較熟。Serena Yeung 對醫學一直很感興趣,而在斯坦福大學的教育經歷使她對工程、AI 產生了興趣,曾在 Facebook 和 Google 實習。後加入 Arnold Milstein 的項目,致力於使用技術來改善醫療實踐。

Jeff Jopling 是醫學博士,前 CERC 學者,他提出使用計算機技術來追蹤外科手術技能,認為手術技能非常重要。根據 National Academy of Medicine 1999 年的一份報告,醫療衛生中的安全問題是重點,很高比例的死亡率和傷殘率來源於醫療過程中的人為誤差。醫生想利用手術安全核查表最小化可避免的併發症、避免錯誤。

Jeff Jopling 稱,很多研究聚焦於改善系統,但醫生及其技能也很重要。

評估外科醫生技能這一項目於 2016 年夏天正式啟動,其挑戰在於「教」計算機識別並追蹤手術工具的移動路徑。這是一個目標檢測問題,該領域近年來發展迅速,李飛飛實驗室功不可沒。

定位數據點

研究人員開發了一種演算法,教計算機從饋入的上千個數據點中學習。計算機根據每個比特的數據逐漸調整,直到達到可以形成準確目標圖像的程度,在這個項目中目標指的是外科手術工具。Jin 改進了一些目標檢測技術,將其應用於外科手術。她表示,「總的想法是,如果我們可以追蹤、識別視頻中的工具,我們就能更好地分析工具使用模式及其移動。」

為簡單起見,研究人員主要聚焦膽囊切除手術。這種手術最多用到 7 種工具。他們拿到了 15 個相關手術視頻,標註了其中的 2500 幀,而且為每一幀附加了一個值,以便計算機構建工具的視覺圖像,並在手術野範圍內定位它們。他們利用度量來追蹤工具的使用時間,即何時使用何種工具、使用了多久,並繪製了每種工具的路徑圖。此外,他們還繪製了熱圖,顯示這些工具在手術野內的分布。嫻熟的外科醫生通常會將工具放得比較集中。

研究人員可以根據視覺信息和數據從多個角度評估外科醫生的表現,包括他們的動作是否簡潔、每個步驟的操作是否高效等。接下來,他們請三位斯坦福的醫生單獨觀看視頻,並依據效率、雙手靈活性和對人體組織的處理等廣泛使用的指標按 1-5 分的範圍進行打分。

「機器對手術的評價機制與醫生的評分機制相關。」Yeung 表示。

例如,膽囊切除手術有一個關鍵步驟,醫生必須夾住並切斷向膽囊供血的膽囊動脈和傳輸膽汁的膽囊管。如果操作得當,這個步驟可以防止術中和術後出血及膽汁滲漏。如果夾子放錯了位置或者鬆動了,病人會遭受致命的併發症。

嫻熟的醫生可以用較少的動作高效地處理這一問題。其中一個視頻顯示了一名外科醫生的嫻熟技巧,他/她將剪刀和其他工具放得恰到好處。而在另一段視頻中,一名外科醫生多用了一個夾子並努力將其放在適當的位置,之後又花了些時間將其弄開。計算機不僅通過查看器械的放置位置和路徑,還通過查看手術持續時間來檢測技能水平的差異。

研究小組將分析結果——《Tool Detection and Operative Skill Assessment in Surgical Videos Using Region-Based Convolutional Neural Networks》提交給 NIPS 2017 Machine Learning for Health 研討會,該論文在 120 多份論文中脫穎而出,被選為 10 份 spotlight 論文之一。

進一步優化

Jopling 表示,項目的下一步是收集 1000 多個記錄不同手術的視頻。斯坦福將與猶他州聯合醫療中心(Intermountain Healthcare,旗下有 22 家醫院)合作,共同分析視頻並改進這一評估工具。未來的研究還將考慮外科手術的複雜性,例如,有些膽囊切除手術很簡單,有些卻很難,因為不同患者的醫療情況不同。

他還表示,這項技術在外科手術培訓中特別有用。外科醫生檢查受訓者表現時通常一坐就是幾小時,非常吃力。而自動系統可以為他們代勞,還可以在受訓者可能出現失誤時實時提醒醫生。知道醫生什麼時候開始疲勞、精力不濟,對手術結果來說非常重要。根據這個可以判斷主刀醫生何時應該休息並由助手接手。

Milstein 向斯坦福大學外科教授兼主席 Mary Hawn 分享了這項研究,後者非常樂意將完善後的模型提交給美國外科委員會(American Board of Surgery),作為當前委員會認證考試的補充。

但並非所有外科醫生都樂意讓一台機器來評價自己的技術。甚至有人表示,當這麼一天到來時,自己將提前退休。

不過,Yeung 指出,此項 AI 技術可以廣泛應用於醫療領域。例如,該研究組一直在測試用它來監控 ICU 病人的活動、護理人員是否遵循了確保病人安全的步驟。這項技術還能用來監控家中虛弱的老人,測試其活動和行動能力,當他們跌倒或發生其他意外時提醒其他人。

Yeung 還表示,如今的臨床醫生、護士和其他醫療保健服務人員都不堪重負,隨著嬰兒潮一代年齡的增長,這個問題將變得更加嚴峻。而人工智慧存在巨大潛力,可以幫助我們持續了解、監控正在發生的事,進而幫助醫療保健服務人員,防止認知過載。

不過,Jin 不會繼續參與這項斯坦福的研究。她現在是哈佛的大一新生,跟隨其兄的步伐。雖然沒法再繼續參與項目,但 Jin 對該項技術的後續發展仍然充滿期待。

相關論文:Tool Detection and Operative Skill Assessment in Surgical Videos Using Region-Based Convolutional Neural Networks

論文鏈接:https://arxiv.org/abs/1802.08774

摘要:世界上約有 50 億人無法獲得高質量的外科護理。外科醫生的技能差異很大,很多接受外科手術的患者會遭受併發症和本來能避免的傷害。改善外科手術的訓練和反饋機制可以幫助降低併發症的發生率,其中一半的併發症已經證明可以被預防。要做到這一點,重要的是評估手術操作技能,手術過程目前仍需要專家參與,它是手動、耗時且主觀的。

本研究介紹了一種自動評估外科醫生表現的方法,該方法主要通過基於區域的卷積神經網路自動追蹤和分析手術視頻中的工具運動而完成。為了研究這個問題,我們引入了一個新數據集 m2cai16-tool-locations,它標註了工具的空間界限。雖然以前的方法已經解決了工具的存在性檢測問題,但我們的方法是第一種不僅能夠檢測工具的存在性,還能在實際的腹腔鏡手術視頻中對手術工具進行空間定位的方法。

我們的實驗表明該方法既能高效地檢測手術工具的空間界限,同時顯著優於現有的工具存在性檢測方法。我們進一步證明了該方法通過分析手術工具的使用模式、作業範圍和作業有效性來評估外科手術質量的能力。

參考鏈接:http://stanmed.stanford.edu/2018fall/young-scientist-artificial-intelligence-measures-surgeons-skill.html#

本文為機器之心編譯,轉載請聯繫本公眾號獲得授權。

------------------------------------------------


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

深度 | 從算力到半導體供應鏈,硬體如何決定機器學習的研究趨勢
首個長三角數據智能年度榜單評選正式開啟:發現長三角數據智能領軍者

TAG:機器之心 |