深度學習下的醫學圖像分析(一)
AI 研習社按:本文由圖普科技編譯自《Medical Image Analysis with Deep Learning 》,雷鋒網(公眾號:雷鋒網)獨家首發。
近年來,深度學習技術一直都處於科研界的前沿。憑藉深度學習,我們開始對圖像和視頻進行分析,並將其應用於各種各樣的設備,比如自動駕駛汽車、無人駕駛飛機,等等。
《A Neural Algorithm of Artistic Style》是一篇最新發表的研究性論文,論文向我們介紹了如何將一種風格和氣質從藝術家身上轉移至一張圖像,並由此創建出另一張新圖像。其他的一些論文,比如Generative Adversarial Networks和Wasserstein GAN,也已經為開發模型鋪平了道路,這個模型能夠創建出與輸入數據相似的新數據。由此,「半監督學習」世界的大門被打開了,未來「無監督學習」的發展也將更加順利。
儘管這些調查研究的對象現在僅限於一般的圖像,但我們的目標是將這些研究運用到醫學圖像中,幫助醫療保健的發展。在本文中,我將從圖像處理和醫學圖像格式數據入手,並對一些醫學數據進行可視化處理。在下一篇文章中,我將進深入剖析一些卷積神經網路,並將其與Keras聯合,預測肺癌。
使用Python進行基本的圖像處理
OpenCV(開源計算機視覺庫)憑藉其大量社區支持,以及對C++,Java和Python的可兼容性,在琳琅滿目的圖像處理庫中脫穎而出,成為了圖像處理庫的主流。
現在,打開你的Jupyter筆記本,並且確定cv2是能夠導入至筆記本的。你還需要numpy和matplotlib來查看筆記本內的細節內容。
現在,我們來看一下你能不能打開圖片,能不能用下面的代碼在你的筆記本上查看圖片。
基本的人臉檢測
接下來,我們要玩些有趣的——檢測人臉。我們將使用一個開源的正臉檢測器來進行人臉檢測,這個檢測器最初是由Rainer Lienhart創建的。下圖這個帖子詳細地介紹了級聯檢測的細節:
醫學圖像數據格式
醫學圖像與「數字影像和通訊」(DICOM)一樣,是一個儲存和交換醫學圖像數據的標準解決方案。該標準自1985年第一版發布以來,已經被修改了好幾次。該標準使用的是一個文件格式和一個通訊協議。
文件格式——所有病人的醫學圖像都被保存在DICOM文件格式里。這個格式中保存著病人的受保護健康信息,比如:病人姓名、性別、年齡,還有一些醫療圖像的數據。「醫學成像設備」創建了DICOM文件。醫生們使用DICOM閱讀器和能夠顯示DICOM圖像的電腦軟體應用程序來查看醫學圖像,並且根據圖像的信息作出診斷。
通訊協議——DICOM通訊協議是用來在檔案中搜索影像研究,並將影像研究還原顯示的。所有連接了醫院網路的醫學成像應用程序都會使用DICOM協議交換信息,這些信息中的大部分是DICOM圖像,不過還包括了一些患者信息和治療方案。還有一些網路要求是用於控制和跟蹤手術、安排手術日程、報告狀態,以及分擔醫生和成像設備之間的工作量的。
下面的博客詳細地介紹了DICOM標準:
分析DICOM圖像
Pydicom是一個相當不錯的、用於分析DICOM圖像的Python工具包。在這個部分,我們將會看到DICOM圖像是如何在Jupyter筆記本上呈現的。
使用pip安裝pydicom下載安裝OpenCV
Pydicom工具包安裝完畢以後,回到Jupyter筆記本。將dicom工具包和下圖中的其他工具包導入筆記本中。
在處理和分析數據時,我們還會用到其他的工具包,比如pandas,scipy,skimage和mpl_toolkit,等等。
網上有很多免費的DICOM資料庫,下面的這些資料庫可能對你有所幫助:
Kaggle競賽和資料庫:這是我個人最喜歡的資料庫。這裡面有關於肺癌和糖尿病視網膜病變的數據。
Dicom資料庫:DICOM資料庫是一個免費的線上醫學DICOM圖像或視頻分享的伺服器,它主要是以教學和科研為目的的。
Osirix資料庫:這個資料庫向我們提供了大量通過各種成像方式獲得的人類數據。
可視化人體數據集:「可視人計劃」的某些部分是分布於這個數據集的,但是這個數據集中的數據是需要收費的。
Zubal幻影:這個網站提供了關於兩名男性CT和MRI圖像的多個資料庫。
下載dicom文件,並將其上傳至你的jupyter筆記本。
現在,將DICOM圖像載入到一個列表中。
第一步:在Jupyter筆記本上查看DICOM圖像
在第一行,我們載入第一個DICOM文件,然後提取文件名在列表中排第一的元數據。
接下來,我們要計算3DNumpy數組的總維數,它等於片中像素的行數x、片中像素的列數x,還有x,y,z軸。最後,我們要用「像素空間」和「SliceThickness」來計算三個軸上像素間的空間距離。我們需要將數組維度保存在ConstPixelDims中,並將空間保存在ConstPixelSpacing中。
第二步:進一步研究DICOM格式的細節
CT掃描測量的單元是「胡斯菲爾德單元」(HU),這個單元測量的是放射性密度。為了得到精確的測量結果,CT掃描儀經過了嚴格的校準。下面是關於CT掃描測量的細節內容:
每個像素都會被分配一個數值(CT數),這個數值是相應的voxel內所有衰減值的平均值。這個數字是與水的衰減值相比較得出的,而且是以任意單元的規模顯示的,這個任意單元叫做「胡斯菲爾德單元」(HU),是以Godfrey Hounsfield先生的名字命名的。
這個任意單元的規模將水的衰減值定為零。CT數字的範圍是2000HU,儘管有一些現代掃描儀的HU範圍達到了4000。每個數值都代表了一種灰色陰影,在光譜兩端有+1000白色和-1000黑色。
胡斯菲爾德規模(圖片來自《CT的介紹》)
有些掃描儀是有柱狀掃描邊界的,但是其輸出的圖像確實方形的。在掃描邊界之外的像素將被賦予-2000的定值。
CT掃描儀圖像(圖片來自《CT的介紹》)
第一步通常是將這些值設置為零。接著,我們把得到的數值與重新調節的斜率相乘,再加上截距(通常是記錄在掃描的元數據中的),然後回到HU單元。
在接下來的部分,我們將會使用Kaggle的肺癌資料庫和Keras的卷積神經網路。我們將根據本文提供的信息,構建下一部分的內容。
點擊展開全文
※詳解自動識別驗證碼,LSTM大顯身手
※AI 也能藝術創作了?Facebook說I CAN
※只需 130 行代碼!用 GAN 生成二維樣本的小例子
※最容易做的圖像分割教程:用英偉達 DIGITS 進行圖像分割,看一遍你也會做!(上)
TAG:唯物 |
※學界 | 結合主動學習與遷移學習:讓醫學圖像標註工作量減少一半
※醫學雜談(三)
※「我在大學等你」 -學長學姐教我選專業(五)臨床醫學
※中國生命科學和醫學領域高被引學者及單位深度分析
※為什麼醫學影像AI已進入「後深度學習時代」?
※實用:用深度學習方法修復醫學圖像數據集
※茶里的醫學講究
※中醫學 VS.西醫學
※同為醫學狗,學渣、學弱、學霸和學神有什麼區別?
※醫學三連專用圖
※臨床醫學&藥學
※結合主動學習與遷移學習:讓醫學圖像標註工作量減少一半
※醫學英語輕鬆學
※CVPR最新醫學影像AI論文:利用學習圖像變換進行數據增強
※醫學的象徵·蛇杖
※醫學科學技術進展「第6期」
※本周醫學界熱議話題Top 1:紐約大學醫學院免學費
※約翰霍普金斯大學:新的數據分析工具可支持精準醫學研究
※醫學英語視聽學習
※學習星相、卜筮、醫學、風水的意義