深度學習下的醫學圖像分析（一）

知識 07-05

AI 研習社按：本文由圖普科技編譯自《Medical Image Analysis with Deep Learning 》，雷鋒網(公眾號：雷鋒網)獨家首發。

近年來，深度學習技術一直都處於科研界的前沿。憑藉深度學習，我們開始對圖像和視頻進行分析，並將其應用於各種各樣的設備，比如自動駕駛汽車、無人駕駛飛機，等等。

《A Neural Algorithm of Artistic Style》是一篇最新發表的研究性論文，論文向我們介紹了如何將一種風格和氣質從藝術家身上轉移至一張圖像，並由此創建出另一張新圖像。其他的一些論文，比如Generative Adversarial Networks和Wasserstein GAN，也已經為開發模型鋪平了道路，這個模型能夠創建出與輸入數據相似的新數據。由此，「半監督學習」世界的大門被打開了，未來「無監督學習」的發展也將更加順利。

儘管這些調查研究的對象現在僅限於一般的圖像，但我們的目標是將這些研究運用到醫學圖像中，幫助醫療保健的發展。在本文中，我將從圖像處理和醫學圖像格式數據入手，並對一些醫學數據進行可視化處理。在下一篇文章中，我將進深入剖析一些卷積神經網路，並將其與Keras聯合，預測肺癌。

使用Python進行基本的圖像處理

OpenCV（開源計算機視覺庫）憑藉其大量社區支持，以及對C++，Java和Python的可兼容性，在琳琅滿目的圖像處理庫中脫穎而出，成為了圖像處理庫的主流。

現在，打開你的Jupyter筆記本，並且確定cv2是能夠導入至筆記本的。你還需要numpy和matplotlib來查看筆記本內的細節內容。

現在，我們來看一下你能不能打開圖片，能不能用下面的代碼在你的筆記本上查看圖片。

基本的人臉檢測

接下來，我們要玩些有趣的——檢測人臉。我們將使用一個開源的正臉檢測器來進行人臉檢測，這個檢測器最初是由Rainer Lienhart創建的。下圖這個帖子詳細地介紹了級聯檢測的細節：

醫學圖像數據格式

醫學圖像與「數字影像和通訊」（DICOM）一樣，是一個儲存和交換醫學圖像數據的標準解決方案。該標準自1985年第一版發布以來，已經被修改了好幾次。該標準使用的是一個文件格式和一個通訊協議。

文件格式——所有病人的醫學圖像都被保存在DICOM文件格式里。這個格式中保存著病人的受保護健康信息，比如：病人姓名、性別、年齡，還有一些醫療圖像的數據。「醫學成像設備」創建了DICOM文件。醫生們使用DICOM閱讀器和能夠顯示DICOM圖像的電腦軟體應用程序來查看醫學圖像，並且根據圖像的信息作出診斷。

通訊協議——DICOM通訊協議是用來在檔案中搜索影像研究，並將影像研究還原顯示的。所有連接了醫院網路的醫學成像應用程序都會使用DICOM協議交換信息，這些信息中的大部分是DICOM圖像，不過還包括了一些患者信息和治療方案。還有一些網路要求是用於控制和跟蹤手術、安排手術日程、報告狀態，以及分擔醫生和成像設備之間的工作量的。

下面的博客詳細地介紹了DICOM標準：

分析DICOM圖像

Pydicom是一個相當不錯的、用於分析DICOM圖像的Python工具包。在這個部分，我們將會看到DICOM圖像是如何在Jupyter筆記本上呈現的。

使用pip安裝pydicom下載安裝OpenCV

Pydicom工具包安裝完畢以後，回到Jupyter筆記本。將dicom工具包和下圖中的其他工具包導入筆記本中。

在處理和分析數據時，我們還會用到其他的工具包，比如pandas，scipy，skimage和mpl_toolkit，等等。

網上有很多免費的DICOM資料庫，下面的這些資料庫可能對你有所幫助：

Kaggle競賽和資料庫：這是我個人最喜歡的資料庫。這裡面有關於肺癌和糖尿病視網膜病變的數據。

Dicom資料庫：DICOM資料庫是一個免費的線上醫學DICOM圖像或視頻分享的伺服器，它主要是以教學和科研為目的的。

Osirix資料庫：這個資料庫向我們提供了大量通過各種成像方式獲得的人類數據。

可視化人體數據集：「可視人計劃」的某些部分是分布於這個數據集的，但是這個數據集中的數據是需要收費的。

Zubal幻影：這個網站提供了關於兩名男性CT和MRI圖像的多個資料庫。

下載dicom文件，並將其上傳至你的jupyter筆記本。

現在，將DICOM圖像載入到一個列表中。

第一步：在Jupyter筆記本上查看DICOM圖像

在第一行，我們載入第一個DICOM文件，然後提取文件名在列表中排第一的元數據。

接下來，我們要計算3DNumpy數組的總維數，它等於片中像素的行數x、片中像素的列數x,還有x,y,z軸。最後，我們要用「像素空間」和「SliceThickness」來計算三個軸上像素間的空間距離。我們需要將數組維度保存在ConstPixelDims中，並將空間保存在ConstPixelSpacing中。