亞馬遜專家揭秘：如何建立自動檢測乳腺癌的深度學習模型

最新 06-20

安妮編譯自 Insight Data Science

量子位出品 | 公眾號 QbitAI

本文作者Sheng Weng，現亞馬遜Alexa項目組數據專家，萊斯大學應用物理專業已畢業博士生，主要研究用超快激光轉化生物光子學成像及顯微鏡檢查。

前不久，他參加了Insight Data Science的青年計劃——這是一個為期7周的博士後團體的交流計劃，是學術界與企業界的醫學數據研究交流橋樑。參加本項目期間，Sheng Weng為為醫療檢測公司iSono創建了用深度學習自動檢測乳腺癌的新模型，並將研究原理髮布在公司的官方博客上。量子位全文編譯整理如下：

Sheng Weng照片

背景資料

乳腺癌是導致全球女性死亡的第二大癌症類型，其中，浸潤性乳腺癌是主要的乳腺癌類型。據報道，美國八分之一的女性都會被確診為浸潤性乳腺癌。在2017年，粗略預計有255180例患者被確診為浸潤性乳腺癌，有40610位患者死於乳腺癌。

一般來說，醫生都會建議健康女性一年做一次乳腺癌檢查，尤其是年過50的中年婦女，她們的患病率較高。傳統的檢查流程一般包括乳房X射線和超聲圖像檢測，但這是一種比較主觀的診斷，非常依賴醫生的水平。

iSono Health是一個初創公司，致力於開發低成本的自動超聲圖像檢測平台，促進女性每月進行乳腺癌自我檢測。我創建的模型需要藉助iSono的app分析檢測結果，它能夠用超聲圖像區分乳腺腫塊是良性還是惡性的，並且可以實時記錄並查看。

數據概覽

iSono Health提供了一份原始數據集，包含2684個JPEG格式的2D乳腺超聲檢測圖像。我們將這些原始數據進行了歸類：

良性案例：1007例

惡性病例：1499例

非典型病例：178例

良性致病類型：12例

惡性致病類型：13例

非典型致病類型：3例

大多數的超聲檢測圖像大小為300*225像素，每個像素的值在0到225之間。這些圖像來自不同的渠道，所以對病情的判定和解決方案都不盡相同。總共有12例良性致病類型和13例惡性致病類型，下圖就展示了集中不同致病類型的乳腺病變。

為了使病變檢測成為一個二進位的分類問題（良性或惡性），我忽略了所有的致病類型和非典型病例信息，並隨機挑選了1920張圖像用於建立和評估模型——這些圖像中一半是良性的，而另一半是惡性的，是一個相對平衡的數據集。

數據準備

我用3*3的中值濾波器來移除超聲圖像中的斑點噪音，將每個圖像上的像素值標準化，這樣就會出現零均值。

先說明一點，對於乳腺癌這種複雜的圖像分類問題，1920張圖像是一個相對較小的數據集。擴充數據能夠減少過度擬合，增強模型的泛化能力，是極具吸引力的解決方案。我們將這個數據集分成三部分，75%用於訓練，12.5%用於驗證，剩下的12.5%作為測試數據集。基於乳腺病變對旋轉並不敏感的假設，我將每張圖片進行旋轉。具體來說，就是將每張圖片在-10°到10°之間隨機進行旋轉，並重複了12次，最終得到1920*12=23040張圖像。因為我想讓整個病變區位於圖像的核心，所以並沒有使用裁剪或移動等其他的增強技術。

根據觀察，幾乎所有圖片中的病變區（包含病變處和四周）都在圖像中央，因此我可以把圖片裁剪成200*200像素大小，這樣也能移除圖像旋轉引起的填充。為了保持網路可控，每張圖像降低採樣到原圖像的五分之一，也就是40*40像素大小。下面這張圖就是數據準備的流程圖。

數據增強步驟結束之後，現在手邊有17280張訓練圖像，2880張驗證圖像，和2880張用於測試的圖像。每個數據集都包含著50%的良性病例和惡性病例。在數據增強之前，驗證和測試集和訓練集要分開，所以各分組間沒有重疊的原始圖像。

演算法

為了得到合適的分類器，常規方法通常是三個步驟：特徵提取、特徵選擇和分類。這三個步驟需要單獨被處理好，之後再整合在一起。提取判別特徵可能會減輕後續特徵選擇和分類難度。然而，有效特徵是基於問題的，並且高度依賴圖像處理中每個中間結果，所以通常需要很多試錯設計和針對不同用戶的干預措施。

近年來深度學習技術的進步可能會改變圖片分類的設計。《自然》雜誌最近報道了一項用深度卷積神經網路對皮膚癌進行分類的進展，其效果與皮膚病專家的判斷相當。沒有定義「深度」的具體含義，但簡單來講它是每個神經元之間可能存在的聯繫數量，確實真正影響了深度學習結構的「深度」。

深度學習可以直接從訓練數據數據中提取特徵，而不需要對特徵的提取和選擇進行詳細描述。神經網路將輸入信息通過層層的神經元傳遞，之後將輸入信息轉換成輸出信息。有了反向傳播的幫助，神經網路的內部權重會根據每次迭代獲得的錯誤信息自動更新。

在這個項目中，我研究並比較了兩種不同深度學習架構的表現——即全連接神經網路(FCNN)和卷積神經網路(CNN)。這兩種模型都是使用python和TensorFlow在Nvidia Tesla K80 GPU上實現的，用的是亞馬遜雲服務(AWS)EC2 p2.xlarge。

全連接神經網路

在一個全連接神經網路中，每個神經元與前一層所有神經元連接，每個連接都有自己的權重。然而，權重間的信息卻不被神經元共享。在用全連接神經網路之前，需要增加一個額外步驟——將所有的2D圖像轉化為長度為1600的1D序列。

我構建的全連接神經網路有一個輸入層，三個隱藏層（各自分別有512、256和128個節點），和一個有兩個輸出的輸出層。

卷積神經網路

在一個卷積神經網路中，每個神經元只與前一層的幾個局部神經元聯繫在一起，並且在該層中每個神經元的權重相同。因為卷積運算產生的信息與圖像的空間特性相關，因此卷積神經網路很適合解決圖像分類問題。例如，卷積可能導致圖像邊緣更加突出。

我構建的卷積神經網路有三個卷積層，每一層都是上一層的圖像通過5*5的濾波器/內核（kernel）卷積形成。將一個卷積層的輸出輸入給另一個卷積層，可以提取出更高階的特徵。卷積後，這些特徵可更容易被全連接網路學習。卷積層可以被看做是為數據做準備的，讓全連接層能夠利用輸入圖像的空間結構。我的直覺是，在圖像經過多個卷積層後，神經元將被編碼成完全相關的空間特徵。卷積層後有兩個全連接層，分別有512和256個節點。這個卷積神經網路架構的靈感來自AlexNet的前幾層，下圖顯示了詳細的信息。

模型評價

卷積神經網路比全連接神經網路在下面的評價指標中表現得要好。卷積神經網路的預測精度是73%，而全連接神經網路的精度只有66%。在下面這張複雜的矩陣圖中，分類良性和惡性腫瘤病例的閾值是0.5，也是我們之前的默認值。降低閾值可以提高靈敏度，減少假陽性病例。即這種情況下有一個微妙的平衡，假陽性病例具有重要的暗示——尤其是在預防性乳房切除術上。

卷積神經網路的優點也可以在下面兩個圖表中觀察到。在第3000次訓練迭代後，卷積神經網路的精確度快速且平穩地增加到0.9，而全連接神經網路在經過10000次迭代後還達不到這一水平。另一方面，卷積神經網路的損失值比全連接神經網路要低，這表明卷積神經網路中的梯度下降函數在收斂到局部最小值處表現最好。損失值是由成本函數計算的，基本定義了模型與期望輸出值之間的差距。梯度下降試圖通過緩慢改變權重將價值函數最小化。

這兩個模型中都應用了隨機梯度下降（SGD）和線性整流函數（ReLU），此外還採用了學習率衰減的方式提升性能表現。Dropout能夠防止其過擬合。

結語

這些代碼將給iSono Health作為下一步演算法開發的基準模型。卷積神經網路具有許多可以進一步調整的超參數，包括但不限於：卷積層數、完全連接層數、濾波器數量、濾波器尺寸、隱藏節點數、批量大小、學習速率、最大值合并大小，丟棄率等。此外，更好的圖像增強以及來源一致的圖像可能表現地更好。

從零開始構建CNN耗時且計算成本昂貴，學習是另一種可行的解決方案。它指利用預先訓練的深度學習模型（例如，GoogleNet Inception v3）學習特徵過程，然後應用於不同的數據集。如果有更多的數據可用，轉移學習可能有助於培訓程序。

最後，對所有幫助過我的人表示感謝。

參考資料

[1]http://www.breastcancer.org/about_us/press_room/press_kit/facts_figures

[2] Cheng, Jie-Zhi, et al. 「Computer-Aided diagnosis with deep learning architecture: applications to breast lesions in us images and pulmonary nodules in CT scans.」 Scientific reports 6 (2016).

[3] Esteva, Andre, et al. 「Dermatologist-level classification of skin cancer with deep neural networks.」 Nature (2017).

[4] MLA Krizhevsky, Alex, et al. 「Imagenet classification with deep convolutional neural networks.」 Advances in neural information processing systems (2012).

【完】

一則通知

量子位正在組建自動駕駛技術群，面向研究自動駕駛相關領域的在校學生或一線工程師。歡迎大家加量子位微信(qbitbot)，備註「自動駕駛」申請加入哈~

招聘

量子位正在招募編輯記者、運營、產品等崗位，工作地點在北京中關村。相關細節，請在公眾號對話界面，回復：「招聘」。

掃碼強行關注『量子位』

追蹤人工智慧領域最勁內容

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！