通過深度學習了解內部健康密碼
作者: IBM香港系統部總經理許旭煦
深度學習:拆解健康密碼
早在1880年代,醫學界已使用內窺鏡和大腸鏡檢查人體內部情況,由專家分析醫療影像,但診斷有時會因人為錯誤和後台因素出錯。
隨全球城市人口增長,內科疾病個案數字急速上升,公眾對診斷專家的需求殷切,單在數量上培訓專家並不足夠。病理學家須長時間接受訓練、努力不懈,透過觀察顯微鏡和侵入性測試,方能辦別腫瘤組織。深度學習﹝Deep Learning﹞有助醫療觀測診斷的方法更上一層樓。
深度學習的底蘊
與一般機器學習﹝Machine Learning﹞相比,深度學習是更進一步模仿人類的思維方法。人類腦部神經元是相隔若干距離,仍然互相連結,迅速處理及傳遞訊息。人工神經網路﹝Artificial Neural Networks﹞則利用層次組合、連結和方向,來傳遞數據。
每個人工神經網路層,要負責不同工序。當數據由第一層出發,每層都進行一項工序,直到最後一層,數據就成為整個神經網路輸出的洞見。在分析醫療影像的應用上,通常需要約100個這種神經網路層,方能識別並分類來自數百萬圖像的特徵。
業界深知人工神經網路在醫學應用上有巨大潛力,但要一部機器像人類一樣「思考」,須增加神經網路的層數去處理數據,耗用龐大的運算資源。新的IBM POWER Systems,為局面帶來轉機。最近,香港生產力促進局(生產力局)的汽車及電子部便引入有關係統,進行深度學習在醫學領域的研究。
POWER推動機器學習
要使用數以十萬計醫療影像,去訓練一個人工神經網路進行深度學習,工作一點不簡單,需要強大的影像處理組件、高容量記憶體,及穩定可靠的平台。
若使用區域性卷積神經網路﹝Regional Convolutional Neural Networks﹞,處理不規則影像,每個影像會被分拆為數以千計的小區域,每區會產生數千項數據,讓系統計算它們之間是否相似。
若用非線性方法,拆解分析不規則的數據,需要強大的運算能力。尤其當病人性命攸關,更需要強大的系統,大幅縮短深度學習的訓練時間,由若干星期縮至若干小時內完成。
影像的處理同樣重要。生產力局的研究隊伍,使用大量人體異常組織的影像,例如已劃分區段的腺體組織影像,讓系統深度學習,判斷不同細胞的大小、形狀,及相對於其他細胞的位置,提高辨識能力。
今次使用的IBM平台,提供分散式系統,可同時支援多個圖形處理器﹝GPU﹞。若有圖形處理器處於閑置狀態,資源可開放供機構其他同事使用,提高營運效益,讓他們同步處理多個不同項目。
平台穩定性十分重要,因為計劃目標是支援病理學家研究,不能在數據完整性、系統故障上帶來困擾。
加速架構致勝關鍵
生產力局所採用的IBM S822LC伺服器系統的高效能運算﹝HPC﹞平台由IBM開發,並運用了NVIDIA的 NVLink 圖像處理器 (GPU) 介面。
NVLink技術在中央處理器﹝CPU﹞與圖形處理器之間,提供高頻寬、低延遲的連結,高容量頻寬是PCIe的2.5倍。四個NVLink圖形處理器,加上雙重POWER8中央處理器,為深度學習提供穩定可靠的平台。
這套尖端的深度學習系統經由IBM Lab部署安裝,讓生產力局研究隊伍採用更快的新方法,處理影像數據和深度學習,為協助香港醫療拆解健康密碼,邁出新的一步。
TAG:IBM中國 |