國內學者新研究:中醫AI登場,自動開出藥方
問耕 發自 凹非寺
量子位 出品 | 公眾號 QbitAI
啊~醫學,一個正在被人工智慧改變的領域。
一講到這個,常見的報道大都是AI閱X光片無數,無師自通成良醫。前不久,FDA還批准通過了首個AI設備,能預測以及預防猝死……等等,怎麼都是西方傳來的那一套!
民族的,能不能是AI的?
也行。
最近國內學者就發布了一項中醫AI的最新研究。這項研究的目標,是基於癥狀的文本描述,更好地自動生成對應的中藥處方。
論文中提到,之所以這個方向可行,是因為中醫大夫主要根據患者描述的癥狀開出藥方,通常不需要藉助醫療器械的觀察和分析。
另外研究人員指出,中醫歷史悠久,產生了很多醫療典籍,積累了大量的治療記錄。其中就包括癥狀的文本描述,以及對應的中藥處方。
這不正好就是深度學習可以派上用場的地方么?
來看一個實際的案例。
比如這個《常用解表劑》中的案例。癥狀描述為:「外感風寒表實證。惡寒發熱,頭身疼痛,無汗自喘,舌苔薄白,脈浮緊。」對應的重要處方為:麻黃湯,主要成分為:麻黃、杏仁、桂枝、炙甘草。
這種模式,也可以理解為一問一答的任務。癥狀描述就是問題,生成的處方就是答案。
聽起來簡單,但研究人員發現直接使用簡單的seq2seq模型時,並不能很好的完成這個任務。這也促使他們繼續研究,最後得到一個更好的多元化的模型。
這就是最後的模型架構圖。這個模型基於具有注意力機制的seq2seq模型基礎上,並且使用了覆蓋機制和masking來減少重複問題。
覆蓋機制是通過向解碼器添加覆蓋矢量來實現的。研究人員在進行推理時在輸出層添加了masking。
這個模型最後使用了PyTorch實現。
據說,這是首個用AI生成中醫處方的研究。
這也意味著,之前並沒有太多可借鑒的工作。實際上大部分中醫病例和處方都沒有數字化,已有的內容質量也不是很好。
所以,幾位研究人員最終選擇從中醫典籍里獲取數據,雖然這樣構建的數據集比較小,但是能保證處方質量。
然後就是一系列的實驗,過程就按下不表了。有興趣的同學,可以看看論文。反正最後的結論如下圖所示,最後一種方案在兩種數據集上的表現最好。
需要說明的是,為了簡化研究工作,這個項目只考慮了如何精準的生成處方中的成分,至於劑量等問題,並不在此次研究之列。
研究者也在論文中指出,希望他們的工作能為中醫相關的AI研究奠定一些基礎,能夠鼓勵更多的研究人員關注中醫治療自動化的問題。
腦洞一下,如果數據足夠多,未來應該可以訓練出一個AI老中醫。
可以可以。
最後說一下,這項研究的三位作者,兩位來自北京大學計算語言學教育部重點實驗室,一位來自北京中醫藥大學。他們這次研究的論文,可以在arXiv上查閱。
—完—
※又是AI+IoT!谷歌試圖收購物聯網公司Xively
※MIT通用人工智慧課視頻放出,要教你用工程方法構建人類智能
TAG:量子位 |