當前位置:
首頁 > 最新 > 世界盃激戰正酣,如何讓TA們迅速寫完病歷好好看球?

世界盃激戰正酣,如何讓TA們迅速寫完病歷好好看球?

四年一度的世界盃,是球迷們的狂歡節

龍蝦、啤酒、好友小聚

無疑是世界盃期間最讓人憧憬的時刻

話說前幾天正在觀戰時

小編在後台突然收到一條留言:

「我是個醫生!也是個球迷!

我想問AI什麼時候可以幫忙寫病歷啊!

一天工作完了還有很多電子病歷要寫,

全部搞完身體已經被掏空

看不動球了……」

了解科大訊飛的小夥伴一定知道,訊飛醫療多模態輸入方案,提供以智能控制滑鼠、醫療定製台式或無線麥克風為硬體,醫療語音輸入法為軟體的一體化輸入套件,通過語音輸入生成電子病歷。病歷錄入的效率可提升4倍。讓醫生從繁瑣的文書工作中「解脫」出來,不再熬夜寫病歷,愉快回家看球!

原廣州軍區廣州總醫院在5個科室的試點應用了訊飛醫療多模態輸入方案,識別率均能達到96%以上,對此,該醫院還總結出《語音識別技術在電子病歷中應用的難點及對策》一文,並發表在《中國數字醫學》雜誌上。詳情請查看學術 | 智能語音技術在電子病歷中的應用

言歸正傳,下面我們以訊飛醫療多模態輸入方案為例來詳細講講,我們是如何克服語音在電子病歷中應用的難題,讓醫生又好又快地通過語音進行電子病歷錄入的。

「聽音辯位」的神奇耳朵

訊飛醫療多模態輸入方案——醫療台式麥克風硬體

醫護人員使用專業級的指向性麥克風,配以四麥或雙麥陣列降噪演算法,利用醫療語音輸入系統提供的語音識別、自然語言理解等人工智慧技術,以口述的方式敘述醫學文書內容,並在醫生工作站實時智能展現,幫助醫護工作人員方便準確、高效地完成醫學文本錄入。

麥克風陣列,大家可能不是很熟悉,它相當於人的兩隻耳朵。如果人只有一隻耳朵,也許能聽見聲音,但是卻損失了一項重要功能的靈敏度——辨別聲音的方位。兩隻耳朵的最重要功能就是能夠聽音辨位,這是一項重要的仿生應用呢。

醫療多模態輸入系統-醫療無線麥克風

環境嘈雜?它只專心聽你的!

當醫生和患者溝通,或者在醫生工作站,各醫生互相交流的時候,如何避免把背景說話聲錄進來?

科大訊飛對採集到的音頻語音,使用混合訓練和基於深度回歸神經網路降噪解混響結合的方法。即一方面對乾淨的語音進行加噪,並與乾淨語音一起進行混合訓練,從而提高模型對於帶噪語音的魯棒性;另一方面,使用基於深度回歸神經網路進行降噪,提高帶噪語音的識別正確率。

但僅僅考慮在語音處理過程中的噪音,是治標不治本的,如何從源頭上解決降噪似乎才是問題的關鍵。面對這一難題,科大訊飛通過在錄音設備上加入多麥克陣列,進行降噪。具體來說,就是使用四個麥克風采集四路時頻信號,利用卷積神經網路學習波束形成,從而在目標信號的方向形成一個拾音波束,並衰減來自其他方向的反射聲,可以進一步顯著的提高帶噪語音的識別正確率。經過多輪驗證測試,選定調整參數,讓4麥麥克風可以在主說話人左右60度夾角內拾音,夾角外區域的人聲都會極大的被過濾掉

這是麥克風降噪前後的聲音波形圖:

通過剝離環境噪音,讓主說話人聲音收錄更清晰

麥克風降噪前後的音頻

醫學術語?它沒在怕!

「124/80mmHg」「 降鈣素原0.81ng/mL」等這些醫學辭彙可以通過語音輸入嗎?

沒問題的!醫療多模態輸入方案內置百萬級醫學辭彙,覆蓋醫院各科室病歷術語和醫學文獻資料。此外,系統定期抓取、更新醫學知識語料,定期整理醫學書籍,目前醫學訓練文本有幾百G,用於模型訓練。針對每家醫院部署和每個用戶使用,設計對應的定製方法,包括服務端熱詞、用戶級替換等功能,保證覆蓋度的同時,也保證個體的識別準確度。

除此之外,輸入系統具有識別內容順滑功能,即剔除識別結果中的停頓詞、語氣詞、重複詞,使文本更易於閱讀。科大訊飛通過使用泛化特徵並結合雙向長短時記憶網路建模技術,使得內容順滑的準確率達到了實用水平。

方言口音?它聽得懂!

在語音錄入的時候會有一些方言口音,系統能聽得懂嗎?

當然可以!科大訊飛通用領域的識別,能精準識別帶有口音的方言,為人機交互帶來質的飛躍。2014年以來,訊飛輸入法通過人工智慧技術增強方言的表達,已經支持23種方言。

在醫療領域,我們也彙集了眾多語言學家和醫護人員組織採集數據,對醫療領域方言識別方面持續定製優化,擁有業界領先的帶口音普通話的普適模型。

另外每家醫院使用後,在徵得院方同意的前提下,對一些口音重的醫護人員採集針對性的語音訓練集,進行精細化的標註。這種標註工作訊飛每天都在持續進行,方言口音的識別效果也將越來越準確。

多音字?它分得清!

腦nǎo梗gěng塞sè

腦nǎo梗gěng塞sai

這類的多音字,模糊詞,它能識別出來嗎?

對於多音字問題,我們將多音字字典中常見的多音字逐一和我們訓練詞典的字進行比對,並補充未覆蓋的多音字的發音。但是對於醫學領域使用,除了單個字的多音覆蓋外,增加了一些多音詞的多種拼音標註。比如腦梗塞(nao3geng3se4、nao3geng3sai1);還有一些詞是為了容錯,還特意增加一些用戶已經習慣的錯誤發音(容錯),如:氯化鈉(lv4hua4na4、lu4hua4na4)等。

目前,訊飛醫療多模態輸入方案已經在中國人民解放軍總醫院、上海瑞金醫院、廣州軍區廣州總醫院(陸總)、武漢市中心醫院、安徽省立醫院、合肥市第一人民醫院等91家醫院試點應用。其中,排名前100的三甲醫院,我們覆蓋了26家。

為了獲得真實的用戶反饋,我們進行了前後兩次滿意度問卷調查,滿意度從38.8到45.8(滿分50分),訊飛醫療多模態輸入方案獲得了越來越多用戶的高度認可。

GIF

除了醫療多模態輸入方案,訊飛智慧醫療也推出了語音電子病歷產品,通過訊飛領先的人工智慧語音識別、自然語言理解技術,結合專業級的定向麥克風,讓醫生在進行診療的同時實現病歷的結構化錄入,病歷錄入的效率可提升4倍,識別準確率高於98%,也是醫生電子病歷錄入的「小幫手」。

快速完成文書工作、愉快觀看世界盃的神器你GET到了嗎?科大訊飛一直致力於用智能語音和人工智慧賦能醫生,構建醫生+人工智慧的夢之隊。

未來,不止能讓醫生抽出空來看世界盃,我們將不懈努力,讓醫生從80%的事務性工作中解脫出來,從而專註於更有價值的醫療服務


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 科大訊飛 的精彩文章:

3秒就「落地成盒」?AI可能比你更會玩遊戲

TAG:科大訊飛 |