谷歌想用AI幫言語障礙者「說話」數據集是最大挑戰

科技 07-19

近幾年AI領域對於殘障人士的關注越來越多，企業和技術專家致力於通過AI賦能信息無障礙。日前在「Google Solve with AI」活動上，Google AI產品經理介紹了Google AI在針對聽障和言語障礙患者人群推出的應用新進展和覆蓋情況。

據Sagar Savla介紹，目前全球有 4.66 億人患耳聾或聽力障礙，這一數字在 2055 年可能會增加至 9 億。聽力受損使得人們很難與周圍的世界溝通交流，這是人類社會中一項嚴峻的挑戰。

而語音識別 (speech recognition) 功能Live Transcribe的出現，就是為聽障人群解決現實問題。該功能可以實時自動轉錄對話，讓人們參與到原本無法參與的對話中。

目前，Live Transcribe應用程序支持超過70種語言,通過在手機屏幕上把現實生活中的語音轉錄為文本，幫助耳聾和聽障人士與他人溝通。

此外，言語障礙患者也是一個較大的群體。Google AI 產品經理Julie Cattiau在接受新浪科技採訪時提到，Google今年啟動的Euphonia項目，正在通過招募志願者，積累更大的殘障人士語言資料庫，希望最終幫助所有的言語障礙患者進行交流。

據悉，該功能通過為言語障礙患者建立語音識別模型，和能夠識別其他溝通方式( 如手勢,眨眼等)的基於計算機視覺的模型，讓機器去理解他們說話的方式，用AI語音技術幫這些患者「說話溝通」。

在活動現場，Julie Cattiau通過一段視頻，展示了通過該功能，可以相對準確地讀取出有語言障礙人士的表達。

不過，要讓AI讀懂言語障礙患者的表達，也存在一定的挑戰。Julie Cattiau在採訪中表示，現在一般的語言識別已經有大量的數據了，有很多人在使用這個平台。但是在Euphonia這個項目中，其實沒有太多人參與，很多有語言障礙的人很少願意來參與。目前，正在通過招募很多言語障礙患者志願者，讓他們朗讀一些辭彙，積累表達，這樣就能建立一些數據。

「這些數據實際上沒有那麼多，雖然我們在語音識別方面取得了很大的進展，但依然存在這樣的挑戰」，Julie Cattiau坦言。

語音識別對於患有某些健康狀況的人來說是一項至關重要的技術，但許多產品即使在最理想狀態下也表現平平。

據了解，通過和這些非營利組織的合作，Euphonia項目團隊需要記錄更多患者的聲音，然後將這些聲音來訓練人工智慧，從而創建能夠識別這些語音的演算法和頻譜圖。

目前，由於沒有人收集到足夠大的數據集，語音識別技術可能不適用於有語言障礙的人士，而這將是Euphonia著手研究的部分。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 Linux資訊速推 的精彩文章:

※基於Debian 9.9的Emmabuntüs DE2-1.04 發布
※全新編程語言V發布

TAG:Linux資訊速推 |