搜狗發布「個性化語音識別」技術,語音輸入將更懂用戶
近日,搜狗輸入法發布新版本,發布「個性化語音識別」服務,用戶只需更新後點擊APP選擇一鍵登陸賬戶,即可體驗。成功開啟「個性化語音識別」後,用戶選擇搜狗語音輸入按鈕,可以發現輸入法已強化學習了用戶的個人辭彙。據了解,該功能將有效提升用戶個性化特色詞句的語音識別準確率,降低用戶在輸入過程中的手動修改次數。
搜狗率先在語音輸入領域實現「個性化識別」
得益於能解放雙手的便捷性,語音輸入自面世以來就備受大眾青睞。但如何實現「聽懂」用戶,並快速、準確的呈現出用戶「所說」,一直是語音輸入領域面臨的一大技術難題,尤其是對極具用戶個人屬性詞句的精準識別。比如,用戶需要的是「劉也、梓軒、程志」,語音輸入後得到的很可能是「劉燁、子萱、誠摯」……諸如此類未基於用戶個人特色針對性語音識別的結果,往往需要用戶再費時費力手動調整,反而在一定程度上損害了語音輸入的用戶體驗。
針對這一問題,搜狗語音此次率先推出「個性化語音識別」,可基於其大數據及領先的AI(人工智慧)語音技術的支持,構建起個人化、個性化的用戶專屬輸入法服務,從而大幅提高「個人高頻辭彙」的識別精準度,降低用戶的手動修改率。
可以說,憑藉「個性化語音識別」,搜狗率先在語音輸入領域真正實現了「更懂用戶」,切實提升了每一個用戶日常生活中表達、傳遞信息的效率。
滿足你語音輸入的更多需求,搜狗攻克「技術堡壘」
對於語音識別技術而言,目前市面上能夠見到的語音輸入產品和工具,在通用場景下的識別準確率基本都能「聽懂」用戶;但因為準確率一旦達到一定高度,相對再每提升百分之一都要面臨極大的技術難度。
目前,搜狗通用語音識別已經全面使用了行業前沿的深度學習技術,其中基於DTSS(Deep Transformer-based Sequence to Sequence model)的端到端聲學模型、神經網路語言模型和智能標點預測等技術,有效推動了搜狗語音識別的通用效果和體驗,這在行業中處於領先水平。此番,「個性化語音識別」可以針對用戶的語音輸入習慣精準優化,從而使得在保障通用識別準確的情況下,用戶常用語的字錯誤率相對下降近40%。極大的減少了修改成本,可謂是攻克中文語音識別這一「技術堡壘」至關重要的一步。
搜狗之所以能率先實現「個性化語音識別」,主要原因有二:一是用戶大數據的沉澱與積累,二是搜狗本身就保持領先且持續快速發展的AI技術。
首先,搜狗輸入法擁有大數據優勢,這是搜狗語音輸入識別的「護城河」,也是其他企業及產品難以比及的地方。以此為基礎,搜狗通過大數據挖掘處理,使得語音識別準確率大幅提升。在提升識別準確率的同時,搜狗語音創新式的技術流程,讓雲端系統極大程度上保證了用戶個性化特徵的自動處理速度,實現整個學習個性化特徵的過程在「毫秒級別」就可以全部自動完成。
其次,搜狗AI技術蓬勃發展,一方面,不僅擁有以語音交互為核心的人工智慧平台「搜狗知音」,使得搜狗在語音識別、語義理解等方面具備領先優勢,另一方面,其業界領先的語音修改能力、智能斷句、標點預測、識別結果順滑,以及成績斐然的自然語言處理技術都能更好地幫助提升「個性化語音識別」的準確率。
個性化語音識別將帶來全新產品門類,顛覆傳統「人機互動」
語音識別一直是人機交互、人工智慧鏈接傳統產業的一項關鍵性技術,直接影響著未來社會的智能化發展進程。因為在智能家居、智能教育、智能醫療等與用戶日常生活息息相關的各個產業領域,讓智能設備「聽懂」我們說話是實現自然交互的先決條件。
當前,語音識別已基本實現「出口成章」。此次搜狗的「個性化語音識別」,可謂再次撕開語音識別技術瓶頸,增加了行業對於人機交互實現「千人千面」的信心。未來,搜狗語音將會持續提高和完善語音輸入識別技術,持續優化「個性化語音識別」服務。相信隨著語音識別技術的不斷突破和用戶個性化內容的不斷豐富,搜狗或將形成「消費級」的語音個性化生態資源,全面實現定製化語音輸入。從而使每個用戶都能使用 「更懂自己」的搜狗語音識別技術,在生活、出行、工作中大幅提升人機溝通效率,幫助人們表達和獲取信息更簡單。
※NASA為新一代火星探測器設計機械臂,耗時5年,科研功能強大
※Facebook腦機介面研究最新成果:實時解碼佩戴者所說內容
TAG:智東西 |