搜狗發布「個性化語音識別」技術，語音輸入將更懂用戶

科技 08-12

近日，搜狗輸入法發布新版本，發布「個性化語音識別」服務，用戶只需更新後點擊APP選擇一鍵登陸賬戶，即可體驗。成功開啟「個性化語音識別」後，用戶選擇搜狗語音輸入按鈕，可以發現輸入法已強化學習了用戶的個人辭彙。據了解，該功能將有效提升用戶個性化特色詞句的語音識別準確率，降低用戶在輸入過程中的手動修改次數。

搜狗率先在語音輸入領域實現「個性化識別」

得益於能解放雙手的便捷性，語音輸入自面世以來就備受大眾青睞。但如何實現「聽懂」用戶，並快速、準確的呈現出用戶「所說」，一直是語音輸入領域面臨的一大技術難題，尤其是對極具用戶個人屬性詞句的精準識別。比如，用戶需要的是「劉也、梓軒、程志」，語音輸入後得到的很可能是「劉燁、子萱、誠摯」……諸如此類未基於用戶個人特色針對性語音識別的結果，往往需要用戶再費時費力手動調整，反而在一定程度上損害了語音輸入的用戶體驗。

針對這一問題，搜狗語音此次率先推出「個性化語音識別」，可基於其大數據及領先的AI（人工智慧）語音技術的支持，構建起個人化、個性化的用戶專屬輸入法服務，從而大幅提高「個人高頻辭彙」的識別精準度，降低用戶的手動修改率。

可以說，憑藉「個性化語音識別」，搜狗率先在語音輸入領域真正實現了「更懂用戶」，切實提升了每一個用戶日常生活中表達、傳遞信息的效率。

滿足你語音輸入的更多需求，搜狗攻克「技術堡壘」

對於語音識別技術而言，目前市面上能夠見到的語音輸入產品和工具，在通用場景下的識別準確率基本都能「聽懂」用戶；但因為準確率一旦達到一定高度，相對再每提升百分之一都要面臨極大的技術難度。

目前，搜狗通用語音識別已經全面使用了行業前沿的深度學習技術，其中基於DTSS（Deep Transformer-based Sequence to Sequence model）的端到端聲學模型、神經網路語言模型和智能標點預測等技術，有效推動了搜狗語音識別的通用效果和體驗，這在行業中處於領先水平。此番，「個性化語音識別」可以針對用戶的語音輸入習慣精準優化，從而使得在保障通用識別準確的情況下，用戶常用語的字錯誤率相對下降近40%。極大的減少了修改成本，可謂是攻克中文語音識別這一「技術堡壘」至關重要的一步。

搜狗之所以能率先實現「個性化語音識別」，主要原因有二：一是用戶大數據的沉澱與積累，二是搜狗本身就保持領先且持續快速發展的AI技術。

首先，搜狗輸入法擁有大數據優勢，這是搜狗語音輸入識別的「護城河」，也是其他企業及產品難以比及的地方。以此為基礎，搜狗通過大數據挖掘處理，使得語音識別準確率大幅提升。在提升識別準確率的同時，搜狗語音創新式的技術流程，讓雲端系統極大程度上保證了用戶個性化特徵的自動處理速度，實現整個學習個性化特徵的過程在「毫秒級別」就可以全部自動完成。

其次，搜狗AI技術蓬勃發展，一方面，不僅擁有以語音交互為核心的人工智慧平台「搜狗知音」，使得搜狗在語音識別、語義理解等方面具備領先優勢，另一方面，其業界領先的語音修改能力、智能斷句、標點預測、識別結果順滑，以及成績斐然的自然語言處理技術都能更好地幫助提升「個性化語音識別」的準確率。

個性化語音識別將帶來全新產品門類，顛覆傳統「人機互動」

語音識別一直是人機交互、人工智慧鏈接傳統產業的一項關鍵性技術，直接影響著未來社會的智能化發展進程。因為在智能家居、智能教育、智能醫療等與用戶日常生活息息相關的各個產業領域，讓智能設備「聽懂」我們說話是實現自然交互的先決條件。

當前，語音識別已基本實現「出口成章」。此次搜狗的「個性化語音識別」，可謂再次撕開語音識別技術瓶頸，增加了行業對於人機交互實現「千人千面」的信心。未來，搜狗語音將會持續提高和完善語音輸入識別技術，持續優化「個性化語音識別」服務。相信隨著語音識別技術的不斷突破和用戶個性化內容的不斷豐富，搜狗或將形成「消費級」的語音個性化生態資源，全面實現定製化語音輸入。從而使每個用戶都能使用「更懂自己」的搜狗語音識別技術，在生活、出行、工作中大幅提升人機溝通效率，幫助人們表達和獲取信息更簡單。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 智東西 的精彩文章:

※NASA為新一代火星探測器設計機械臂，耗時5年，科研功能強大
※Facebook腦機介面研究最新成果：實時解碼佩戴者所說內容

TAG:智東西 |