語音實時變文字 搜狗推速記工具搜狗聽寫
語音記錄,是記者、編輯、作家等文字工作者們常用的記錄方式。但是,對於記錄者來說,語音並不方便後期的整理、分享和追溯,這也導致聽語音記錄的過程耗時耗力,影響信息的溝通。近日,搜狗推出語音實時變文字的速記工具「搜狗聽寫」,解決會議、採訪、寫作等場景下長語音內容轉寫難題。
搜狗語音交互技術中心總經理王硯峰
為了保證在各種複雜場景下都能精準轉寫,搜狗聽寫採用了大量的前沿技術。在轉寫方面,搜狗聽寫使用了搜狗知音獨家研發的長時語音轉寫技術,並與業內領先的端到端深度神經網路技術深度整合,使得語音識別準確率保持在較高水平。據了解,搜狗聽寫的功能相當強大,可以支持寫文章、採訪錄音、會議記錄、筆記整理 、日常記事等場景,幫助用戶實現高效記錄和信息輸入。而且針對不同場景和需求,搜狗聽寫可以支持「聽寫」和「轉寫」兩種模式。在「聽寫」模式下,錄音的同時即可實時給出識別結果,話音落文字出,幾乎沒有時間差;而「轉寫」模式下則可以離線錄音,錄音完成後一次性獲取文字結果。同時,為了提高文字整理效率,搜狗聽寫還貼心的加入了邊聽邊改、無線標重點、多端同步、信息分享等人性化功能,大幅度提升記錄效率,讓文字編輯更輕鬆。此外,在針對圖書館、咖啡廳等不便於大聲說話而又有使用語音的場景,搜狗聽寫提供耳語識別技術,在人的說話音量低至30分貝時,依然可以準確識別。
搜狗公司語音交互技術中心總經理王硯峰表示:「搜狗聽寫作為一款多場景的語音聽寫工具,其產品的關鍵在於語音識別準確率,而通過大規模的優質語音訓練數據和深度學習的技術能力積累,搜狗也將這種語音識別的技術優勢轉化到了更多的適用場景中。」
目前,搜狗已經建立了強大的語音自研團隊,擁有互聯網規模最大的語音數據。每天超過2.6億次的語音請求,為搜狗智能語音系統提供了海量的真實語料數據,使得機器不斷學習,識別準確率越來越高,可應用的場景也越來越廣泛。此次推出搜狗聽寫產品,是搜狗語音深入用戶垂直場景下的又一個全新探索,通過更加專註於特定的場景和人群,去理解用戶需求、解決實際問題,從而讓語音技術為更多人所用。綜合搜狗在人工智慧上的產品布局,我們可以清晰的發現,讓人工智慧更「接地氣」,已經成為搜狗在人工智慧領域的獨特標誌。
※依舊是聯發科!魅藍Note 6本月23日來襲
※重磅回歸 VAIO品牌攜手京東重回中國市場
※夏普美人尖AQUOS S2發布 完美全面屏
※美人尖美出眾 夏普AQUOS S2現場圖賞
※BlackBerry KEYOne國內發布 配置升級價更低
TAG:機情社 |