搜狗成立AI創新聯盟,開放聽寫服務啟動錄音筆變革序幕
2019年8月28日,搜狗公司舉行了以「全新「聲」態,AI未來」為主題的搜狗聽寫服務開放暨AI創新聯盟發布會。會上,搜狗將其核心技術能力 「搜狗聽寫」服務開放,並宣布與愛國者、Newmine紐曼、索尼錄音筆、萬城集團四家錄音筆行業頭部企業成立AI創新聯盟。
從1930年磁帶的的發明並且被用於記錄聲音開始,錄音設備的發展經歷了1970年的數字錄音與存儲變革,1990年隨身數碼形態變革,以及90年代末快閃記憶體技術出現後體積進一步縮減開始以「筆」的形態出現,每一代技術以及產品的進化都促成了錄音設備形態以及性能上的極大提升。但是到了2000年以後,隨著消費電子產品的出現,錄音設備相關技術的發展彷彿卻停滯了,甚至於開始出現被手機錄音搶佔市場的情況。
伴隨著搜狗此次與四家錄音筆行業頭部企業共同成立AI創新聯盟,這一舉措或許能夠為傳統錄音筆行業帶來一些新的變化。
打通搜狗輸入法,提供個性化轉寫服務
目前,搜狗輸入法語音請求峰值已超7億次,穩居全球最大的中文語音應用,依託於此,搜狗聽寫服務背後的轉寫技術已處於行業領先地位,其實時語音轉寫運用了搜狗自研的延遲可控的Adaptive Attention-based端到端建模技術,非實時語音轉寫功能使用業界領先的深層Transformer-based端到端語音識別技術,語音轉寫準確率可達95%以上;在語音增強方面,搜狗自研的Smart Voice麥克風陣列演算法能夠對雜訊和混響進行多重深度優化,確保人聲的高保真還原。在智能輔助編輯方面,搜狗語音轉寫可以通過雲端智能糾錯編輯技術,基於詞圖搜索和輸入糾錯模型,針對置信度低的轉寫結果提供多個候選詞,幫助用戶對轉寫結果進行糾正,同時還具備了良好的自動區分說話人、智能文本順滑和標點預測等能力,可以為用戶提供更多便捷功能。
憑藉其強大的語音技術以及優秀的軟硬體結合能力,搜狗今年3月份推出了AI錄音筆C1,其轉寫準確率高達95%以上,並且擁有實時互譯、雲端分享、中英同傳等多種AI功能,極短時間內就在多個電商平台取得了單品銷量第一的成績,可見搜狗語音轉寫技術已經得到了市場的檢驗和認可。此次發布會上,搜狗又推出升級版AI錄音筆炫彩版,滿足用戶更多元化、更時尚的需求,同時將AI錄音筆背後經過市場檢驗的「搜狗聽寫「服務體系開放出來,進而引領整個錄音筆行業的AI化變革,這正是搜狗踐行其AI戰略的一次有效嘗試。
值得一提的是,本次搜狗聽寫服務實現了與搜狗輸入法的打通,這不僅為聽寫服務帶來了流量和數據上的巨大優勢,同時更是搜狗輸入法「表達信息更簡單」使命的延伸,也是搜狗聽寫服務相比其他語音轉寫平台的優勢所在。
目前搜狗輸入法在PC端佔有99%的市場份額,在手機端用戶日活超4.5億,搜狗聽寫服務基於搜狗輸入法的用戶使用習慣,能夠自動構建個性化識別網路,使用戶常用語錯誤率下降40%。搜狗開放聽寫服務後,可以為市場上90%以上的錄音筆產品提供接入服務,讓所有有需求的用戶享受「錄音1小時,出稿5分鐘」的極致體驗。
5G時代,表達與信息獲取將更簡單
作為一家以「讓表達和獲取信息更加的簡單」為使命的企業,搜狗長期聚焦於如何在最短的時間內以更高效便捷的方式讓用戶準確獲取有效信息。服務於這一宗旨的,搜狗對於未來的關注以及布局也主要圍繞這一使命展開。
活動開始,搜狗CEO王小川在介紹搜狗公司AI戰略的時候表示:「伴隨著人工智慧、5G等技術的發展,未來的表達將更加的簡單,甚至於會出現由當下主流的文字、圖片、語音結合的主流方式直接走向依靠視頻傳輸的視覺類溝通,交流越來越簡單將會成為常態。」
錄音的本質還是在於對關鍵信息的備忘或者保存提取,而這自然涉及到一個信息梳理以及整理的過程。相比與語音文件,文字信息更加的能夠讓人快速的獲取信息並且形成條理化的備忘框架,所以將錄音內容整理成為文本信息就變得極為關鍵。但是由於技術的限制,目前行業內人工語音轉文字的成本太高,所以通過人工智慧技術實現語音轉文字的方式反而成為了很好的代替選項。
目前,在智能語音技術領域,國內主要以科大訊飛、雲知聲、思必馳、搜狗等企業為代表。區別於前幾家以AI技術為主的企業,搜狗的優勢更在於其AI業務的發展是基於已有的搜索引擎、輸入法等互聯網產業遷移完成的,通過輸入法使得其擁有更多的用戶基數以及演算法訓練樣本。
王小川表示:「AI時代,信息科技的發展將會朝著自然交互和知識計算兩個方向發展。自然交互主要是通過語音、圖像、視覺等技術的綜合運用實現交互方式的呈現以及表達,而認知計算則是基於認知科學,實現準確的信息理解以及計算反饋。」
目前,搜狗在自然交互以及認知計算方面均有布局,搜狗的AI合成主播不僅集成了語音、文字、視頻等多方面的交互技術,而且還結合唇語識別等技術實現了表情的同步以及配合,讓交互更加的符合自然交互的理念。目前搜狗AI主播不僅僅有央視主播這一運用落地案例,而且還結合打造了全球首個AI俄語主播,司法領域的AI法官等落地運用。
而在認知計算領域,搜狗不僅打造了國內首個跨語種交流和內容獲取的搜狗機器同傳產品,而且搜狗立知系統還通過語義理解、推理、知識圖譜等多項技術實現了從搜索到問答的過度,特定長尾問題能夠實現搜索只展示一條信息並且精準匹配答案的能力。
伴隨著此次發布會,搜狗與錄音筆行業的幾家頭部企業達成AI創新聯盟,促成搜狗人工智慧、語音文本處理等領域的技術以及資源能力下放,這對於錄音筆行業的商業模式來說也是一次重大的顛覆和升級。聯盟的達成將使錄音筆行業從以硬體為主的單一收益模式向硬體 服務的多種收益模式轉變,促進錄音筆行業實現全面智能升級,與AI創新深度融合。
通過AI錄音筆創新、開放搜狗語音轉寫服務、建立AI創新聯盟,搜狗正從產品、技術與產業鏈三個方向,引領著錄音筆行業進入AI時代。
TAG:億歐網 |