智能語音助手設備大熱,全球首款聲紋識別晶元及模組曝光!
在此次的CES2018展會上,眾多廠商紛紛發布了自己最新的技術和產品。毫無疑問,人工智慧(AI)是此次CES展會的一大熱點。NVIDIA公布全新的用於自動駕駛的AI晶元Xavier SoC;瑞芯微也發布了自己的首款AI晶元RK3399Pro;聯發科宣布推出NeuroPilot AI平台,主打跨平台終端人工智慧。與此同時,國內專註於聲紋識別領域的初創公司SpeakIn的聲紋識別晶元及模組也被曝光。而這也將是全球首款專用於聲紋識別的AI晶元和模組。
SpeakIn聲紋識別晶元及模組
據了解,SpeakIn推出的這款聲紋演算法模組集成了一顆微處理器,內存,雙路ADC和硬體降噪,前端AGC自動增益控制,硬體音頻編碼解碼器和WiFi 802.11 ac。更為關鍵的是,其中還集成了40GFlops聲紋驗算單元,搭載了SpeakIn的聲紋模型庫,可以在離線狀態下實現本地化的智能採集和驗證,更為快速和便捷。當然,如果是在線狀態下,還可連接SpeakIn雲平台,進行聲紋大數據檢索與比對,動態聲紋數據同步,提供端+雲的全方位解決方案。
此外,SpeakIn的這款聲紋演算法模組在介面方面也比較齊全,不僅集成了主流GPIO和高保真音頻介面,還支持千兆乙太網。
可以說,SpeakIn推出的這款聲紋演算法模組就是一個完整的可獨立運行的支持聲紋識別的小電腦,並且具備通用擴展性和前向支持能力。同時,整個模塊的功耗也非常低,據說僅2Wh。此外,模塊的體積也比較小,而且模組的尺寸和高度也是因為集成了內存晶元和嵌入了許多介面,而在實際應用中,這些介面是可以嵌入在硬體設備上的,所以模組的尺寸和高度都是也是可以根據需要進行調整的,非常便於集成。
我們都知道,為了推動語音識別的應用,眾多的語音識別廠商此前都有聯合晶元廠商推出自己的語音識別模組,或者推出自己的麥克風陣列方案,以提升語音識別的體驗,而這些動作也確實加速了語音識別市場的發展。同樣,隨著SpeakIn的這款聲紋識別模組的推出,也或將加速聲紋識別的普及應用。
聲紋識別將成語音人機交互的最佳身份認證方式
隨著語音/聲學以及人工智慧技術的發展,語音已經被認為是下一代人機交互關鍵技術(交互更簡單,更自然)。目前亞馬遜、蘋果、谷歌等海外巨頭,以及國內的阿里、百度、騰訊等眾多廠商都推出了自己的智能音箱產品,並且都集成了自己的智能語音助手。在此次的CES展會上,集成智能語音助手的設備可謂是隨處可見,可以預見語音交互將成為未來最為重要一種人機交互方式,與此同時聲紋識別技術也開始煥發出了新的生命。
首先,不論對於智能音箱這樣的家用設備,還是智能手機這樣的私人設備,用戶隱私及安全都是必須要考慮的問題。而在單純的通過語音交互的場景之下,傳統的指紋識別、虹膜識別,乃至於新的人臉識別等用於保護用戶隱私及安全的生物認證方式並不適用,也不便捷。比如我們對智能音箱說,「幫我來定個昨天中午一樣的外賣」,如果有了聲紋識別作為身份認證方式,那麼你通過這一句話就能夠完成整個訂餐及支付操作。如果沒有聲紋識別,那麼到了支付環節,可能還是需要通過智能手機上的指紋識別/人臉識別來完成認證的步驟,這顯然很麻煩。當然,我們也可以通過語音讀出密碼的方式來完成,但是這顯然不利於隱私保護。
其次,對於用戶來說,每個人都有不同的使用習慣和偏好,而智能語音助手則完全有能力在同一終端實現實現千人千面的個性化服務。通過聲紋識別來作為身份識別方式,則可以非常自然的實現身份的切換。比如,在家庭當中,當你對智能音箱說,「幫我定個昨天中午一樣的快餐」,同時你的哥哥也說「幫我也定一個昨天中午一樣的快餐」,注意這裡可能你們兩個人昨天中午定的快餐是完全不一樣的,如果有了聲紋識別,就能夠識別兩個語義完全相同的語音指令是由哪兩個人所發出的,然後根據這兩個人的不同的習慣(昨天中午這兩個人分別定的是什麼快餐),來滿足不同的需求。顯然,這樣的用戶體驗,是其他生物識別方式所難以實現的。比如人臉識別,確實可以實現同時對於多個用戶的身份識別,但是你要定個快餐,卻沒法直接通過人臉來下達指令。
另外,聲紋識別還具有一些其他生物識別技術所沒有的優勢。比如,聲紋識別是非接觸式的,可以通過語音傳遞進行聲紋信息,從而不用接觸到機器本身,就可以進行聲音識別。這兩個特點有使得聲紋識別可以應用在很多領域,比如可以進行遠程認證。
不過,聲音跟虹膜、人臉都存在同樣的受環境干擾的問題,比如人臉、虹膜會受到光學環境的干擾,而聲紋則會受到環境雜訊的干擾。當然在沒有光的情況下是可以用聲紋識別的,如果是不能開口的情況下,則只能用其他的識別技術。
可以說,如果未來語音將作為重要的人機交互方式,那麼聲紋識別則將是與之相匹配的最佳的身份認證方式。
雖然目前生活當中,聲紋識別似乎接觸的很少。但是,實際上,我們所熟悉的很多產品以及應用都已經開始加入了聲紋識別功能。
比如去年推出多款智能音箱產品其實都有加入了聲紋識別。蘋果iPhone 7之後的語音助手Siri也加入了聲紋識別功能。今年6月,騰訊推出Qrobot小Q機器人第二代也採用了聲紋識別技術,而這款產品的聲紋識別技術就是由SpeakIn所提供的。
當然,就目前來說,相比指紋識別、人臉識別、虹膜識別等生物識別技術來說,傳統的單純基於雲端的聲紋識別技術還存在著一些不足,但是通過推出專用的聲紋識別硬體模組,在終端側進行部署,通過邊緣計算+雲端人工智慧的方式,將會極大提升聲紋識別的準確率和實用性。期待SpeakIn能夠給我們帶來不一樣的體驗。
作者:芯智訊-浪客劍
※3D攝像頭大戰開啟:高通攜手奇景、展訊攜手豪威,pmd聯手舜宇!
TAG:芯智訊 |