真正千人千面、個性化定製的「法器」:聲紋識別技術
在物聯網、人工智慧技術越來越發達的時代,很多生活中原本習以為常的場景都悄然發生了變化。在線購物、掃碼支付、共享單車、隨身穿戴、語音交互……在越來越便捷的社會,我們告別了原本繁雜的工序和步驟,開啟了更為便捷的現代生活。
伴隨著互聯網的蓬勃,人們開始面臨一個非常困擾的問題,充斥在互聯網上的信息如海洋般豐富,如何快速查找到適合我們的信息呢?——千人千面的個性化定製應運而生。
說到千人千面,最為用戶熟知的恐怕要屬今日頭條。依託先進的大數據技術,為不同年齡、不同性別、不同愛好的用戶推薦不同的新聞內容,打造新聞資訊的千人千面,成為越來越懂你的新聞資訊客戶端,也博得了一大批用戶的喜愛。
數年前智能電視崛起,顛覆了傳統電視的形態,搭載智能操作系統和視頻內容,能按照用戶意願下載各種第三方app,極大程度上拓展了電視的娛樂功能,延伸了家庭電視的內涵,給萬千用戶帶來更為新穎的視聽體驗。隨著技術的發展和人工智慧概念的應用,眾多電視系統開發者不滿足於僅有的「操作系統」,而是花費了更多心思用於「智能」操作系統的研發。這些「智能」操作系統不僅可以下載安裝各種APP,而且擁有語音交互、在線購物、人臉識別、視頻通話、AR等功能,在此基礎上,進一步實現了視頻內容的千人千面和個性化定製,將周到的服務體驗轉嫁到了電視層面。
那麼問題又來了。很多業內人士都對智能電視的個性化定製提出了疑問。電視的家庭屬性非常強,一台電視屬於爺爺奶奶、爸爸媽媽、兒子女兒,電視該如何判斷此刻是誰在使用,該怎麼為不同的家庭成員推薦不同的內容,從而實現真正意義的個性化定製。
基於現有技術水平和電視機本身的構造,要實現能夠識別用戶的個性化定製,方式主要有兩種:一是通過外置攝像頭,達到識別人臉的效果;二是通過話筒,實現聲紋識別。
今天我們主要說一下聲紋識別。
在普通大眾眼中,聲紋識別和語音識別是兩個很容易混淆的概念,其實二者有著很大的區別。語音識別的重點在於「聽得懂說什麼」,聲紋識別的重點在於「聽得懂是誰說」。聲紋識別是一種基於人類「生物特徵」的身份辨認方法,與指紋、唇紋、虹膜等一樣,也被稱為「活體密碼」,擁有極高的安全性,例如微信就採用了聲紋作為密碼驗證。
為什麼聲紋識別有著越來越廣闊的前景呢?最主要的原因是,能夠使用語言是人類與動物最主要的區別之一,語言也是人類生活中最廣泛的溝通方式,最天然的溝通入口,因此人類要訓練機器,讓機器擁有聽懂和表達語言的能力,不但要聽懂「說什麼」,還要聽懂「是誰說」,如此一來,人工智慧便能成為人類的工具,服務於人,所以聲紋識別成為物聯網時代的風口之一。
目前聲紋識別技術的工作流程主要有兩種,一種是「1對1」,可以用於密碼驗證、身份驗證等場景,比如微信語音密碼;另一種是「1對多」,這種技術比「1對1」更為複雜,因為它可以精準識別到每一位不同用戶,依賴的是機器學習和深度神經網路,從而為更廣闊的場景服務創造了無限可能。
與人臉識別所需要的攝像頭相比,聲紋識別只需要一個麥克風,如果在電視或智能家居設備上配備,顯然其成本因素更為低廉,因此也更容易受到廠商青睞。
除微信語音密碼驗證外,聲紋識別已經開始在智能電視或智能音箱上使用。比如9月20日暴風電視剛剛發布的AI2.0,「進一步深化對用戶行為數據的收集,充分沉澱用戶的使用習慣,完成對用戶行為和聲紋的分析,實現精準化內容推薦。針對不同的年齡段,不同性別的人群按需推薦內容,滿足不同用戶在家庭場景中個性化需求。」
在暴風電視的現場演示中,通過語音喚醒暴風大耳朵後,它可以根據聲紋識別出此刻正在收看電視的具體用戶,從而為該用戶推薦合適的視頻內容,這不但增加了人與設備之間的溝通,也更符合人類語言行為習慣,讓機器更懂人類,向人工智慧邁進新的一步。
除構建智能化場景服務外,聲紋識別還可用於銀行安保、身份驗證、公安破案等具體場景,為大眾帶來更方便、安全的生活服務。
當然,聲紋識別也不是萬能的,和其他技術一樣,也存在很多局限性。例如專業級別的技術門檻,只有擁有一定專業知識的技術人員才能實現聲紋識別功能;再例如周圍環境的噪音問題、嘈雜的現場、數人同時說話、遠場語音識別等難題,這些問題的解決絕非一朝一夕,而是需要在長久的行業磨合中,逐漸摸索出一條全面而完善的聲紋識別道路,「路漫漫其修遠兮」,相信在不久的未來,聲紋識別一定會像如今的指紋識別一樣,被大眾接受、普及。
※蘋果又放大招!OLED、QLED有望「合體」,或將改變顯示行業格局!
※趙麗穎真的戀愛了!男方居然是「渣男」馮紹峰?兩人酒店共度良宵
※張傑分享「人生五味」故事《男子甜點俱樂部》秒變治癒系節目
※「隱形富豪」杜海濤跨界做電視!到底是噱頭還是另有玄機?
TAG:ZNDS智能電視網 |