當前位置:
首頁 > 科技 > 靈隆科技魏強:百箱大戰不是技術秀場

靈隆科技魏強:百箱大戰不是技術秀場

如果說2017年是人工智慧元年,那麼發生在今年的百箱大戰,或許證明了人工智慧應用與落地的最佳方式——智能音箱。究其原因,或許是由亞馬遜的Echo千萬級的銷量引爆的風口,或許是BAT巨頭的參與帶動的行業熱潮,又或者是內容產業所尋找的更多的應用場景。

總有一批行業先行者在風口來臨之前開始布局。2015年,京東聯合科大訊飛成立了靈隆科技,並推出第一代叮咚音箱,成為國內智能音箱行業的先行者,時隔兩年多的時間,靈隆科技在9月13號發布了叮咚智能音箱的第二代產品。

在此次新品發布之前,IT耳朵做了獨家產品評測,隨後也進行了行業分析,對叮咚第二代音箱有了深入的了解。最近,IT耳朵應邀專訪了靈隆科技的CEO魏強,了解到在百箱大戰的形勢下,叮咚2代產品背後的故事。

魏強,2000 年畢業於西安交通大學,2004 年獲得日本京都大學工學博士學位。現任靈隆科技的CEO,在靈隆科技成立之前,曾任松下電器音視頻產品總監、京東智能集團產品總監、期間主持了智能家居、藍光 DVD、智能家庭私有雲等多款產品的研發工作。長期從事音視頻產品研發工作,具有豐富的人工智慧、圖像語音技術及相關產品研發經驗。

背靠大樹的天然優勢

叮咚音箱是京東與科大訊飛聯手打造的第一款智能硬體產品,兩大巨頭聯手的背景無疑讓其天生驕傲。

成立於1999年的科大訊飛,是中國最大的智能語音技術提供商,18年的技術積累,使它在中文語音合成、語音識別、口語評測等多項技術上擁有國際領先的成果。科大訊飛在人工智慧領域的布局非常廣泛,智能音箱是科大訊飛在智能硬體領域最重要的落地應用。

而京東作為國內3C類電商平台,迄今為止已經成立近20個年頭,隨著智能化的發展,京東搭建的JD Alpha平台,為硬體終端、智能家居、軟體應用等提供了開放性埠。同時京東無疑也是叮咚音箱最好的銷售平台。

技術和平台的強有力支撐,使叮咚音箱的起步看起來更有底氣一些。魏強告訴IT耳朵介紹了三方的「分工」模式,科大訊飛主要提供前端的語音識別等核心技術,京東是主要的銷售平台,靈隆科技負責技術如何應用、落地,實現產品化的整個流程。

基於用戶需求為產品做減法

在聊天的過程中,不難發現叮咚音箱推出的第二代產品中的亮點所在。

一方面,自定義音箱喚醒詞。當談及這一功能的設計靈感,魏強回憶道,當初,我們的產品研發團隊設計了上百個喚醒辭彙,最後由近200名用戶投票選出「叮咚叮咚」、「百靈百靈」、「小薇小薇」三個喚醒詞。當叮咚音箱一代推出以後,收到大量的用戶反饋,希望能夠根據個性化、多元化的需求自定義喚醒詞, 滿足不同年齡階段的用戶需求。

目前市面上音箱的喚醒詞大多是四字音節,叮咚智能音箱可以將其設置為四至六個。但是,魏強告訴IT耳朵記者,「從演算法角度而言,喚醒詞中包含足夠多的音節,母音、輔音並行,起伏明顯,從語音識別會更容易些,四個音節也更能夠保證喚醒的正確率。」

另一方面,叮咚2代是國內第一款可以撥打電話的智能音箱,跟傳統手機連接藍牙音箱通話完全不同,也不需要另外接SIM卡。叮咚智能音箱的一位用戶給自己的外公送了一台叮咚智能音箱,並且拍攝了一段體驗視頻,視頻中的老人,直接對音箱說「叮咚叮咚,給XX打電話」,就能夠直接撥打手機通訊錄中的聯繫人。

其實,這款叮咚音箱最大的不同在於基於用戶的需求做了很多減法,服務與體驗最能體現一款音箱的品質所在 。魏強表示,叮咚的技術從來不是用來秀肌肉的。靈隆科技只把最成熟的技術和功能給客戶。其中大家能感知的表現有兩點:

多輪語音對話,因為叮咚認為現在這個技術是不成熟的,再家庭場景下會有很多誤喚醒和語義識別不準的問題,還沒有達到可用的程度。所以我們開放了測試模式的AIUI僅作為體驗項目。

聲紋識別。因為聲紋識別目前行業安全性不夠,我們沒有開放聲紋支付等相關功能,後期相關應用也會集中在個性化推薦等。而支付我們則採用了更成熟的貨到付款和小額免密的解決方案。基於京東平台的優勢這些方案是成熟可用的。

對於聲紋識別的應用,魏強博士強調:「目前,叮咚音箱的聲紋技術不強調應用於購物場景,而是把內容做好,針對家庭成員年齡層次的區分相對明顯的家居環境,使音箱能夠認識用戶,並且通過記錄用戶的習慣、喜好,根據用戶的聲紋針對性的推薦他感興趣的歌曲、信息等。」

畢竟,用音箱購物還不能成為一種習慣,更不是剛需。而音箱搭載的內容卻是用戶關注的重點,據了解,叮咚音箱在內容版權上和百度音樂、有聲讀物、喜馬拉雅等內容平台達成了深層次的合作,通過後台數據的直接打通,保證了音頻數據的數量和質量。

除此之外,叮咚音箱的細心之處還體現在對不同年齡層次用戶的語音識別上。對於發音略弱、且摻雜方言表達的老人而言,叮咚音箱能做出準確的回應。另一方面,叮咚音箱從對孩子的語音識別方面做了兩點優化,一是由於孩子的聲帶發育不完整,靈隆科技在研發過程中,通過採集不同年齡段的孩子發聲的樣本,建設了小朋友的聲學模型;另一個是基於小朋友還沒有連續的表達能力,加強了模糊識別的功能。

之所以在意這些細節上的處理,因為在家庭應用場景中,老人和孩子同樣是智能音箱的使用者,而且頻率很高。

百箱大戰是件好事

對於目前的百箱大戰,魏強說道:「我覺得這是件好事兒,不斷有玩家進入,一方面催熟了這片市場的快速發展,另一方面,使智能音箱作為一種全新的產品形態及交互方式,對市場和用戶也起到了一定的宣傳、教育作用,提高用戶的知曉度與接觸度。」

智能硬體前幾年湧現過不少風口,無論是智能手環(手錶)也好,還是VR眼鏡也好,這些產品到最後都逐漸在市場中冷淡。其中原因之一,是投機者進入,產生劣質產品導致極差的用戶體驗。

對智能音箱的未來,魏強持樂觀態度,他說:

「整個智能音箱的前段語音技術、產品製造、再到後台各種服務的接入,是一個複雜的、較長的產業鏈條,並不是傳統音箱加語音模塊的簡單合成。我們更希望以團結合作的心態共同做好智能音箱產業,更多的是產業鏈方面的合作。從內容服務到硬體到語音識別技術整個產業鏈上下游共同協作。」

這或許也是智能音箱行業,我們能夠期望的最好發展方式。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT耳朵 的精彩文章:

更新了iOS 11這些功能會讓你的手機更費電
金立宣布切換全面屏 首款機型M7將投入10億元品牌營銷,人人車獲滴滴出行2億美元投資
虛擬女友泛濫,你我從此都是同「道」中人
零度智控史聖卿:人工智慧和無人機的晉陞之路
從首席架構師到雲服務創業,范維肖和他的易碼雲天

TAG:IT耳朵 |