當前位置:
首頁 > 新聞 > 阿里入局智能音箱,爭奪智能家居語音交互入口

阿里入局智能音箱,爭奪智能家居語音交互入口

機器之心原創

作者:吳欣


亞馬遜、微軟、三星、谷歌、蘋果等公司都在爭奪智能家居交互入口的躍進道路上,巨頭圍獵之下,中國的大小公司所面臨的競爭激烈程度可見一斑,而更殘酷的可能是,到最後這會是一場 AI 技術之戰。

「整個科技的變革帶來新一次紅利,我們也在思考是否有比觸屏更好的交互方式,經過一段時間的研究,我們認為語言是下一代交互的自然方式。」阿里巴巴人工智慧實驗室負責人淺雪(本名陳麗娟)在發布會上說,「另一方面,智能音箱是一個產品線很長的產品,任何一個環節出現問題,整個音箱的體驗都會很差,這是阿里自己做音箱的重要原因。」

阿里入局智能音箱,爭奪智能家居語音交互入口

阿里巴巴人工智慧實驗室負責人淺雪

7 月 5 日,在位於北京鼓樓的時間博物館,阿里巴巴 Ai Labs 舉辦「未來,開口即來」新品發布會,宣布推出該部門第一款自主開發的智能音箱「天貓精靈 X1」,其售價僅為 499 元。如此前機器之心的報道,它能夠理解中文語音指令,通過語音交互實現購物、播放音樂音頻內容、玩遊戲、查天氣、問百科、充話費、控制天貓魔盒等功能,短期內僅面向中國市場發售。

作為淘寶網第一代產品經理,淺雪特別談到開發音箱的產品設計理念:「在家庭環境下使用的一款產品,不應該是外觀很大、只有大聲音的智能設備,這是我們對這款產品的第一個思考,另一方面,語音交互這種方式將無所不在,做得越來越小,才是語音交互助手終極追求方向。」

阿里巴巴智能音箱技術揭秘

根據現場介紹,天貓精靈 X1 採用了首顆為智能語音行業開發的定製晶元,在解碼、降噪、聲音處理、多聲道的協同等方面做了專門的優化處理。針對 AliGenie 需要進行大量音頻處理、聲音合成的工作環境,定製晶元加入了獨立的 NEON 處理單元,NEON 技術可加速音頻和語音處理、電話和聲音合成等,從而帶來更優秀的語音識別及音頻處理效果。值得一提的是,這款晶元面積減少 25%,功耗降低 32%,效率提高了 25%。

系統軟體方面,採用了一鍵聲波配網技術,這讓天貓精靈 X1 不到 10 秒就能連上網路。而配網對智能家居來說,非常有挑戰性,目前大部分產品配網時間平均大於 30 秒。

收音方案則採用了六麥克風收音陣列技術。在頂部的六顆高靈敏麥克風有助於收集來自不同方向的聲音,從而更容易在周圍的噪音中識別出有用的信息,來達到更好的遠場交互效果。據了解,思必馳作為項目合作方,在這款音箱中提供了環形六麥陣列、語音識別、語音合成、回聲消噪及語音增強等前端技術解決方案。

作為提升天貓精靈 X1 理解力、執行力和進化力的關鍵系統 AliGenie,集成了阿里巴巴積累多年的自然語言處理、人機交互等技術。淺雪介紹稱,「AliGenie 擁有用戶畫像、語境和上下文、同義詞、反義詞、上下位、口語化表達能力。我們通過數據演算法格式,以計算、演算法、數據三方面來呈現。計算層面使用了 FPGA 雲端硬體定製化邏輯電路加速,進行前端雲端聯合優化。在演算法方面,具備語音特徵表達能力,並首創了混合神經網路,AliGenie 也學習了強化和隨機策略。」從數據上看,憑藉阿里巴巴積累起來的一批獨有、海量的中文語料,AliGenie 目前認識的中文實體已經超過一億,但在維基百科上的中文實體還不到 1000 萬。

不久前,為天貓精靈 X1 提供技術支持的團隊也首次曝光了其自然語言處理成果。據了解,目前通過深度機器學習,天貓精靈 X1 已兼容 20 個領域的自然語義理解。

基於聲紋識別技術,天貓精靈 X1 實現了不少功能。首先,音箱能夠在家庭使用場景中識別 6 個人,並保證身份指向性,以提供良好的私密性。其次,用戶在發起購物、充值等需求時說出聲紋密碼,音箱就可以啟動聲音識別系統進行身份驗證,並在確認後完成交易。與亞馬遜 Echo 購物功能不同的是,前者支持用戶把商品加進購物車,而天貓精靈 X1 可以通過聲紋驗證直接支付。根據官方信息,阿里人工智慧實驗室正在對聲紋識別、聲紋購、NLP 中文對話引擎等核心技術申請專利。

下一代交互入口陷入混戰

至此,這場由亞馬遜帶動起來的語音交互中國巷戰,已經聚齊中國互聯網巨頭。除了通過自主研發與合作方式推出產品,也紛紛開放自己的技術與服務實施生態化圈地運動。

AliGenie 系統不僅支持天貓精靈 X1,還擁有一個開發者平台,將對開發者開放深度學習、自然語言處理、搜索 / 推薦演算法、知識表示及推理問答系統四個方面的核心技術。在分成方面,開發者可以獲得全部收益,平台在推廣期間不參與分成。

AliGenie 平台主要面向四種類型的開發者,包括內容開發者、應用開發者、智能家居開發商和硬體生產商。不同的開發者,可以通過 AliGenie 創建技能,提供更多的語音服務,如現場展示的應用 Keep。

事實上,阿里巴巴的優勢也包括內容和應用端,從淘寶網、天貓到支付寶等平台可支持的日常商業服務眾多。目前,該系統除了包括音樂音頻、兒童教育、家居控制等方面的應用入駐,該系統也接入 5 家酒店,並與美國最大玩具廠商美泰達成戰略合作,在智能家電方面支持 100 多個品牌。在這之後,阿里還會推出相關的阿里 AI 創新開發者計劃。

不久前,騰訊雲也推出騰訊雲小微智能服務系統,包含了硬體、skill、智能服務三大平台。與幾大巨頭中最早推出音箱產品叮咚的京東、更專註於開放語音交互底層技術的 DuerOS 相比,騰訊雲小微不僅僅聚焦在語音層面,服務於包括智能音箱在內的各類硬體產品以及機器人等,幾乎對標於 Amazon 的 Alexa。在此前機器之心的採訪中得知,除了飛利浦電視、親見家庭語音助手等已經亮相的產品外,其平台已經有 200 多家合作夥伴已經在陸續接入,在騰訊雲小微第一期「畢業生」中將有 30 多款針對不同場景的智能音箱與耳機、20 多款人形機器人、車載 HUD、大家電等產品,同時還有超市智能管理、樓宇監控對講等應用。而在騰訊公司執行董事劉熾平在接受《The Information》採訪時透露,騰訊正在研發一款智能音箱,或在八月份發布。

一批仍然不可忽視的玩家,也都在不斷加碼。利用先發優勢,京東與科大訊飛於 2015 年 8 月合作推出的京東叮咚也已經接入 100 多項互聯網服務並且擁有自主的開發者平台,服務夥伴包括中通快遞、e 袋洗、百度地圖、京東通信、JIMI 機器人、有道雲筆記。此外,叮咚還接入智能硬體平台——京東微聯,從而使用戶通過叮咚音箱的語音交互控制平台上的家電產品,包括生活電器、廚房電器、空調、可穿戴設備等。在 2017 年 6 月的亞洲消費電子展上,京東發布了叮咚智能音箱 Top 和叮咚二代,相比第一代產品,新產品新增了自定義喚醒詞、聲紋識別、第三方音箱擴展、多種發音人等功能。

除了互聯網巨頭,傳統 IT 廠商聯想集團也進軍智能音箱領域,在 2017 年 1 月,聯想在 2017 年國際消費類電子產品展覽會上發布智能音箱,共配置了八個 360 度遠場麥克風,並採用雜訊抑制與回聲消除技術,使其能夠接收 16 英尺(5 米)以外用戶的語音命令。聯想的智能音箱擁有兩個版本,國內版採用聯想研究院與思必馳共同研發的中文自然語義理解系統,能進行多輪語言自然互動。海外版則集成 Amazon Alexa 雲語音服務。

亞馬遜、微軟、三星、谷歌、蘋果等公司也都在爭奪智能家居交互入口的躍進道路上,巨頭圍獵之下,中國的大小公司所面臨的競爭激烈程度可見一斑,而更殘酷的可能是,到最後這會是一場 AI 技術之戰。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

運籌學專家葉蔭宇:在物流、零售與金融行業,優化演算法如何改變決策方式?
運籌學專家葉蔭宇:優化演算法如何改變決策方式?
百度宣布All in人工智慧:從AI生態到全資收購全亮點集錦
為什麼特斯拉比通用汽車更值錢?

TAG:機器之心 |

您可能感興趣

巨頭爭奪車載語音入口,智能汽車進入語音控制時代
戰火蔓延 從智能音箱到智能家居的風口爭奪
智能家居風頭正盛 語音助手成廠商爭奪焦點
欲與蘋果爭奪全球開發者 不做家電的華為入局智能生態暗戰
BAT入局,智能家居下半場迎來人與機器爭奪戰!
亞馬遜和谷歌爭奪智能音箱領導權 中國廠商奮起直追
酒吧業不再「動物兇猛」?拓寬流量入口與用戶爭奪還得靠互聯網化
智能冰洗開始成熟 蘇寧智能冰箱發力爭奪市場
三巨頭爭奪智能家居:蘋果押寶谷歌整合,亞馬遜玩封殺
智能晶元打響市場爭奪戰 已成為智能時代核心引擎
2018年「暗戰」開啟 智能門鎖爭奪智能家居入口
中國智能音箱爭奪戰,國外巨頭缺席BAT各有心思
智能概念降溫 廠商爭奪「健康」新風口
智能家居前景可觀,家居賣場現新爭奪
亞馬遜再踏智能手機市場是謠傳 爭奪流媒體視頻市場才是真相
與曼聯競爭 曼城加入博努奇轉會爭奪戰
谷歌將發布屏幕版智能音箱 與亞馬遜爭奪市場份額
喊了五年「客廳爭奪戰」,智能電視的競爭將逐漸趨於理性
智能物流爭奪戰逐漸白熱化 機器人成行業發展主角
亞馬遜如何贏得智能家居市場爭奪戰?