小米又發新品!智能音箱二次大戰開打
2月20日,小米9發布會上,除了2999元的小米9年度旗艦手機和TFBOYS小鮮肉王源外,最受關注的就是小愛觸屏智能音箱,這是小米在2017年7月31日入局智能音箱以來的第一款帶屏智能音箱。
之所以要帶屏,是因為小愛音箱希望可以滿足一些特定場景,比如時鐘、電子相框、與智能門鈴交互時彈出視頻對話框,也支持追劇、刷網頁、看股票,小米官方稱之為「小電視」。
智音三強已全部帶屏
小米不是第一家做帶屏智能音箱的玩家。2018年3月26日百度發布國內首款智能視頻音箱「小度在家」,搭載DuerOS,支持聽歌、追劇和視頻通話。
今年1月天貓精靈通過眾測的方式,發布了帶屏智能音箱天貓精靈CC。
三家發布帶屏智能音箱的玩家,正是中國智能音箱第一陣營的三強。幾乎在同一時間,美國研究公司Strategy Analytics發布了《2018年第四季度全球智能音箱市場報告》,報告顯示,2018年4季度,亞馬遜、谷歌智能音箱全球出貨量與市場份額繼續全球領先,阿里列全球第三位,4季度出貨量280萬台;百度和小米出貨量分別為220萬台和180萬台,分別位居全球四、五,超過蘋果。Canalys等機構的報告同樣表明,天貓精靈、百度小度和小米小愛是中國智能音箱三甲。
2019年智能音箱行業的看點就是帶屏智能音箱。Strategy Analytics總監David Watkins在報告中寫到:
「智能屏幕受到消費者的歡迎——他們被音頻和視覺刺激的結合所吸引,智能屏幕在2018年Q4佔總出貨量需求的10%以上,預計到2019年它們將成為市場增長的重要推動力。」
在這樣的需求趨勢下,智能音箱玩家紛紛推出智能屏幕就不難理解。
現在,國內智能音箱三巨頭全部都已發布帶屏智能音箱,有屏幕的智能音箱可以在語音外增加更多交互方式,進而滿足更多場景,完成更多任務,獲取更多用戶。
帶屏智能音箱這個說法看上去很矛盾,肯定有人會質疑,既然是音箱,帶什麼屏幕?帶屏幕了,憑什麼還叫音箱?在我看來,核心原因在於智能音箱的核心不是「音箱」,而是「智能」,智能音箱不是傳統音箱的智能化,而是一個全新物種,能否帶屏、帶屏能否叫音箱,市場說了算。
智能音箱二戰將爆發
從各種智能音箱報告可以得出一個清晰結論:正處於高速增長的智能音箱,已接棒智能手機和智能電視,成為第三智能設備品類。Strategy Analytics的報告就顯示,4季度全球智能音箱出貨量增長95%,達到3850萬台,超過2017全年總出貨量,2018年全年總出貨量達到8620萬台。
從絕對值來看,8620萬不小,IHS Markit預計2018年全球電視出貨量達到2.23億台,同比增長3.5%,其中智能電視佔比70%,作為核心定位也是客廳的智能設備,智能音箱出貨量距離智能電視已越來越近,今天每個客廳都有一台智能電視,很快每個客廳都會有一台以上的智能音箱。
正是因為此,智能音箱市場儘管尚處於增長率95%的藍海階段,競爭卻已十分激烈。雖然1月18日蘋果HomePod正式在中國發售,但中國市場事實上被本土智能音箱玩家瓜分,阿里、百度和小米構成了三強,BAM對智能音箱都有公司級重視,投入力度只會增加不會減少。
- 百度李彥宏多次親自發布小度音箱,春晚紅包大戰直接送出10萬台;
- 天貓精靈負責人直接向張勇彙報,每逢雙11都會進行高補貼的大促沖銷量;
- 在20日的小米9發布會上,雷軍明確小愛音箱已成為小米AIoT的戰略樞紐產品,小米手機+AIoT雙引擎由1+4+X的戰略組成,1是手機,4中第1個就是小愛音箱。
在阿里、百度和小米穩坐三強的情況下,很多玩家尚未死心,作為未來客廳最重要的互聯網入口,有野心的科技巨頭遲早都會對智能音箱戰略布局。
前幾天被傳出已停止聽聽智能音箱項目的騰訊,一直給外界感覺缺乏對智能音箱的戰略重視,正如我前幾天接受36kr採訪時提到的:騰訊在移動端擁有微信這一超級入口,對於其他入口需求不迫切,因此對智能音箱的態度更多是試水,聽聽也好、叮噹也罷都沒有清晰的定位。不過,不排除騰訊接下來會戰略重視智能音箱,針對聽聽項目停止的傳言,騰訊就已回應:
「在智能音箱這條產品線上,在新型號叮噹帶屏音箱發布上市後,還將會繼續保持先前聽聽產品的正常的銷售與服務不變。叮噹團隊還將深度結合CSIG 業務,面向行業輸出全棧語音人工智慧解決方案能力,以及叮噹智能屏產品系列的開發。」
幾乎同一時間,喜馬拉雅和獵豹移動這兩家都擁有智能音箱產品的巨頭也有新消息:喜馬拉雅出資3000萬,收購了獵豹系的獵戶星空公司的AI語音識別團隊以及小豹AI音箱技術團隊。與此同時,兩者聯合成立北京小雅星空科技有限公司,喜馬拉雅作為大股東占股65%,獵戶星空占股35%。兩家對智能音箱都沒死心,但喜馬拉雅更重視了。
在喜馬拉雅、獵豹、騰訊外,京東、科大訊飛等互聯網公司都有布局智能音箱。手機公司則是另一派系的玩家,小米、榮耀和鎚子均已推出智能音箱,OPPO推出語音助理智能音箱已在傳言中。傳統音箱巨頭不會眼睜睜看著市場被智能音箱奪走。眼下智能音箱音質比較低端,但當它們有一定市場地位後,就會通過挖人等方式走專業音箱路線,智能化是傳統音箱大廠的必走之路。
可見,三分天下不是智能音箱市場的終局,「百箱大戰」後,智能音箱二戰即將開打。
得AI技術者得天下
為什麼智能音箱三強是阿里、百度和小米?最直接的理由是三家戰略重視,捨得花錢補貼,虧本甩賣,消費者買不了吃虧買不了上當,願意一試。但深層次來看,我們會發現AI技術才是決勝點。
為什麼AI技術對智能音箱至關重要?因為智能音箱的核心價值是「智能」,要能通過語音跟用戶交互,這比普通的語音輸入法或者手機語音助理要難得多。
- 首先智能音箱要能隨時被快速喚醒,又不能頻繁被錯誤喚醒,客廳空間很大,音箱距離用戶往往很遠,聲音環境複雜,挑戰大。遠場語音識別是技術核心也是技術難點。
- 其次智能音箱要聽清用戶命令也不容易,客廳雖然相對安靜,但也有廚房、洗衣機、馬桶、小孩、寵物、電視等噪音;
- 再次智能音箱要理解用戶的自然語言命令,老人、小孩、方言這樣的挑戰也不少;
- 最後,智能音箱如果帶屏,就要多模交互,用戶會問「我手裡拿著的是什麼」這樣的複雜問題。
因此,沒有足夠強的AI技術,根本玩不轉智能音箱。智能音箱鼻祖亞馬遜今天依然是全球老大,作為一家電商巨頭,它給Echo智能音箱的語音助理Alexa配置了超過2000人的團隊,來研發智能語音交互技術,一家電商巨頭願意這樣做投入,讓人嘆為觀止,AI技術對智能音箱的重要性不言而喻。
沒有金剛鑽,別攬瓷器活,中國智能音箱三強,在AI技術上均有各自優勢。
阿里天貓精靈由曾經隸屬於阿里雲的AI實驗室打造,依託阿里雲多年的數據、技術和場景積累,以及阿里巴巴達摩院千億級投入下,阿里巴巴在AI上已經形成自己的優勢,擁有ET大腦系列AI開放平台,在多個行業落地。
百度的AI技術優勢也十分明顯,戰略押注AI的百度認為自己是AI公司。百度自然語言處理、機器視覺和語音等技術優勢明顯,其中DuerOS立志成為語音交互的Android,給小度音箱打下了堅實的AI技術基礎,甚至可以說AI技術是小度音箱的最大長板。
相對而言,小米在AI技術上的布局晚了一些,提出AI+IoT戰略是不久前的事情,去年四季度百度在智能音箱上後來居上,正是因為此,小米在強化自有AI技術的同時,開始求助外部強援。2018年最後一天,小米旗下兩款智能音箱開始支持召喚微軟小冰;這次發布的小愛觸屏智能音箱,終端側的語音信號處理和喚醒技術,來自於明星AI創業公司地平線,後者擅長在終端側結合晶元做演算法優化,就語音技術而言,抗噪能力和喚醒能力都有獨特優勢,最終體現在小愛觸屏智能音箱的交互體驗上,其在雙麥克風陣列設計下抗強雜訊干擾,錯誤喚醒率大幅降低,小米請「外援」也側面證明了AI對智能音箱的重要性以及技術門檻之高。
其實不只是小米,即便是百度、亞馬遜這樣的自詡AI技術強大的巨頭,也有求助外援的時候。百度做智能音箱前收購了一家專門做喚醒詞的公司KITT.AI,2018年發布的渡鴉智能音箱喚醒方案由其提供。亞馬遜Echo有外部方案商如LinkPlay,LinkPlay在去年引入前面提到的地平線的技術,以更高效地適配產品場景,地平線擁有獨特的軟硬體結合方案,基於定製的晶元做語音和視覺演算法,更好地滿足智能設備語音和視覺交互的場景,在行業內影響力日盛。
像喜馬拉雅這樣收購專業團隊,或者像小米這樣引入專業外援,會成為智能音箱玩家們補齊關鍵技術短板的主要手段。
語音交互將無處不在
智能音箱大戰只是智能語音大戰的鋪墊。
在5G即將普及後,在智能手機進入存量時期後,在IoT即物聯網爆發後,智能語音會成為越來越多智能設備的標配交互模式,正是因為此,今天巨頭們爭奪智能音箱的本質,是在爭取與用戶的「對話權」,搶佔用戶的耳朵和嘴巴。未來智能門鎖、智能電視、智能汽車等智能設備都會具備語音交互能力。
萬物互聯時代,大量的設備亟待語音交互能力,這意味著大量的送水人機會。
- 首先,五花八門的智能設備很多都是傳統設備廠商,如門鎖、家電、家居、安防廠商,它們不可能去自主研發AI技術,只能求助外援;
- 其次,智能設備的語音交互場景更複雜,對技術要求更高,比如功耗、成本、集成、喚醒等,甚至需要針對性的解決方案,這同樣需要靠外援;
- 最後,智能語音交互不只是簡單的語音識別,還需要大量的互聯網服務和內容來滿足用戶,這又不是傳統設備廠商可以做到的事情。
解決辦法只有一個,就是找外援,智能語音交互時代的外援將有兩個類型,一類是百度代表的雲服務平台類,一類是地平線這樣的邊緣計算服務商。
百度DuerOS是一個旨在幫助萬物具備語音喚醒和交互能力的系統,不只是支持智能音箱,還支持智能家居、智能車載等形式各異的設備;騰訊叮噹將依託CSIG面向行業輸出全棧語音人工智慧解決方案能力,CSIG是騰訊組織架構調整後負責B端產業互聯網的部門;阿里有ET系列大腦,巨頭都是提供平台/系統/介面,輸出標準化的能力和服務,各家智能設備接入即可。
地平線則代表著另一種思路,即做終端側解決方案。與雲端服務商不同,地平線瞄準了AI終端側處理的趨勢,終端側AI延時極低,在自動駕駛、車載設備等場景下優勢明顯,在智能家居等場景下可提升體驗。地平線通過「晶元+演算法」結合的邊緣計算,幫助智能設備在終端側擁有更強的AI交互能力,比如語音演算法內存開銷小、計算效率高,低功耗、低成本、易集成。
地平線服務的不只是小愛音箱這樣的智能家居設備,也提供全車音頻解決方案。地平線做自動駕駛起家,旗下Matrix自動駕駛計算平台為L3和L4級別的自動駕駛提供高性能的感知系統,已向世界頂級自動駕駛廠商大規模供貨,車載音頻解決方案是其智能駕駛業務的一部分。
地平線還沒有自己的語音晶元,被小米相中證明其演算法實力被行業認可,未來地平線很可能會將語音演算法、晶元和機器視覺結合起來,給智能設備提供綜合終端側AI交互能力,這是單純依靠雲計算實現不了的。而且智能家居和智能車載等智能設備將面臨更嚴峻的隱私安全問題,終端側邊緣計算有望一定程度回答這一問題,就像iPhone X 的FaceID全部放在硬體端做以確保隱私安全一樣。
類似地平線的面向行業的AI外援還有很多,相對於巨頭而言,它們更像是解決方案提供商,可以提供個性化的智能交互方案,可以在特定的點上做得更好,它們不做自己的智能設備,與智能設備只有合作沒有競爭關係,中立性強,也是一大優勢。
長期來看,地平線這樣的終端側AI服務商和百度這樣的雲端AI平台,會是協作而不是競爭關係,AI雲端均不可或缺,大家會從不同維度去幫助智能設備具備更強的智能交互能力,加速IoT時代的到來。