一家獨大到三足鼎立,是誰限制了智能語音的發展
12月初發布的《2017-2018中國智能語音產業白皮書》顯示,2014年至2018年,中國智能語音產業規模由30億元增長至159.7億元,增速高達530%。雖然,科大訊飛和百度分別以44.20%和27.80%佔據市場份額前兩位,但仍在這一不斷極速擴張的浪潮中不斷迎來新晉者的挑戰,而產業格局也正在悄悄發生變化,向更多極化發展。
智能語音市場的「三大拍案驚奇」
中國的智能語音市場很怪,明明每家企業都說自己的產品準確率很高,但是誰也不敢明確自己就是第一。不但沒有統一的數據標準,就連自己的測試標準也完全不公開,成為一大拍案驚奇;
拍案驚奇二,雖說各家做語音的時間有長有短,然而技術層面並沒有拉開差距。久到深耕行業近二十年的科大訊飛,近到語音行業新秀雲知聲、依圖科技,同樣都在數據方面達到了一個相似的百分比。綜合技術數據和應用效果來看,各家企業非但沒有拉開明顯差距,連究竟孰高孰低竟也不太好分辨;
拍案驚奇三,與市場的一片繁榮相比,智能語音產品非常繁雜,但使用體驗、終端用戶的接受程度和商業市場的變現能力卻一直和行業預期存在差距,特別是消費者似乎對於智能語音產品並不感冒,這並非是使用習慣一個方面的原因。
智能語音市場正迎來「三足鼎立」新格局
作為大哥和二哥的訊飛和百度,既然無法短時間內解決「三大拍案驚奇」,市場會自然的引入新力量來平衡和解決怪現象。而在短期內可以看到的變化,即是智能語音市場將會迎來「三類玩家」新格局:乾的最早的訊飛,家底最厚的BAT,以及實力黑馬的新秀。
玩家一:「大師兄」科大訊飛
跑在第一名的,永遠會有被趕超的壓力。在智能語音領域,科大訊飛就是這樣。作為中國智能語音的奠基者,訊飛以19年的行業深耕,做出了大量的數據積累和行業經驗,使其在中文語音合成、語音識別、口語評測等多項技術上都擁有國際領先的成果。
但百密一疏的是,訊飛並沒有用技術和應用成果,打造出有效的行業壁壘,並以「老大哥」的身份樹立中文智能語音行業的標準,構建明確的行業准入門檻。否則,可能也就不會有憑藉體量優勢來彌補技術上差距去硬搶老二位置的百度了。
玩家二:流量派BAT
憑藉在互聯網時代積累的大量資本,BAT在每個科技領域都可以稱為「玩家」。但是,與依靠人工智慧技術起家,做應用,打市場的AI垂直類企業不同,BAT更多的是以流量導向和滿足龐大用戶群體驗和創新需求為導向去做AI開發。更形象點來說,在AI這個領域,AI垂直企業是「技工貿」企業,而BAT是「貿工技」企業。
既然有如此差別,那麼就可以很清晰的看出,以流量和用戶體驗為導向的BAT解決的是錦上添花的市場需求,並非雪中送炭的強需求,通俗來說BAT玩語音可能不會很認真。
玩家三:技術黑馬依圖、雲知聲
最近,AI公司依圖科技,宣布進入語音市場,並且在最權威的中文數據集AISHELL-2中達到了96.29%的準確度,成為業內第一個敢於亮出測試數據集標準的企業,並且用「實力」而不是「數字」領先所有其他廠商。
依圖科技科學家認為:語音識別的準確程度存在著兩條「紅線」,代表著實際應用的兩道門檻。一條為字錯率15%的紅線,超過這條紅線,應用的感受度極差,可以稱作不可用。而另一條則是3%的紅線,小於這條紅線的水平在實際應用可以滿足大部分的日常需要,而目前距離這條紅線、尤其是在複雜場景的情況下,還相距甚遠。
智能語音從技術突破開始,到應用、終端和場景的不斷突破,再到回歸技術,漸成業內共識。應用、終端和場景帶來的大量應用數據,更為機器學習、深度學習帶來了技術突破的充分土壤,這也是為什麼以依圖科技為代表的技術型公司能夠在智能語音領域快速趕超的原因所在。同時,語義識別的加入、知識圖譜的構建和技術的快速迭代,也為智能語音技術進入3%紅線、甚至達到更高識別率帶來可能。
雲知聲創始人梁家恩也認為,目前還沒有一個較為成功的語音產品,真正的語音產品尚未出現。國外諸多廠商如谷歌,蘋果也都認為語音行業的發展和變現還有很長的路要走。
技術,場景與流量,是決定整個語音領域走向的三大要素:技術決定場景應用的革新性和深度,場景決定資本和應用的流向,流量決定整個行業發展的廣度。對行業水平的三個拷問一方面指出目前行業的存在的不確定性,另一方面解決三個問題也將為行業的發展帶來新的機遇。
在語音識別發展的道路上,老玩家與新黑馬必會在全新的賽道上一較高下,而決定這場比賽勝負的關鍵,也許就在今天行業的浪潮之中。
※廣度深度都要,亞馬遜是如何推動 Alexa 內生成長的?
※回顧:Drive.ai 、文遠知行WeRide、51VR,三大視角解讀自動駕駛模擬
TAG:雷鋒網 |