智能語音市場突圍迎來爆發點,誰是下一個破局者?
2019科創高峰論壇,席位有限速來佔位
黑馬智庫,創業必讀
每一輪科技浪潮的興起,最先受益的往往是金融行業。自然,人工智慧的快速發展,也沒能逃過這一定律。2018年初,恒生電子推出的一款名為「曉鯨」的智能機器人正式登陸央視財經頻道《交易時間》。
作為一款金融智能投資助手,曉鯨通過語音交互的方式可以為投資者提供全方位的金融信息,獲得了眾多投資者的高度關注。
同年11月份,第五屆世界互聯網大會上出現了全球第一個「AI合成主播」,該「主播」不僅突破了以往只能單純創造語音圖像合成的技術瓶頸,還配合語音輸出實現了唇部模模擬人的效果,觀眾看到的真實度得到了極大提升。
從智能機器人到人工智慧主播,隨著技術的提升,應用場景的增多,人工智慧行業已經開始展露頭角。同時,眾多機構對其未來發展也呈現出了極大的信心。
據中國信息通信研究院數據顯示,2017年,AI市場規模達到了220億元,預計其將以48%的年均複合增速發展,2020年將達到710億元。其中,智能語音在中國人工智慧市場中的份額佔22%,即48億元。
同時,IDC也曾在2018年10月份的報告中預測,中國對話式人工智慧市場規模在2022年有望達到78億人民幣,2018-2022年之間,其市場份額將以57%的複合增速增長。
對此,不少業內人士表示,中國在智能語音領域的發展有可能會超越西方國家,其根本原因在於,中國企業級用戶和消費級用戶的應用體量在發展的過程中,將會隨著場景的深耕而呈指數級增長。
正如標貝科技CTO李秀林所說,在某些語音交互場景中,通過科技手段,正逐步實現用戶心目中的想像,使得人們對於智能語音的接受度不斷提高。基於此,越來越多的場景正在被發掘。
應用場景凸顯
「您好,這裡是xx廠家,我們最近正在搞活動,原價1999的產品現在只賣699元......」。
在不久前,很多人在對面的機器客服還沒有說完的時候,已經迫不及待地掛掉了電話。想必大家對這種電話已經司空見慣,但是,這些情況正在發生變化,傳統的人工客服比例在近些年呈現出明顯下降的趨勢,取而代之的是智能客服。
比如,我們現在打中國移動或者是一些大型企業客服電話,第一步接電話的多是智能客服,在智能客服沒辦法解決的情況下,才會把用戶導向人工客服。
並且,隨著技術的提升,智能客服涉及的行業越來越廣且呈現出趨勢化發展。據第三方機構Gartner發布的相關評估報告顯示,到2020年,全球85%的呼叫中心將進行數字化變革,而人工智慧無疑是其中最被人看重的技術力量。
這種智能客服之所以能夠大規模應用,根本原因則在於它可以有效降低企業用工成本。正如李秀林所說,「專業的客服在服務質量上會比AI系統做得好,但是,專業客服人力成本的不斷攀升,給企業帶來了不小的挑戰。
同時,人工智慧技術在快速發展,技術水平在迅速提升,在某些領域或場景中甚至接近以假亂真的程度了。因此,越來越多的企業在逐步利用AI技術進行部分替代,在盡量不影響用戶體驗的情況下,降低相對簡單場景下的人力成本」。
其實,不僅僅是成本,工作時間、效率、情緒以及主觀理解方面存在的差異,都是制約整個客服行業快速發展的關鍵因素。而智能語音的出現,會將人力從繁重的機械性回答中徹底解脫出來,在降低成本、提高效率的同時,讓客服變成更有溫度、為用戶帶來更高價值的個性化服務。
此外,智能客服也在逐漸融入保險、教育、物流等多個行業,智能客服取代傳統的人工客服正在成為一種發展趨勢。而智能語音的逐漸普及也在慢慢改變用戶思維,生活中越來越多的場景開始涉及到智能語音。
最常見的則是我們在做家務時:「Siri,放首周杰倫的《告白氣球》」;在開車時,對著智能語音系統:「開啟回家路線導航」;到家後,對著智能音箱:「**,播放一個郭德綱的相聲」,等等。
其實,人們生活中存在太多無法或者是不願意利用眼睛獲取信息的碎片化時間了,而智能語音的出現正在逐漸填補人們這些碎片化時間。
從企業到用戶,智能語音的場景正隨著技術的應用而逐漸實現普遍化。
初創企業逐漸浮出水面
場景應用的普遍化,促使整個行業開始從初期向成熟期快速邁進。雖然蘋果、科大訊飛、百度等佔據了市場近7成的份額,但是,隨著應用場景的拓寬,整個市場規模會不斷擴大。而市場不斷擴大的前提,除了場景的不斷挖掘,還要有足夠多的企業參與其中,為行業發展注入更多新鮮的血液,尋求更多的發展空間。
其中,成立於2016年的標貝科技,在3年的時間內服務了BAT在內的50多家企業、服務範圍覆蓋20餘個領域,憑藉著個性化的語音合成整體解決方案及數據服務成為了促進行業不斷擴大的中堅力量。憑藉數據、技術、解決方案的優勢,標貝成為了為數不多的完成A輪融資,並且與國內多個領域的巨頭進行合作的企業。
從數據服務型公司升級為語音合成技術整體解決方案公司,多年深耕沉澱下來的優質數據功不可沒。領先的數據處理能力,不僅開創了TOBI國際標註體系在中國商業領域運用的先河,還憑藉著提供高質量、準確快速的數據服務,快速搶佔了市場上多個行業巨頭客戶。
「AI就是數據加上演算法加上算力這三駕馬車,好的數據對於這些能做研究的公司來說是非常根本、非常基礎的。如果數據不好,即便演算法再好,它所呈現的效果也不會太理想。所以說,我們在數據質量這塊的把控非常嚴苛」。在談及標貝的數據時,李秀林這樣說道。
擁有了數據處理能力的深厚基礎,標貝通過演算法 專業的人工數據處理方式,使得其語音合成技術不僅達到了可以媲美真人的地步,還自主研發了一整套的TTS測評系統,幫助客戶在短時間內找出問題、原因和解決方法。其打造的「聲音超市」,已經可以利用系統化輸出,滿足不同行業客戶在不同場景下的個性化需求。
截止到目前,標貝參與的項目已經多達百項,連續三年保持翻倍盈利。而之所以能夠在短時間內取得如此大的突破,除了與數據、技術有著不可分割的關係外,人才也成了助力標貝發展的「加速器」。
標貝聯合創始人兼CTO李秀林,中國科學院博士,曾在松下、百度、滴滴等公司工作,有過10餘年語音相關技術研發和學術研究經驗。此外,整個核心團隊在語音行業積累的十五年經驗,也成了標貝近些年快速發展最堅實的「底氣」。
在需求中提升競爭力
場景的落地應用,促使越來越多的企業窺見了語音合成「降本增效」的效果。基於此,越來越多的企業想要利用語音合成技術降低人工處理比例、在高峰期依舊能夠應對突發的各種情況,進而實現低成本、高效率的彈性運維。
但是,對於中國大量的中小型企業來說,自行研發TTS系統不僅成本高、周期長,並且與很多創新型企業相比,不具備技術優勢。因此,越來越多的像標貝科技這種專門為企業提供語音合成解決方案的公司開始被關注。
截止到目前,標貝不僅與百度、阿里、網易等國內50多家巨頭達成了合作,還獲得了極其看好人工智慧行業發展的恒生跟投的5000萬A輪融資。
在標貝科技CEO劉博看來,大公司涉足智能語音領域,往往需要做全棧技術,而創業公司傾向於專註某一方面,比如技術,它的針對性會更強。而且,標貝在發展的過程中,通過客戶的反饋不斷優化服務流程,已經能夠幫助眾多企業部署更成熟的解決方案和後續服務。
標準化輸出,滿足用戶需求
當用戶需求已經出現的時候,企業「產品」只有實現標準化才能同時兼顧規模化複製和成本降低,這不僅是標貝作為解決方案服務公司所追求的,也是眾多企業級客戶提升競爭力的一個重要因素。只不過,與多數普通產品不同的「解決方案」又是否能夠實現標準化輸出呢?
「其實,我們現在就是標準化輸出,比如我們的合成系統、我們的演算法,都有一個標準化框架,我們給客戶部署的時候也是標準化的流程,比如他需要哪個聲音,我們給他部署上就OK了,這也是我們打造聲音超市平台的目的之一」。
「聲音超市」是一個可以供用戶隨時挑選、所聽即所得的聲音平台。對於客戶來說,通過標貝推出的聲音超市平台自由挑選聲音意味著在明確自己需求的前提下,可以快速實現聲音的挑選、合成以及落地場景化應用。這個速度有可能會決定某一公司在激烈的競爭中,能否快速搶佔市場以及是否具有可持續化的競爭力。
拓寬領域,深層次挖掘用戶需求
不同的應用場景,其需要的聲音類型也是不同的,這也就意味著不同的行業、不同的用戶對於聲音的需求是不一樣的。而一個企業要想在發展的過程中不斷擴大規模,深層次挖掘用戶需求是不得不過的一道「坎」。
針對此,標貝一方面推出了聲音超市,一方面不斷拓寬新領域。目前,平台上的聲音類型已經涵蓋了可以降低人力成本的智能客服、可以實現語音交互的智能音箱、可以提高生產效率的有聲閱讀等多個領域的場景應用。
而另一方面,針對每一個場景,標貝還在深化細分領域。比如客服領域,標貝雖然已經與智齒等多個企業達成了合作,但在與客戶合作的過程中,標貝發現他們對於客服風格有更多的需求。基於此,李秀林表示,內部現在還在孵化兩款不同風格的客服,進而搭配不同的領域。
此外,標貝挖掘了一些傳統語音公司認為需求沒有那麼強但很多互聯網企業已經有需求的新領域,比如泛娛樂。
在與一些明星工作室合作推出語音合成方案後,標貝也讓眾多互聯網企業在發展的過程中看到了新商機。通過這種語音合成來拉近用戶與明星之間的距離,不管是將其應用在教育、讀物還是媒體行業,其變現能力都有較大提升。
技術有望不斷突破
雖然用戶的深層次需求在不斷地被挖掘出來,但這並不意味著智能語音市場已經到了成熟階段。「我覺得語音的應用場景是沒有真正被開發出來的,語音合成市場被開發的也不足十分之一,生活中從電視、新聞到有聲讀物,大部分還是以人工輸出為主,成本是很高的。隨著技術的進一步突破,很多訴求都可以通過TTS實現」,李秀林表示道。
其實,在技術突破方面,標貝科技CTO李秀林深耕語音行業十幾年,已經進行過多次突破。就以智能語音情緒的豐富度來說,李秀林在百度時,就已經針對內容豐富、感情起伏大、需要很強的情感表達的小說進行過一次情感合成技術上的突破,使得百度的小說頻道一經推出就獲得了用戶很好的反饋。
進入標貝後,其以標貝積累的大量語音數據為基礎,通過高精度自動預處理技術對數據進行處理和建模,並搭建了以Attention機製為基礎的高質量語音合成系統,給眾多企業提供了在聲音流暢度、自然度上都更為理想的語音合成解決方案,獲得客戶的一致好評。
未來,隨著技術的不斷突破,語音交互方面還有望得到進一步提升。比如,基於對用戶的持續學習,它知道你喜歡的東西、愛好、興趣,甚至可以通過你的行動、表情、語氣知道你的喜怒哀樂,這樣的話,它會基於你而做出不同的、但是令你感到貼心的反應,且跟你有很多共同話題,而這都是可以基於技術的突破逐漸實現的。
在不斷滿足用戶需求的過程中,標貝也在不斷地提升自身的競爭力。接下來,標貝將會在技術人員、場景挖掘、業務規模方面不斷投入、探索,利用場景與用戶形成生態圈、形成閉環,進而不斷實現數據上的豐富、技術上的更新,與眾多創新型企業一同,不斷推動智能語音產業的發展與創新。
*本文由i黑馬(ID:iheima)原創發布,作者:熊本熊。i黑馬,讓創業者不再孤獨。
i黑馬,讓創業者不再孤獨。
「科創榜」Top100火熱參選中,誰來與我爭鋒?
※K12雙師課堂:模式探索後迎來高速增長
※「毒」APP頻頻被指涉嫌售假,曾獲王思聰投資及推薦
TAG:i黑馬 |