當前位置:
首頁 > 新聞 > 思必馳 CEO 高始興:未來所有的端都有對話能力,很多流量入口會消失

思必馳 CEO 高始興:未來所有的端都有對話能力,很多流量入口會消失

今年下半年,思必馳有點忙,蟄伏三年終於推出了第二個對話定製平台「DUI」。距離思必馳發布的第一個對話式平台,也是中國第一個口語式對話平台「對話工場」,已有四年時間。這四年里,帶著平台賦能開發者行業的初衷,思必馳走了不少「彎路」。

時間回溯到 2013 年 9 月 7 日,思必馳發布「對話工場」。這是做智能語音對外漢語口語教育系統和解決方案出身的思必馳團隊重新審視互聯網行業的結果。

這一年中國爆發了智能手機換機潮,出貨量 3.2 億台,同比 2012 年上漲了 64%,同時移動互聯網市場規模突破千億大關。海爾、高通等企業針對物聯網發起了 AllSeen 聯盟,同時海爾、美的等家電企業也都有落地的物聯網家電批量進入市場。

思必馳 CEO 高始興覺得,那一年中國移動互聯網的中場拉開帷幕,思必馳需要迎風而上,找到一個落腳的大方向,另一方面,Siri 等語音助手的興起,也讓思必馳看到了語音對話平台的方向。「那個時候的很多語音助手市場,有幾百上千款產品。」於是就有了「對話工場」這個對話平台,並開放底層的 ASR、TTS、NLU 等 SDK 介面,試圖賦能當時的語音助手開發者,然而這個平台沒有做起來。

這一步走的有點早

「當時物聯網剛剛起步,市場規模沒發展起來。更不用說物聯網中的人工智慧自然語音交互市場,從產品普及度到產業鏈的成熟度、產業化落地速度和質量都不夠。」高始興分析其當時的市場環境感嘆頗深,2013 年做對話平台,方向對了,只是這一步走的有點早。

圖丨思必馳 CEO 高始興

一年之後,物聯網的風口漸起。有了前車之鑒的思必馳把對話平台暫且放在一邊,轉而選擇軟硬一體化的道路,順勢而為地做了一款智能車載產品「車蘿蔔」,將語音人工智慧落地到創新端。

2015 年,基於車蘿蔔的技術提煉,思必馳推出了 AIOS 系統,開始賦能三個垂直市場:車載、家居、機器人,滿足這三個垂直領域在自然語言領域不同的需求。

到了 2016 年,物聯網市場的帷幕完全拉開。思必馳的團隊發覺,越來越多的開發者和客戶在個性化、定製化、敏捷度等方面的需求越來越高,AIOS 已經跟不上了市場需求了。輾轉四年的思必馳終於可以做回初衷,全鏈路定製一體化對話式平台「DUI」。

圖丨四年後的 9 月 7 日,思必馳正式發布 DUI 對話開放平台。

從「對話工場」到「DUI」,思必馳回到了對話平台。中間的探索在高始興看來不是彎路,最多算的上小彎路,這些小彎路是為了讓大方向的道路越走越直。

「你不深入扎到水裡面,你不知道這個水的深淺。繞的這些小彎路都是順勢而為,大方向沒錯。」

未來所有的端都有對話能力

有了車蘿蔔和 AIOS 的經驗後,思必馳認識到做平台,要把端到端的各個環節大通,才能將體驗做好。比如一個音箱產品用了 A 公司的麥克風陣列、B 公司的語音 C 公司的自然語言理解技術,這種割裂的系統帶來的體驗會非常差。

高始興解釋道,「因為前端麥克風陣列是別人的,就很難去根據他採集的數據來調自己的模型。而平台是可以做到的。此外交互感非常差,因為交互是基於識別結果的。未來人機對話的過程應該系統化地去優化這個交互方案,而不是一個串列的系統。」

「未來整個物聯網人工智慧世界一定是對話的世界,人機對話的世界就是萬物賦能對話。」在高始興眼裡,未來所有的端都要有對話的能力。這就需要一個能靈活定製各種需求的全鏈路一體化對話平台。

據思必馳介紹,DUI 幾乎每個模塊都能實現定製,包括喚醒詞、語音識別、語義理解、對話管理和輸出、 TTS,它可以向開發者提供完整的智能對話交互方案。DUI 是一個端到端的全鏈式大系統,其中包含了四個子系統:天機系統支持實時的數據監測和系統反饋預警;青囊系統包含監控反饋支持迭代、項目管理;玲瓏系統支持跨平台和離線操作;紫微系統提供介面資源平台,兼容 AVS 服務。

不過高始興表示,一體化的平台並不代表,裡面包含所有能力都由思必馳來做。「思必馳會聯合其他的合作夥伴組成一個大的能力平台,最終做出能賦予開發者 All in one 能力的一體化平台」

未來很多流量入口會消失

在傳統移動互聯網時代,流量入口被切分為很多塊,應用市場、各種 App、社交網站、資訊網站等等,但是未來的流量入口會有顛覆性的變化。高始興的想像是,在物聯網端,很多流量入口將會消失。不會再有 App、輸入法、安卓市場等等,這些分散的流量入口會匯聚成一個大端,形成一個流量入口。

「未來可能就是你買了幾個不同的端,不同的端代表不同的服務,中間是一個大的人工智慧系統在運轉。」他的另一種想像是未來下載的不是 App,而是 Avatarstore(阿凡達)。安卓市場會演變成虛擬人物市場,每個虛擬人物背後代表不同的服務。

因此「未來一定會走向對話智能」,對話智能意味著機器更懂人類的想法。在人機對話中,當機器聽不懂時,它能主動並且知道怎麼問人類,以求得更好的理解。這是一種完全自然的語言交互。

而現在的交互系統大多是結構式。用手機訂餐館時,需要選擇菜系、位置等等,像填空一樣必須按照系統提供的結構去填。這種方式顛覆了人性化的需求。高始興認為人性化的方式應該是,你對它說我晚上要和女朋友吃飯,幫我定個浪漫的餐館。未來人機交互體驗應該是追求人性化的道路。同時未來的人機交互不知是自然語言交互,還會加入圖像人臉識別等多模態,這也是一個趨勢。

雖然從終局看現在,很多事情都有不一樣的局面。但市場往往是以當下為中心看未來。高始興回想起互聯網市場早期嚴重的中心化現象,「手機上被安插了所有能想像到的功能,做 App 的恨不能冰箱上都能下載 App。但是終局不一定是這樣的,一個時代的迭代變革是巨大的,就像今日頭條,當年很多人看不上,但後來它展示信息的方式還是吸引了大量受眾,現在已經很少有人看門戶網站了,未來門戶會消失。未來的邏輯在物聯網端」

語音對話平台市場飽和了嗎?

2016 下半年開始,對話開放平台市場進入爆發期。BAT 陸續發布自家的人機交互平台。2016 年 8 月阿里雲發布初步具備與用戶自然交互能力的人工智慧 ET,並且通過阿里雲開放其 API。很快,2017 年 1 月百度發布對話式智能開放平台 DuerOS,並被業內人士稱為中國的 Alexa。緊接著,今年 6 月騰訊也發布了具備語義分析能力的智能語音平台「小微」。除了三大巨頭外,還有深耕語音多年訊飛,以及雲知聲等專註語音系統的公司,都在做語音開放平台。這個市場似乎在走向飽和。

然而高始興並不這麼看,他認為,「市場是否飽和不看有多少家公司在做,而是看它們的目標市場服務的對象市場怎麼樣。因為無論是誰在做,服務的市場大致是一樣的。目標市場起來之後,再去推演上游市場達到什麼階段。現在物聯網市場剛剛拉開大幕,所以這個市場遠遠沒有飽和。移動互聯網剛剛從紅海到血海,這是個巨大的市場。」

「思必馳排在第二梯隊?我不認」

在互聯網市場,有玩家就一定有排隊。在語音技術領域,業內把百度、訊飛這樣的公司排在了第一梯隊,而把思必馳和雲知聲放在一起排在第二梯隊。高始興並不認同這種粗暴的排隊方式,「排隊可以,但要看維度」。

從公司規模上,思必馳當然沒法與 BAT 比。從產業維度來看,訊飛在 2B2G 上也是第一梯隊。但從技術上看,高始興信心滿滿,「思必馳在物聯網端的自然語言交互技術是全球領先的。」據其介紹,思必馳目前在物聯網自然語言交互上有 150 名 AI 人才,人數超過了所有其他公司。此外,剛從阿里 iDST 挖來的語音技術專家初敏也讓思必馳在技術上有了更多的信心。

圖丨思必馳北京研發院院長初敏

除了自家的 DUI,高始興也表達了對百度的敬佩,並非常看好 DuerOS,他認為思必馳和百度應該排在物聯網自然語言交互技術的第一梯隊。未來的物聯網將會是一個對話的世界,是一個千億級的市場。而思必馳的願景就是要幫助開發者在不同場景中打造極致體驗的交互產品。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

目標直指特斯拉,戴姆勒將投資10億美元在美擴廠生產電動汽車
麻省理工學院教授稱,海洋將在2100年驅動第六次大規模物種滅絕
金屬3D列印重大突破!只需迦納米顆粒就能列印高強度鋁合金
人工合成胚胎已經降臨,是該銷毀還是任其發育?獨家深度
亞馬遜下一個人工智慧助手產品竟然是——眼鏡!

TAG:DeepTech深科技 |