思必馳俞凱:深入行業 4 年,我們發現了人工智慧行業 3 大趨勢
近日,人工智慧企業 思必馳召開發布會,發布了旗下全新產品——DUI 對話開放平台。期間,思必馳首席科學家俞凱關於對話智能的發展趨勢做了一場名叫「讓對話智能流通生長」的演講,俞凱表示在過去的 4 年當中,他們為 B 端客戶做了大量定製開發工作,幫助他們把語音對話產品的體驗做到極致,並在這個過程中發現了人工智慧行業的 3 大趨勢:
- 1、時代產生了由 PC 互聯網時代到硬體物聯網的時代的變革。
- 2、單純深度學習和大數據對人工智慧性能提升的空間正在變小。
- 3、行業專業化分更加明顯,企業做 9 分已經不能夠吸引客戶了,非 10 分不可。
另外,俞凱還表示隨著客戶個性化需求越來越多,能夠提供個性化自主定製的對話開放平台已經成為行業必需。
以下為俞凱的具體演講內容(有節選):
為什麼我們講對話是最核心的東西? 為什麼思必馳不是一家語音識別公司? 而是一家人機對話公司。
其實真正的一個完整的對話智能技術,不單單是語音識別,還涉及到識別、理解、合成,這是一種聯合性的技術,在過去幾年,我們一直在推一個概念,就是單點的技術不管用, 系統級別的技術才管用。
最開始有朋友說,我找一個語音識別的公司就可以了, 但是後來發現真正想做到好的用戶體驗就需要去調,需要調很多的東西。從我們的角度會發現,對話智能作為一個完整的系統來說,需要同時具有我 們整個一圈完整的技術,才可以達到極致性的用戶體驗,否則就會出現掉鏈子。
在這種情況下來說一說,在過去這 4 年當中,我們做了大量定製性大項目的開發工作,幫助他們把產品的體驗做到極致。在這個過程當中我們發現,有個比較有意思的趨勢出現了:
1、時代產生了由 PC 互聯網時代到硬體物聯網的時代的變革。
在今年 5 月份的時候,全世界最著名的 IT 公司有一個統計,到今年的年底 為止,全世界所有的智能設備數量將達到 80 多億,超過全世界人口的數量,到 2020 年,要超過 200 億。在這四年當中,尤其是從 2014 年開始,智能硬體終端 有了一個非常大的增長。而這個過程,使得語音交互界面得到了前所未有的重視,我們可以看到,從亞馬遜到微軟,到谷歌,到蘋果,在這個過程當中,各自都產生了一系列的變化,推出了面向智能硬 件的語音交互助理來適應這個時代。無論是由軟體支撐還是由最終硬體的終端,我們都會發現, 這變成了一個時代的變革,這個入口已經不可逆轉的成為了我們的未來。
2、2012 年的時候很多人開始講,深度學習+大數據就是未來,真的是這樣 嗎? 說是,是因為現在無論如何都缺少不了深度學習和大數據。說不是,是因為單純的深度學習和大數據,沒有專業化的支持和專業化的調整還不能發揮作用。
在這 4 年當中,我們所做的一些工作就是把一些結構化的模型放在一般性的深度學習和大數據當中。大家看到下邊這張圖,國際上一個特別著名的數據集, 從上世紀 90 世紀開始就成了最大的關注點。在 2015 年,我們通過結構化的深度學習將錯誤率降到了 9.7,2016 年又降到 7.1,這個不是簡單的深度學習,而是把深度學習在結構化的方向做了進一步的推進達到的。
2015 年底,2016 年初的時候,做了一套所謂的快速解碼技術,它把我們的 語音識別在同等模型情況下識別搜索的速度提升了 5 到 7 倍,在不同的模型下, 綜合的速度提升達到了 20 倍,這意味著什麼? 意味著我們有可能給一些用戶定 制本地化、通用模型的方面取得重大的進展。再過一段時間,我們會相信,通用的本地模型將成為可能,不用再管網路了。 這都不單純的是深度學習的功勞。
而在在語義理解方面,我們採用所謂的雙向的神經網路,加上一種聚焦機 制。大家可能聽說過注意力機制,我們把它改成了聚焦機制。在語義理解當中也取得了標準錯誤集當中最高的精度。
我舉這些例子是想說明,在這 4 年當中,我們觀察到一個趨勢,就是技術不會止步,技術的發展會非常快。最開始,單純的靠深度學習加大數據,人工智慧性能能夠產生很大的提升,但這樣的空間已經變得越來越小了。現在,它的持續增長就需要依靠自適應模型,並從數據驅動到知識驅動,需要一些新形態的,深度學習後時代的技術來進行支撐。
3、專業化分工明顯
我們發現,在整個應用的層面,關注對話並且以對話為核心的企業中,有的是數據驅動,有的是一部分專業技術驅動,有的是產品應用驅動,這是一個趨勢,這個趨勢是專業化分工的趨勢。
更具體的,在產業鏈上,它的專業化分工也變得更加明顯了。整個產業鏈變成了基礎的支撐層、智能交互層、系統應用層,各個方面專業化的公司變得越來越多。這樣專業化的分工是什麼? 你有一家公司你可以去搞語音識別,你把這件事情做出來大家都找你服務這樣簡單的邏輯已經不成立了,他需要的是,你在這個領域做到的不是 9 分,非 10 分不可。只有絕對專業化的公司才可以把事情做到極致。為了整體人工智慧性能得到提升,專業化的分工、專業化的結合已經不可避免了。
行業需要更好的個性化定製服務
我們做了 4 年完整的定製服務,我們發現,每一家都希望有個性,每一家都希望有 1、2、3 這 3 個功能組合,但是在第 4 個的時候希望可以變一下。比如說在語音交互的模式上, 有人希望把命令做透,有人希望做問答,有人希望做閑聊,有人希望多輪,有人希望一輪最好,在模態上有語音、文字、觸感,有不同接入的需求。個體性化定製的需求越來越多。
我們會發現,在現在能夠提供語音交互技能定製的平台大體上有兩種不同的思路。
- 1、我提供封閉的解決方案,反正所有的東西我都來幫你優化。首先,我們 要有全面的技術,在每一個技術上是不是有深厚的技術性的積累,並且有很好的 產業落地的能力。要求是一家獨大,而且是由公司自身全包全攬的做定製。你想加一個新詞,好,但這得按月進行詞表、語言的更新。
- 2、另外一種思路,是我們現在在做的 DUI 的思路,就是開放,形成一個生態圈。
是不是所有人都可以做這件事? 是不是我給 你一個 SDK,你去調用,改一下,就可以讓對話定製了? 顯然不是這樣;1、你要做技術的定製,得先做技術的拆解,做完技術的拆解之後,你的技術指標是不是還可以達到以前的(封閉系統)水平;2、有技術的分解,就要做模型的定製,還要做規模化的擴展,這才可以使平台有直接技術支撐,而不只是一個概念。
本文 思必馳俞凱:深入行業 4 年,我們發現了人工智慧行業 3 大趨勢來自動點科技.
※三星表示,Galaxy Note8 預訂是有史以來最好的
※沃爾沃收購 Luxe,下注未來汽車數字消費體驗
※Google Daydream 更新加入新 VR 課程和開發者工具
※索尼推出了品牌迄今為止最便宜的 4K 投影儀
※打車應用 inDriver 獲 500 萬美元 A 輪融資
TAG:動點科技 |