當前位置:
首頁 > 科技 > 當智能遇見智能

當智能遇見智能

對隱約可見的AI時代我們每個人其實都心懷好奇和敬畏,我們既想了解它的發展程度,比如它已經實現了哪些落地應用?也想了解它的影響,比如它到底會如何改變我們的生活。

9月2日虎嗅組織了一場關於智能語音的上道沙龍,邀請了智能語音賽道的大部分玩家來探討關於智能語音的一些問題,其中有中科院自動化所所長徐波,出門問問創始人兼CEO李志飛,螞蟻金服人工智慧部資深技術總監徐鵬,奇點機智創始人鄔霄雲,三角獸創始人馬宇馳,普強信息CEO何國濤,海知智能創始人兼CEO謝殿俠,科大訊飛開放平台業務部商務營銷總監陳其山,主持人則是來自聲智科技的副總裁李智勇。嘉賓們就自然語言處理到語音識別再到遠場語音交互等技術,以及當下火熱的智能音箱到智能終端設備手機、汽車的未來趨勢,聊了下他們的一些想法。

技術上看當前語音交互發展到了怎樣一種程度?

徐波所長《智能語音技術現狀與發展方向》的分享非常透徹地回答了這個問題:

徐波所長提到作為一個整體,現在語音交互技術已經進入新的平台期,比如在語音前端處理(抗噪、語音分離),自然語言理解上都面臨較大挑戰。最終需要有新的技術和儲備才能使語音交互進入下階段,而這並非是單純的大數據問題。為了這種技術突破,需要從類腦智能的角度來研究語音,從人類學習、記憶和決策角度研究建立前端聽覺感知和後端認知新機制,要從仿生神經網路觸發啟發新一代人工神經網路和學習方法。這一過程很可能需要5~10年。

隨後在在圓桌環節各位嘉賓則對這問題進行了更為深入的討論:

對於「大瓶頸」自然語言處理問題,出門問問創始人李志飛的觀點比較有代表性:短期悲觀,長期樂觀。大家比較一致地認為自然語言處理問題就是通用智能問題,解決了自然語言處理,也就實現了真的人工智慧。但這確實會面臨比較多的挑戰,比如經常提到的完全信息問題,人類在做對話的時候,有比較龐大的信息背景,而這在與機器進行對話時事實上是缺失的。

與此相參照,三角獸創始人馬宇馳的觀點則更加偏向落地和應用,馬宇馳認為:如果我們把地球和月球的距離作為參照尺度的話,那汽車和摩天大樓的高度其實並無差異。所以從應用視角來考慮,核心要解決的是在特定場景下做出滿足用戶體驗需求的產品,這裡面兩個關鍵點是:要在特定方向上做到最好,拉開和競爭者的差距,同時也要縮減預期,不能讓用戶覺得當前的智能語音無所不能。

非常有意思的一個小插曲是,在提問互動環節,大家對客服這類應用上純粹的語音識別究竟可以達到什麼程度這點進行了有趣的探討:

最初的問題是由一位聽眾提出的:訊飛當前在人工智慧客服上的識別率可以達到多少?陳其山回答:識別率的多少需要分開來看。98%的識別率是純粹的語音轉文字,NLP(自然語言處理)在客服應用場景下,能達到93%。談到識別率時普強信息的CEO何國濤則做了另外視角上的補充:識別率不等於最終體驗,包括客服這類場景,對用戶最終要的是能否解決問題。比如,目前各大服務平台的智能客服更接近於搜索引擎,將用戶的關鍵詞與資料庫相關答案匹配,而支付寶此前上線的智能客服小螞答,通過深度學習的排序DSSM模型與序列模型LSTM結合可以綜合用戶行為軌跡與用戶輸入來進行智能問答,完成5輪問答所需時間大概為1秒鐘,比人工客服效率高30至60倍,目前每天可以處理200-300萬的用戶諮詢,客戶滿意率甚至比人工客服還高出了3個百分點。

這一問答之所以有意思在於,它傳遞出了這樣兩個與一般認知不一致的信息:第一,落地應用的場景下,識別率遠不是一般媒體所說的98%;第二,落地時唯指標論會讓技術類公司走入比較大的誤區,就市場應用來說用戶體驗仍是最重要的。

什麼樣的產品或者場景會最終啟動這個市場?

當前最熱的落地產品無疑是智能音箱,但針對智能音箱,顯然有著一些必須跨越過去的障礙,出門問問的創始人李志飛把這種現象總結為兩個矛盾:

第一是技術與市場之間的矛盾:良好的音箱體驗所需的AI技術還需要時間進一步打磨,但國內從移動互聯網時代繼承過來的主流打法是以快打慢。

第二是市場與資本之間的矛盾:音箱作為非剛需產品,短期不可以和電腦手機市場類比,但又因為交互自身可能產生極為深遠的影響,各大巨頭也紛紛進入,這就導致賽道過飽和。(註:美國研究機構認為這市場在未來五年內單只美國可能達到每年9000萬台以上,其實也並不很小)

不管怎麼看,語音交互本身是否啟動最終都會和當前智能音箱市場是否啟動產生比較大的關聯,但顯然這是起點而不是終點。對此,螞蟻金服的徐鵬做了更進一步的闡述,他認為最終語音助手的展開依賴於以下三點:

其中理解用戶是指理解用戶的偏好、使用歷史、當前情景;主動服務則是指合適的時間做合適的事,比如:電影開始前的提醒;廣泛連接是指最終語音交互不能局限於某個設備,而會連接多種設備,多種服務。針對這點三角獸的馬宇馳在圓桌環節專門做了補充:語音交互其實也並不局限於語音,在某些場景下用戶也還是會直接輸入文字,用NUI(Natural User Interface)來代表可能會更為適合。

奇點機智創始人鄔霄雲的落地思路與上述嘉賓所提到的內容有很大不同,奇點機智走的是一種與當前觸屏相融合的道路,形象來講就是在Android的應用系統里讓用戶隨時隨地可以使用語音交互。這個倒是可以和支付寶某些改善用戶體驗的措施相參照:支付寶的許多功能摺疊得比較深,用戶尋找路徑較長。AI團隊通過語音識別和語義識別,在支付寶首頁上線了一個業務直達banner,用戶說出想要找的功能,比如「轉賬」、「交水電煤」,系統識別語音後就會自動跳轉進入相關服務頁面。而打支付寶的客服電話也不需要從1到9聽提示音報功能,用戶說出想解決的問題,系統識別語音後會自動跳轉進入相關服務。

AI賽道上潛在商業模式是什麼?

過往我們經歷過以晶元和產品為代表的賣貨模式,以微軟為代表授權收費模式,以互聯網公司為代表的後端變現模式,以及以雲服務為代表的服務模式,那AI企業最終會走到那個模式上,或者會創造新的模式么?

與會嘉賓在這點回答上非常的務實,坦誠說到AI的商業模式仍然處在一個大探索時期。三角獸的創始人馬宇馳提到:如果智能客服市場有數百億的規模,那當技術提供者可以為其節約足夠的成本,那事實上就創造了新的價值,進而就一定可以樹立自己的商業模式。

海知智能CEO謝殿俠則從另一個視角對商業模式進行解讀,他認為2018年中國的智能音箱市場會達到1000萬台,在這樣一種大前提下,雖然短期為了建立品牌,創業公司會做部分免費的生意,但長線看不會是這樣的,至少2B的市場不會這樣。普強信息CEO何國濤觀點與此類似,他認為AI企業在2B端市場把技術和服務做好,自然就會衍生出適合的商業模式。

總結

從各位嘉賓的討論來看,當前語音交互的技術突破確實的形成了一定的技術紅利,而在怎麼把技術紅利消化為商業優勢一點上,各個公司包括行業巨頭科大訊飛和其他崛起的創業公司都還在摸索之中。而眼下風口上的智能音箱究竟會取得多大程度的成功,語音交互技術會落地應用到哪些新的領域,也還是未知。但可以肯定的是隨著智能語音各項技術的發展,越來越多的產品會走進我們的生活、影響我們的行為習慣、甚至帶來一場新的產業革命。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 虎嗅APP 的精彩文章:

切斷微博登陸,「頭條賬號體系」的野心與困局
Papi醬停更分答的殘酷真相:付費用戶太少
向網易雲音樂施壓,騰訊搶先與阿里音樂互換百萬曲庫
拋開「概念」降低售價,MIX 2 撐得住雷軍的自信嗎?
你大概沒想到,AI居然能識別失傳的古文字

TAG:虎嗅APP |