當前位置:
首頁 > 最新 > 馳星創投孫勁超:智能交互是AI投資的黃金賽道

馳星創投孫勁超:智能交互是AI投資的黃金賽道

在中國投資界,有很大一部分投資人不具備理工科背景,這是否會影響他們對高新技術項目的判斷呢?尤其是面對當前火熱的AI項目,「不懂技術」往往被看做投資人的劣勢。然而,有一位投資人提出了他與眾不同的看法:投資人的優勢在於觀察市場,不懂技術不可怕,從場景倒推技術同樣可以發現很多機遇。

本篇實錄系根據健一會(ID:jianyihui2011)沙龍第219位主講人孫勁超在健一會主辦的「2018年 AI 泡沫面臨破裂嗎?」主題沙龍上的精彩分享整理而成,原標題為《智能交互行業的發展趨勢與投資機會》,現標題為健一君所加。

根據嘉賓意見,分享內容已刪去部分敏感觀點及內部信息。

孫勁超

馳星創投 投資副總裁

金融學碩士,交通大學安泰經濟與管理學院MBA。曾就職於招商證券從事資產管理和投資銀行工作。2017年加入思必馳產業基金,任馳星創投投資副總裁,負責人工智慧,金融科技領域的投資和研究。投資案例包括:RT-THREAD物聯網實時操作系統,思既美(上海)智能科技有限公司,北京增強智能科技有限公司(AITEK)等人工智慧初創企業。

分享:孫勁超

整理:尹 揚

審核:阮聿泓

大家好,我是孫勁超。首先介紹一下我所在的機構馳星創投(AISTAR FUND),公司成立於2017年,是一家專註於早期人工智慧領域投資的VC機構。同時也是思必馳的產業基金,協助思必馳進行生態布局。我們最大的特色在於可以為被投企業進行賦能與孵化。想必大家對思必馳都很熟悉,它是一家以演算法為核心的專註於人性化智能語音交互技術的企業,成立於2007年,是AI領域的老兵。

今天我主要從微觀技術和投資趨勢兩個方面對智能交互技術進行介紹。

從場景反推技術是更穩健的AI考察方法

首先和大家分享兩個觀點。

1、算力比演算法更重要。

AlphaGo與人類的圍棋對決,讓人工智慧產業受到廣泛關注。演算法和算力都是人工智慧底層架構中最重要的部分,而在本次浪潮中,我認為算力比演算法更重要。以前實現某個功能可能需要100台電腦,但現在只需要1台,這意味著整個算力呈指數級上漲之後,原本複雜的演算法能夠在C端用戶場景中得以使用。

2、從賦能角度看技術。

現階段大家習慣用「分層法」去觀察一個產業,比如從最底層開始,先後觀察技術層、認知層、感知層及應用場景。「分層法」會導致一個困擾:許多投資人不具備理工科背景,如果對產業採取從下往上的認知方式,首先接觸技術層,並以此作為參考依據,難度比較大。其實各位投資人都有自己熟悉的行業和賽道,不妨從場景來反推技術,從賦能角度觀察技術給相應場景帶來的價值,這種方式更容易被大家接受。

對於AI行業,可能大家心裡都有一個疑問:是不是一定要看懂項目才能投這個行業?對於早期項目來說,技術的確是非常重要的一環,而且要搭建個人資源網路,在各個頂級名校和BAT中里尋找大牛。隨著投資輪次的不斷向後延伸,項目的商業路徑、趨勢、願景逐漸明朗,這些對投資人來說會變得更為重要。

不過,即便在早期項目中,技術指標也並不是最重要的觀察對象。以語音識別為例,80%的識別率和90%的識別率是有區別的,其區別在於:機器是否能夠聽懂人類的語言;而97%的識別率和97.5%的識別率區別並不大。因此,在觀察涉及到人臉識別、計算機視覺、自然語言處理和理解等各類技術的早期項目時,技術指標是應該關注的重要內容之一,但不應作為關鍵點,關鍵點應該被放在技術所應用的場景上。投資人對場景的垂直認識度比在技術端創業的企業家更深。此時投資人的價值在於從細分賽道上對技術進行賦能。從早期的天使到中後期輪次的投資,其內在邏輯和收益考量都是不同的。因此,早期投資人幫創業者規劃的路徑非常重要,因為具備技術實力的企業非常多。思必馳在智能語音交互領域研究了十年之久,很值得尊敬,但其商業爆發期依靠的仍是解決方案對場景的助力。所以,投資人對企業的賦能非常重要。

智能交互會朝著自然人機交互方向發展

智能交互正在經歷一個從感知智能到認知智能的過程,從早期計算機硬體端的儲存,到感知人類的聽、看、聞、說、行為等,機器正在向認知智能發展。

現在大家把大數據作為AI底層的重要技術來看待,但是如果將來AI想要突破現有格局或者實現爆發性的二次增長,大數據不會是唯一的答案。真正意義上的人工智慧應該是對陌生環境的認知能力,而不是對歷史的學習能力。所以機器學習演算法雖然已誕生許久,直到算力實現指數級爆發之後,人們才能比較籠統地使用它,資本的助力使它變成了一個風口。

人機交互是智能交互領域的核心。

最早的人機交互通過代碼形式實現,被稱為CUI(Command User Interface)。比如最早使用的DOS系統(磁碟操作系統),向電腦輸入一串代碼告訴它我想幹什麼,電腦再反饋出一串代碼告訴我有沒有實現,這是最早人機交互方式。

後來人機交互發展到了2.0時代,被稱為GUI(Graphical User Interface),可以進行圖像交互。比如大家手機里都有很多APP,點擊任意一個APP圖標都可以進入到一個應用界面,這就是一種圖像化交互。

從早期的代碼交互到後來的圖像交互,都是容易被我們忽略的交互方式,而AI正是在這些細枝末節中改變了大家的投資理念與投資趨勢。

現階段正處於2.0時代與3.0時代中間。3.0時代採用語音交互方式,我們稱其為DUI(Dialogue User Interface)或者VUI(Voice User Interface)。舉個例子,以前大家在開車時使用導航很不方便,首先要打開車載導航或者手機APP,然後輸入地名,查看路線,這個過程需要一些時間。而語音交互技術的出現讓操作變得更簡單,導航、呼叫聯繫人等行為都不需要親自動手,語音命令即可。

3.0時代後面還會有4.0時代,被稱為NUI(Natural User Interface),自然人機交互界面。在3.0時代,語音交互存在一個問題,機器不知道應在何時提供服務,所以我們在與機器對話前,一般需要幾個位元組來喚醒機器,比如「Hello,XX」等,現在市面上的智能音響、智能精靈等設備在進行交互前都需要被喚醒,這種動作給用戶帶來了不便。與此同時,機器也無法識別出來與它對話的人是誰,還無法做到只識別主人的對話。在4.0時代,機器能夠實現真正的智能化,可以在許多人同時交流的嘈雜環境中,識別出主人的聲音,也能夠判斷出主人是否在與它進行交流,並提供相應幫助。目前還沒有一個C端產品進入4.0時代,但人工智慧的發展路徑一定會朝著這一方向前進。

1.0時代到4.0時代的變化是人機交互方式的改變。如果在每個時代開始,都僅從底層技術去觀察未來場景的改變,難度會非常大。4.0時代,代碼、圖像、語音等各種交互方式會融合在一起,製造一個智能空間環境,其價值產出會呈現出幾何級增長。所以,4.0時代會成為人機交互發展過程中的一個核心。

考察智能交互同樣離不開場景

語音交互跑道中可以深耕的內容非常多。比如在一個家庭場景中,男主人希望打開電視看球賽,其他家庭成員走過來希望換成別的節目,這就涉及到家庭成員間的博弈,機器如何做出判斷就成了一個問題。現在的語音交互技術更多側重於解析,把人們說的話變成文本,但人們在口語交流中存在許多不確定性和複雜性,機器在理解語言方面仍舊存在演算法壁壘和設備壁壘。

語音交互技術包含一系列過程。用戶說了一段話,機器首先要對這段話進行自動語音識別(ASR),然後進行自然語言處理和理解,之後進行對話管理環節,這一環節分為兩步,第一步是搜索,第二步是決策,而後進行自然語言產出(NLG),經過一個白箱操作後將文本轉換為語音,表達出來,這是智能交互的一個閉環。了解這個閉環有助於我們智能交互硬體的工作原理。

相比了解智能交互硬體的工作原理,對場景應用的了解更為重要。對於早期投資人來說,技術端創業的困難和挑戰非常大。不僅要考察創業者的技術、資源、稟賦,又要了解產業背景。大部分投資人可以做FDD(財務盡職調查),但很難做TDD(技術盡職調查)。但是隨著整個企業的上升發展以及成熟產品的出現,各位通過參照物能夠更好地判斷出產品和項目的價值。

判斷語音交互技術的四個標準

在語音交互技術中,有四種技術是基石技術,也可以作為壁壘增加項目的可投資性。

第一種技術是降噪。在一個嘈雜環境中,我們面對一個機器說話,機器是否能夠對麥克風進行降噪非常重要,尤其是在多人對話的環境中識別出特定人物的聲音。從人體生理結構角度看,聲音和指紋一樣,也有「聲紋」,識別不同人的聲紋可以作為一種技術壁壘。

第二種是遠場識別。人們和機器進行對話時,習慣於離機器近一點,擔心機器聽不到自己的聲音,看似很小的動作,卻涉及到一個本質問題:如果人類能夠習慣於自然地和機器展開對話,不需要刻意靠近機器,就意味著語音交互技術取得了跨越性進步。

第三種是回聲消除,基於語音喚醒和演算法基礎進行回聲消除。這項技術很好判斷,親自試一下機器看看有沒有回聲就可以了。

第四種是聲源定位。聲源定位不僅依靠演算法端的創新,還涉及到智能硬體技術。智能硬體的載體在人機交互過程中會起到非常重要的作用。比如在汽車場景中,如何將語音交互技術有機融合在汽車場景內,實現閉環和價值再創造?面對這個問題每個投資人都會有不同的想法。不論是早期、中期甚至獨角獸企業,都想打造一個生態閉環。這種生態閉環必定和樂視的生態概念不一樣,因為樂視的生態並沒有獲得消費者認可。即便是獨角獸企業也只能在垂直閉環里的開展相關業務,從雲端到晶元,如果突破了一個維度就會受到大家的質疑:目的是什麼,是不是僅僅為了提高估值?所以打造生態閉環對各階段企業,尤其是初創階段的企業而言是一個很大的挑戰。

智能設備的最大機會在於集成

設備和功能的集成是智能設備的發展方向。

一台智能交互硬體可以藏很多東西,比如一個蘋果智能音箱,具備傳統音箱的功能,可以播放音樂,它還可以結合思必馳或者科大訊飛的語音技術,讓機器聽懂人類的語言,不需要通過點擊屏幕的方式就可以自動播放我們想聽的歌曲。此外,現在很多APP都可以載入到智能音箱中,比如今日頭條、墨跡天氣,我只需要躺在床上喚醒APP就可以知道今天的天氣狀況和新聞事件;很多第三方服務商,比如美團外賣,同樣可以添加到音箱里。

從集成角度去觀察智能語音交互領域的初創企業,我們不能只關注技術水平的高低,因為很難憑藉一兩項黑科技就把其它頭部企業打到,但是如果在智能硬體與應用場景的結合端有獨特玩法,就仍有發展前景。

在移動互聯網之外的NUI世界裡面,會不會有一個獨一無二的商業模式能夠被巨頭認可,是值得思考的問題。前不久網上有一篇對今日資本創始人徐新的採訪,談到了微信打敗支付寶的原因:因為你大部分時間都在微信裡面,要用支付寶,就要多戳一下,很多人不願意。很顯然,消費者變懶了。語音交互比打開手機動手指還要方便,按照這個邏輯,將來語音交互的賽道是不是不亞於任何一個風口?整個交互理念的轉變要比單一技術的突破更具價值。

面對DUI和NUI技術,有兩個大家都比較熟悉的場景可以作為舉例分析的對象,一個是智能家居,另一個是兒童玩具和兒童機器人。

從DUI角度來看智能家居,就是讓整個家庭空間變得智能化。在過去,當你進入到某個空間內,需要肢體運動來實現某些功能。而現在整個空間進化了,向智能空間進化的第一步是數據化,智能家居藉助於物聯網下端的感測器和上端的雲儲存,以及一套SaaS系統對你提出的要求給予反饋。第二步是真正的智能化,每個人的聲紋、指紋、虹膜都是唯一的,空間可以識別你,知道你是誰,如果你不是家裡的男主人或者女主人,它可以自動報警。如果是在商場里,商場可以識別出你是新顧客還是老顧客。所有基於人的場景都會成為被AI替代的一個潛在標的,但這個場景和標的有多大,值不值得被代替,都是仁者見仁、智者見智的問題。

現在很多兒童機器人都趨向於小型化,未來兒童機器人會走向晶元化。晶元內包含演算法、設備、信號處理裝置,所有功能都會晶元來實現,優勢在於成本更低、功耗更低。這個場景里會有很大機會。

未來的智能終端將可以做成集分析、推理、演繹、歸納四部分功能於一體的設備,從這四個部分中演繹出的獨角獸會很有意思。

智能交互領域存在五個機會

第一個機會在服務。目前移動互聯網的邏輯是以信息為中心,儘可能多的獲取用戶數據。從大維度來看個人信息是不能隨意提供的,消費者在你這裡進行消費,還要提供隱私給商家,其實並不合理。所以未來的交互將從以信息為中心轉變為以用戶為中心,一切交互以最終任務達成為目的。今天的交互很簡單,你想開燈,機器幫你把燈的打開,而且能識別出你的聲音,只聽你的命令。通過設備的鋪設,將來各種第三方附加的增值服務都能夠放在裡面,實現語音交互技術與第三方服務的深度融合,打造智能空間的閉環。

第二個機會在場景端。技術催生垂直場景下的閉環生態。閉環中的生態場景不僅可以完成簡單的數據搜索,還可能包括支付行為。如果一個創業企業從支付端切入業務,會面臨很大的困難,需要資源稟賦、人脈稟賦,而且整個流程會非常複雜。但是以交互端切入,將閉環打造完成之後可以很容易將支付納入進來。這得益於思維方式的不同,而不是技術的不同。

第三個機會在行業。智能交互在智能車載、智能家居、兒童機器人、醫療等行業都存在巨大機遇。交互帶來的不僅僅是界面的改變,還可能向移動互聯網一樣催生出很多新的商業模式,而且一定不是像B2B、B2C這樣的端對端,點對點的模式,一定是將技術和各種商業閉環的模式。

第四個機會在大數據。這裡的大數據並不是通常意義上的大數據,而是垂直領域裡的數據。

垂直數據領域現在有一個很火的詞叫做:知識圖譜。每一個垂直行業的知識圖譜都需要大量的垂直數據。知識圖譜可以衍生出垂直行業的一個虛擬客服,如果今後大家在淘寶上用文字與客服交流時,大家很難判斷對方是真人還是機器人,那麼這個知識圖譜就算是成功的。大量垂直領域都需要這樣的數據收集,涉及到不同維度的結構化和非結構化標註。這個方向的創業企業同樣值得大家關注。

第五個機會在於重塑信息。智能交互可以打破信息孤島。什麼是信息孤島?信息孤島並不孤立,比如一個商場里可能有200家商鋪,商鋪之間距離很近,但是每一家都是一個信息孤島,它們各自之間並不聯通,單個商鋪只和商場產生連接點,協同價值很低。企業做併購時會注重協同價值,創業企業同樣要關注協同價值。信息孤島的存在給智能交互領域提供了一個更大的想像空間。

我們當前面對的交互環境、場景非常多,對交互設備的需求也很多,未來的交互行為會發生在人與機器、機器與機器、人與人通過機器交互等多種形式中,這是宏觀上能夠看出來的趨勢。(完)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 健一會 的精彩文章:

崑崙萬維方漢:區塊鏈技術尚未達到商業化成熟階段

TAG:健一會 |