完成新一輪1億美元融資後,Rokid祝銘明:人機交互「終極目標」是Personal AI,無處不在
1月18日,Rokid宣布完成了新的一輪融資,由淡馬錫領投,同時,包括老股東IDG,以及瑞士信貸、CDIB都進行了跟投,後兩家機構更是第一次參與國內AI領域的融資。
Rokid是入局智能語音設備較早的那一批創業公司,而就在2017年,智能音箱的戰國時代正式開啟。Rokid也隨之在語音交互領域,進行了一連串的行動。在智能音箱進入戰國時代的2017年,Rokid發布了第二代產品Rokid Pebble(月石);去年的雲棲大會上,Rokid和阿里雲一起推出了全棧語音開放平台;在不久前閉幕的CES上,Rokid最新的AR眼鏡Rokid Glass亮相。
語音交互的新革命來了。現在,Rokid也已經不再是以前大眾眼中的一家單純的智能家居硬體生產商。而在它的目標中,是要在新的交互時代,把自己打造成為一家什麼樣的公司?
今天的2018極客公園創新大會上,Rokid創始人、CEO祝銘明(Misa)解釋了他對公司的定位和理解,以及他對於「人機交互革命」的理解。
以下是祝銘明的演講實錄,經黑智編輯整理:
科技革命必由交互革命引爆
AI相信大家已經聽得非常多了。從技術、研究、產品、場景到市場需求,諸多方面都被做了很多探討。
今天的20分鐘時間裡面,我希望能夠回到我們思考問題的出發點、原點,來跟大家進行溝通,來啟發大家的思考。
如果大家觀察一下科技的發展歷史,以及技術是如何從研究、工程走到市場、用戶身邊的,你會發現,每一次科技的變革都是交互方式的迭代。
提到交互的迭代,很多人會想到信息時代我們的電腦、手機、智能音箱等工具。但我希望大家明白,從人類最開始掌握一些原始的技術和工具時,就在定義人機交互。
我們在課本裡面學到的,最早劃分出的「智能時代」,是從舊石器時代到新石器時代。這本身就是用人和自然界、技術之間的交互方式,來定義一個大的時代。
很多交互方式的改變,是因為人類對技術的需求和探索,讓我們想要掌握很多遠遠超過我們自身能力的一些東西。尤其是第一次工業革命,整個近現代科技的爆發,人類對科技的渴望,以及無法掌控它的恐懼,互相之間產生了非常大的碰撞和衝擊。
在那個年代,人們並沒有找到非常好的人和技術之間的溝通方式。
我們再來看一下信息時代。從紙帶機,到最早的個人終端設備,慢慢過渡到大家熟悉的通過圖形界面、滑鼠等,再到觸摸屏,也是交互的革命。
交互革命的變化帶來信息革命的變化。
它帶來的最根本的變化是什麼?是科技跟人關係的變化。紙帶機時代,基本上是科學家、研究人員,以及行業工程師來進行溝通;到傳統的鍵盤,主要是一些遊戲玩家和專業用戶來使用;等到圖形界面,就有大量的愛好者和普通的用戶開始跟信息時代進行搏擊;觸屏時代,基本上覆蓋了每個人。
人和機器革命的核心,雖不能說它是由交互發起的,但是它最終一定是由交互引爆的。今天我們很多人在講AI,更多地強調它的計算力,更強大、更準確、更高效,但是實際上大家沒有想到,AI本質上會引爆這個時代根本的原因,是因為交互方式將有一個根本的變化。
Rokid的思考
我們在Rokid創辦的第一天,就把自己定位成「人機交互革命」的一家公司。我們感覺,科技進入AI時代之後,會有一個完全跟過去幾百年不一樣的本質變革,人和機器可以變得非常融洽,機器開始懂人類,開始符合人類的習慣和需求,在這種情況下,帶來的變革也一定是非常巨大的。
我們發布了Rokid Glass後,很多人在問我們,為什麼我們做語音,還要去做顯示、視覺這方面的東西?因為我們本質就是,希望讓人和科技更自然地交互,讓人跟科技更融洽。
我們在近三年多的嘗試裡面,一開始落地是語音技術。現在說到語音技術,很多人都已經耳熟能詳了,因為現在有大量的人在做以語音為主要交互方式的設備入口,來定義人跟現代的信息技術之間的關係。
但實際上,除了語音交互之外,語音的通路是非常窄的。Rokid從來不認為語音是跟人溝通最豐富的一種方式。人是感官非常豐富的動物,從視覺、聽覺、嗅覺、觸覺等各方面感知東西。所以,最終我們要的,一定是非常豐富的交互方式,來完整的跟科技、信息進行交流的東西。
如何定義圖象、視覺、語音等等諸多的元素,去融合成一個產品;或者說探索人和機器之間的關係,這是我們一開始的出發點。
所以你們就會知道,我們為什麼在2014年推出第一代產品時,會有非常有趣的顯示方式,有攝像頭,同時也有麥克風,以及為什麼我們會在今年突然推出Rokid Glass。實際上我們的美國實驗室已經偷偷對Rokid Glass進行了兩年的研究,前不久CES上才對大家公開。
(播放視頻)這就是我們的Rokid Glass,它把語音、視覺,包括通信等,都合在一個普通眼鏡大小的這樣一台設備裡面。原來大家理解中像頭盔一樣的AI Glass,現在可以做得和一個普通的Glass沒什麼區別。
我們這樣做是因為我們認為,應該讓大家更自然地接受新產品,能夠無縫地觸摸未來。
如何思考產品和人的關係,其實我們還是要回到人和機器之間的隔閡開始。機器的能量非常強大,但是難以駕馭,甚至會給人恐懼感。所以我們首先要做的事情是消除這種隔閡,讓很多的人用最自然的方式接受技術,而不是被強迫拽到一個眼花繚亂的高科技時代。
所以,我們先從產品設計的本身上做一些探索。比如說我們的第二代的產品Rokid Pebble,它的設計本身就是融入,如果說我們的第一代產品設計還是嘗試, 第二代產品,我們是想讓它就像是你身邊一直存在的一個普普通通的東西,能夠融入家庭的設計。
所以我們也更多地注重它的品質,而不是過分地強調技術本身。技術是用戶感受到的,不是直接把技術扔在用戶臉上的。
我們公司有一句口號,叫做「醜陋的東西一定是錯誤的」。這是我們的開發版,即便針對工程師,Rokid也會用我們自己的文化去跟大家進行溝通。我們認為工程師也有欣賞美的權利。
第二,我們講了這麼久的人機交互,其實人和科技之間,交互並不是目的。重點不是交互本身,而是作為提供科技的一方,能給用戶帶來什麼,希望傳遞給用戶什麼,以及人們通過這種交互得到什麼。
所以,一個產品一定有它更深層次的東西。它可能是交互本身,比如聊天或者溝通本身就是一種需求;也可能是它後面帶來的一系列的內容、服務和場景。
Rokid在語音方面做了三年多的研究,我們也發現,當整體體驗上已經達到非常可用性地步的時候,用戶並不滿足於交互,而是會索求交互以後能夠幫我做什麼,還要有更深層次的內容,包括交互本身所帶來的一些內涵。無可避免地,音箱類的產品,最後一定會回到內容和服務本身。
所以,不久以前,我們宣布跟騰訊雲小微合作,把1700萬首歌曲放在Rokid產品里。當然我們也在探索,通過語音這種新的AI方式聽音樂,會有什麼不一樣。如果在座各位有機會,可以看看用最新的Rokid聽音樂有什麼不同。
舉個例子,我們的雙音節喚醒機制,很多人說這是當前語音喚醒的挑戰,到今天為止,我們也是唯一做到的。Rokid還可以自定義設備名,不需要訓練,馬上生效。我們這樣做本質還是建立人和科技之間一種特殊的紐帶,比如中國人叫人名字更習慣叫兩個字,你叫它兩個字的時候,你下意識就不是在跟設備溝通,而是在跟夥伴進行溝通。
未來:Personal AI,無處不在
另外,在AI時代沒有人能夠通過單個產品贏得整場戰爭,因為AI本身並不是一個商品。像今天,已經沒有人說我是一家互聯網公司,因為每家公司都是互聯網公司。遲早AI是一個非常通用的、對產業整體賦能的東西,不會通過單個產品贏得整場戰爭。
但是當我們打磨一個具體產品的時候,整個全棧的能力,一定在完成以後有過剩的能力,因為它本身天然就是通用的,所以我們將它釋放給我們的合作者。
AI是基礎技術。就像我剛才描述的,我們今天很多人已經不會再叫智能手機了,都叫手機。現在我們還有大量的「智能Something」,譬如說智能汽車、智能電視、智能音箱、智能手錶等等,未來智能兩個字會消失掉,會回到汽車、音箱、手錶這些傳統的概念。就是因為AI是技術的東西,它講會無處不在。
我們非常肯定,人和AI的關係,將會是融入你生活的點點滴滴,無所不在。
所以Rokid本身的定義是從Home AI開始做研究;到Portable AI;到AI Glass,這是Personal AI。而Rokid最終是一家Personal AI的公司,AI一定是無所不在、如影隨形。Rokid Glass是我們認為接下來一個非常終極的方式。
當然最終走到這一天還需要很久的時間,我們還有大量的東西可以探索。比如我們在美國的團隊前段時間還推出了《狼人殺》,可以讓機器法官參與到你的《狼人殺》、參與到你的社交,扮演一個角色,這種嘗試我們都會不斷地進行努力。
TAG:黑智 |