對話若琪CEO Misa:AI晶元已拿下數百萬訂單 AR眼鏡年底量產
智東西(公眾號:zhidxcom)
文 | 寓揚
智東西6月26日消息,今天人工智慧創業公司Rokid在杭州舉辦成立4年來首場發布會,現場發布Rokid Me便攜智能音箱、語音AI晶元以及量產版的Rokid AR Glass。
其中Rokid Me更像一款mini版的智能音箱,有手掌大小,其最大特色在於便攜,並增加搖一搖、聲紋識別、藍牙電話等功能,但799元的定價已經趕超了市面上較多產品。
前一段Rokid就不斷釋放AI晶元方面的消息,今天果不其然帶來了一款語音AI晶元KAMINO18,它具備高集成度、低功耗、低成本的特點。它採用40納米工藝,由杭州國芯定製,台積電代工。
在2018年美國CES上,Rokid展示了其概念版的AR眼鏡,今天則帶來了量產版的Rokid AR Glass,它具備人臉識別、物體識別、室內導航、語音識別等能力。今年Q4季度實現真正量產,價格會與旗艦手機差不多。
(Rokid Me實拍圖)
會後,Rokid CEO Misa(祝銘明)等人接受了智東西等媒體的採訪,就智能音箱、AI晶元、AR眼鏡等方面進行溝通。Misa告訴智東西,Rokid已經拿下幾百萬片晶元訂單,是一款量產晶元。
一、四年首場發布會 先拋出一塊「漢堡」
「我們為了今天準備了四年」,身著黑T恤、黑牛仔庫、黑鞋子的Misa走上舞台,滿懷激動的談起了Rokid成立的初衷,就是探索人與科技交互的方式。
他介紹到,Rokid前面的「Ro」代表機器人,而「kid」有兩層含義,一是代表他們這樣一群對世界充滿好奇的小孩,二是代表現在的AI還在幼年期。
而Rokid從成立的第一天起就為自己定下home AI、portable AI、personal AI這三個方向,之後就推出了市場所看到的智能音箱Rokid Alien、Rokid Pebble。Misa宣布,Rokid產品與用戶實現了1億次交互,這是產品對過去交出的答卷。
今天Rokid又發布了一款新的便攜智能音箱Rokid Me,它的外形酷似一塊「漢堡」,有沒有。Rokid Me只有手掌大小,Misa稱它的重量是一聽可樂那麼重,並拋出與可口可樂推出的聯合產品,原來是為可口可樂做了一個廣告。
在公布價格之前,他開始不斷的拋出Rokid Me在硬體、設計、軟體等方面的賣點。
Rokid Me在硬體上採用了獨特的聲學結構,揚聲器朝向上,並且麥克風與揚聲器間只有1厘米的距離,市面上大多採用麥克風與揚聲器間隔較大距離的做法,來保證拾音效果。它採用了HiFi級的喇叭來保證音質,以及鋁合金音腔的機身。
在Rokid Me小巧的身材中還塞進去了一塊4000毫安的電池,Misa笑稱可以聽完周杰倫出道18年來的所有歌曲,來展示音箱的工作時間。
在軟體方面,Misa展示了Rokid Me四個有趣的功能:
1、聲紋識別,現場展示了一段「鸚鵡學舌」的視頻,鸚鵡呼喊「若琪」也無法使用;
2、搖一搖/翻轉,第一眼看到我還以為會是微信搖一搖,陌生人之間搖一搖就能加好友了呢。其實這個功能主要用於音樂,比如搖一搖音箱就會為你推薦一首歌曲。翻轉就會暫停,再翻轉繼續播放等,這增加了智能音箱的可把玩性。
3、藍牙電話,Misa稱有了遠場麥克風和高品質的揚聲器,為什麼不讓它來通話呢?
4、語音遊戲,Rokid推出一款角色扮演遊戲,名叫《四月迷案》。
講完賣點、功能、內容、品質後,Misa終於拋出了價格,799元人民幣,贈送兩年QQ音樂會員,7月26日全渠道開售。
接著,他又進一步宣布將Rokid Me的方案開放給開發者,並介紹了公司做產品的邏輯:Rokid最初在北京、美國成立研發中心,將語音、視覺的研究技術變成產品,當產品開發完成以後,再以平台及方案的形式進行開放輸出,去實現產業賦能。
「很多人都問我Rokid到底是to B還是to C」,Misa今天解釋到,「我們是to C的,不過這個C是community(社區)」。
可以發現若琪這三代智能音箱產品一代比一代小巧,價格也越來越平民化,可見其也努力在市場與用戶之間尋找一個平衡點。
但799元的價格似乎對於用戶也並不便宜,再結合國內當下的智能音箱價格戰,89、99元智能音箱滿街走。Misa則在會後談到,「這是一個雞血的戰場,要麼你變得很雞血,要麼很冷靜」,他認為一個成熟的市場,用戶最終會買跟自身調性相符的產品。
二、語音公司做晶元毋庸置疑
前一段,不僅有Misa在朋友圈曬的疑是AI晶元的開發板,接著Rokid也陸續傳出前三星半導體(中國)研究所所長周軍博士的加盟。果不其然,今天Rokid發布了一款KAMINO18語音AI晶元。
這是一款語音專用的SoC晶元,特點概括起來說就是高集成、低功耗、低成本。
它內部集成了ARM、NPU、DSP、DDR、DAC等多個核心元件,大小與一元硬幣相當。軟體方面,這款晶元支持相控陣技術、CTC模型、自定義喚醒詞、離線語音指令、低功耗喚醒等演算法,在整機工作狀態下,產品功耗可降低30%-50%。此外,這款AI晶元的整體成本低於市場主流通用晶元方案30%。
會後Misa介紹到,這款晶元是由杭州國芯為Rokid定製的,採用40納米工藝,由台積電代工生產。儘管這款晶元為40納米,卻比上一代Pebble音箱中16納米的晶元算力提升1.5倍。
在這款晶元的具體打造上,Rokid主要做的是晶元的架構優化,以及NPU指令集的設定。Misa也談了他們做晶元的理念,Rokid不是一家晶元公司,不是為做晶元而坐晶元,也不靠晶元賺錢。Rokid更注重通過晶元來提供足夠的算力,實現晶元與演算法更好的匹配,並降低成本,核心在於輸出解決方案。
5月初雲知聲發布語音AI晶元,其CEO黃偉稱,語音公司不做晶元必死無疑,Misa也回應道,「做語音的公司,毋庸置疑,一定要做晶元」,但他也指出兩家晶元的不同,「Rokid晶元是一個完整的解決方案,雲知聲的晶元更偏向控制」。
他還透露,NXP很快也會宣布跟Rokid的合作。
在智東西看來,這款語音晶元與內容、服務方面結合的更加緊密。這款語音晶元內置喜馬拉雅所有的能力,開發者可以直接對內容進行調用。此外,這款晶元還支持亞馬遜Alexa,並且不需要切換,皆可以實現多語言交互。
這是如何實現呢?智東西會後將這一問題拋給了Misa,他介紹晶元中直接內置了Alexa與Rokid兩個語音助手,通過language ID的技術,來判定用戶的語種,英文就Alexa回復,中文就若琪回復,可以自由切換。
當智東西問及是否有足夠規模的銷量來支撐這款晶元時,Misa透露到,「已經訂下來就有幾百萬片晶元了」,現場展示的小雅mini兒童音箱與甘布兒童產品都使用了這款晶元。
三、AR眼鏡年底量產
在今年美國的2018CES上,Rokid展示了其概念版的AR眼鏡,今天則帶來量產版的Rokid AR Glass,它具備人臉識別、物體識別、室內導航、語音識別等能力。
美國研發中心負責人姜公略從光學設計、硬體配置、可穿戴性等方面介紹道:
在光學設計上,AR眼鏡採用單鏡片AR光學技術,光效率達到50%以上,提供更鮮明圖像和續航能力,並搭配HD高清全彩影像。
硬體配置上,該AR眼鏡採用旗艦手機配置的處理器高通驍龍835,搭配1300萬像素光學防抖、慣性感測器、導音技術、麥克風陣列等。
而在重量上,這款產品為120克,姜公略那頭戴式AR對比到,頭戴式AR一般重量為500克,Rokid AR Glass輕了數倍。此外它還採用了類似墨鏡的設計,「市面上最像墨鏡的一款產品」,並且支持近視矯正。
在一段視頻中,Rokid展示了AR眼鏡對生活的改變,購物、相機、直播、人臉識別、物體識別、導航都可以通過它來實現。
會後,美國研發中心負責人姜公略透露道,AR眼鏡今年Q4季度實現真正量產,價格會與旗艦手機差不多。
結語:四年來首場發布會
作為一家創業公司,第一場發布會就拋出了一款智能音箱、一款AI晶元、一款AR眼鏡,確實不多見,可以說對這四年Rokid的發展做了一個交代。
在發布會的展示廳,我們也看到了Rokid團隊做的一些有趣的「黑科技」,比如3D空中投影、通過臉部識別的心率監測、通過語音控制的烤翅機器人等等,都呈現了Rokid對於技術與應用的探索。
但另一方面,隨著AI落地行業進入深水區。AI也開始到了向市場要銷量,向行業要規模的階段,這很可能將直接決定公司存亡。
而目前Rokid還在投入階段,如其CFO王舜德所言,Rokid在2019年還會是一個投入階段,但近兩年隨著裝機量和解決方案上來以後,收入也會上去。Rokid今天畫的這張餅會結出怎樣的果,最終還要市場來說話。
智東西專業矩陣社群正在招募,旨在為人工智慧從業者、學習者和愛好者搭建一個交流平台。加群方式:微信添加小助手zhidxcom001,準備名片入群。企業工程師優先。
1、AI技術群
(1)AI晶元群
(2)機器學習群
(3)自動駕駛群
2、AI應用群
(1)智能家居群
(2)智能音箱群
(3)AI+安防群
※谷歌大神讓AI自導自演 成片竟強勢入圍電影節!
※AI早報:谷歌雲工程師拒絕為軍事訂單開發雲服務
TAG:智東西 |