當前位置:
首頁 > 新聞 > Untouch推移動端3D手勢交互 稱視覺AI是下一個風口

Untouch推移動端3D手勢交互 稱視覺AI是下一個風口

雷鋒網按:2017年7月5日,專註於智能視覺交互技術提供商未動科技(Untouch)正式發布4款3D視覺交互產品:3D手勢識別產品——黎曼平台,3D人臉識別產品——歐拉平台,SLAM產品——笛卡爾平台,及場景重建產品——高斯平台。

Untouch推移動端3D手勢交互 稱視覺AI是下一個風口

在發布會開始,Untouch CEO孫錚調侃道,「今天是7月5號,都快被命名為是中國或者世界AI日了,今天一天好幾個發布會了,上午是百度(2017百度AI開發者大會),下午是阿里(智能音響天貓精靈X1的發布會),晚上又是我們。」作為低頭研發剛剛露面的科技公司,趕在同一天與大佬們一起發布產品,可以說是趕上了AI浪潮,卻也他們也擔心自己的產品能不能分得聚焦於大佬產品的目光。

今天的發布會是Untouch在媒體上的首次亮相,而其實公司成立已經有3年。未動科技有限公司公司成立於2014年,2015年完成數百萬人民幣天使輪融資,由英諾資本及大河資本領投,2016年底完成數百萬美元Pre-A輪融資,漢能創投獨家投資。在這3年時間裡他們一直致力於技術的研發,少有在媒體露面。未動科技專註於計算機3D視覺智能交互軟硬體方案,基於自主研發的智能3D視覺交互演算法,例如3D手勢識別、3D人臉識別、運動追蹤(SLAM)、場景重構等,賦予新型消費級智能設備與人、與場景的視覺交互能力。

黎曼平台——手機手勢交互產品

Untouch推移動端3D手勢交互 稱視覺AI是下一個風口

黎曼平台基於深度圖,實現3D手勢交互功能,可以為智能手機、機器人/無人機、AR/VR等提供手部26自由度追蹤與識別。據介紹,傳統的手勢識別對每一幀的手勢圖像進行獨立分析,而Untouch採用曾成功應用於機器翻譯的深度學習演算法LSTM(Long Short-Term Memory),把手勢動作當做一個時間序列來處理,提高了識別精度與運算效率。

另外,黎曼平台考慮到移動端的功耗與運算性能等限制性因素,經過深度演算法裁剪與大量工程優化,使得3D手勢識別可以流暢精準地運行在手機等移動設備上。傳統手勢識別產品基於PC,黎曼平台是一款基於深度攝像頭並可運行在手機等移動設備上的手勢識別產品。

小型化、嵌入式的3D手勢識別產品使手勢交互植入移動設備,這是目前顯而易見的一個大的趨勢。雷鋒網了解到,蘋果正在測試iPhone8的手勢識別功能和3D人臉識別功能,這將引爆移動端的交互方式。

語音之後,視覺AI是下一個風口?

Untouch推移動端3D手勢交互 稱視覺AI是下一個風口

未動科技的3D視覺智能交互軟硬體方案不僅使得手勢交互從PC端轉移到了移動端,帶來移動設備交互的更多可能,視覺智能還有更多可以發展和應用的方面。發布會還推出了另外三個3D視覺平台,能實現3D人臉識別的歐拉平台,其基於深度圖,實現人臉的實時建模與3D特徵識別,實現人臉3D表情的實時追蹤、識別與分析。除了身份識別驗證與表情分析,笛卡爾平台還可以讓用戶建立自己的頭像,體驗更有趣、好玩的社交體驗。運動跟蹤(SLAM)的笛卡爾平台實現空間計算與位置追蹤功能,可以為智能手機、機器人/無人機、AR/VR等提供6 DoF inside-out位置追蹤、路徑規劃軟硬體解決方案,厘米級別精度、低延遲、低功耗,為智能設備創造更多應用場景。場景重構的高斯平台基於深度攝像頭與RGB攝像頭,實現實時的空間計算,重建與渲染出真實的物理場景結構,從而實現障礙物躲避、AR追蹤、三維重建等功能,為計算設備的判斷與決策提供三維場景信息。

這些都是依靠視覺AI來實現的。亞馬遜的Echo和阿里的天貓精靈X1智能音響做的都是語音AI,而未動科技的出發點是視覺交互。孫錚介紹道,「我們做這些3D視覺軟硬體產品都是想為設備提供視覺感知,現在的智能產品越來越像人,人的特點就是感知。AI一定要有感知,要跟Sensor結合。AI要麼是基於聽覺的,要麼是基於視覺的,是因為人有這些感知。這是為什麼我們這次和PMD合作,他是一個Sensor的晶元廠商。只有抓住了sensor,才能去生產大腦。」

聯合專註3D感測器廠商PMD

PMD是一家無晶圓廠IC公司,公司位於德國西格根與美國聖何塞,是全球領先的基於CMOS的3D飛行時間數字圖像技術供應商。創立與2002年,公司擁有涉及ToF的應用程序、測量原理與實現方法的全球150個專利,PMD的3D感測器的應用主要包括工業自動化、自動駕駛、以及廣闊的消費電子領域例如AR/VR。全球第一款Tango手機聯想Phab2上的深度感測模塊就是PMD所提供。華碩最近推出的Tango&Daydream手機ZenFone的深度感測技術也來自於PMD。

專註ToF深度感測器廠商PMD宣布,選擇Untouch的黎曼平台作為中間件為客戶提供非接觸式的交互方案,雙方深度合作,推出了完整的手勢識別軟硬體一體方案。PMD總裁 Bernd Buxbaum表示:「我們非常激動能夠與Untouch緊密合作,有了Untouch提供的先進3D手勢識別技術,我們可以為移動終端設備提供直觀的、非接觸式的交互體驗。我們堅信,通過兩個公司的緊密合作,能夠加速手勢交互的大規模普及。」

新的交互方式帶來新的交互體驗。在《數字化生存》一書中,尼葛洛龐帝指了我們的數字化生活的發展趨勢,並不是更豐富的數據,更清晰的圖像,而是更自然的人機交互。例如,他認為,電視所要追求的並不是更高的清晰度,數字化電視引起的電視生產和消費的模式的變化才是更值得追求的。在「虛擬現實」這一章,他認為圖像的更新速度比圖像的解析度更為重要,我們對於圖像的感知不僅僅是視覺的,還與其他感官緊密相連,我們的運動神經會影響圖像的感知。目前,「計算機對人的存在的感覺真是遲鈍……很可能在不久的將來,計算機就能看到你「。他認為,未來的個性化界面能識別人的聲音,表情,手勢,還能追蹤人的眼球。對於各類消費電子來說,智能視覺交互技術會帶來更加自然友好的體驗。

數學家團隊

雷鋒網注意到,Untouch的核心團隊里不少數學家。他們發布的幾個3D視覺平台的名字:歐拉、笛卡爾、高斯這些都是著名數學家的名字。CEO孫錚有跨國高科技企業17年工作經驗,歷任微軟中國移動事業部總經理,中興芬蘭分公司總經理,中興西歐區副總經理,愛立信瑞典高級系統工程師,瑞典計算機研究所研究員,曾帶領中興西歐銷售團隊在4年間實現從0到10億歐元銷售額的突破。他也是全國數學奧林匹克競賽獲獎者,發現的數學定理被國際數學權威著作命名為「孫氏定理」。團隊其他成員由世界頂尖的計算機視覺、深度學習、嵌入式系統領域的專家組成,來自於微軟、中科院、清華、北大等公司或研究機構。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

又一職業要消失,這次是在酒吧
Ian Goodfellow牽頭舉辦NIPS機器學習對抗賽,提升系統魯棒性
大陸集團入股 EasyMile,合作布局自動駕駛技術研發
要成為自動駕駛時代的安卓,百度的Apollo還需要做哪些努力?

TAG:雷鋒網 |

您可能感興趣

用戶反饋iPhone XS/Max BUG:亮屏閑置後用手勢動畫會掉幀
Android Q大改進:手勢操作跟iPhone X幾乎一樣
Android P從iPhone X上學到了滑動手勢操作的精髓
Android Q手勢操作升級 加入類似3D Touch功能
Android P也要為全面屏大改導航欄,或加入類iPhone X手勢
Android Q手勢功能升級 向蘋果3D Touch靠齊
Android也有全面屏手勢操作了 但有點像iPhone X
iPhone X手勢操作
VRgineers發布了全新XTAL頭顯支持自動IPD調節和手勢跟蹤
iOS12:iPad將向iPhoneX借用一個手勢操作!
谷歌Android P加入新式iPhone X手勢
iPhone XR 手勢操作指南
FTC 批准了 Google 的手勢感測器 Project Soli
再次確認Android Q的新手勢抄襲MIUI 10系統
谷歌Android Q Beta 5開始推送:手勢導航再調整
外媒曝出iPhone XS/Max手勢動畫Bug
手勢操作哪家強 Android P對iPhone X
最新版Android P可能帶來iPhone X的手勢操作?
Android Q手勢操作跟iPhone X相似 對全面屏友好
Android P有望獲得類似於iPhone X的手勢導航操作