的盧深視CEO戶磊:我們為什麼用3D人臉技術做安防?
2017年,蘋果將3D結構光帶到了手機領域,從此三維人臉識別便逐漸成為消費級市場頗為主流的識別方案。
不過,在行業的目光多停留在3D結構光的消費級應用時,卻有一家AI創企的盧深視,開始著眼於安防領域。
安防領域的三維人臉識別,與消費領域面臨的問題並不相同。
消費終端中的三維人臉識別,在使用期間往往只針對一個用戶的人臉進行反覆檢測與識別,因此是高頻的1:1比對,而每次比對過程中,演算法也可對真人的面部特徵進行多次提取,實現真實場景數據閉環回饋,利用生產環節的大數據進行半監督自主學習,提升性能。
而在安防這類公共場景中,單個用戶在區域攝像頭面前出現的頻次相對有限,且多數用戶的人臉底庫數據為二維照片,致使公共攝像頭難以對單個人臉的特徵進行更全面地提取和二次訓練,性能提升受限。
與此同時,從使用者層面講,消費級市場對人臉識別的容錯率相對較高,而安防客戶對靜態比對的準確度要求,幾乎不允許出任何差錯,這也讓許多專註視覺的企業望而卻步。
即便面臨著行業的種種挑戰,的盧深視仍決定專攻這些難點,打開公共安全三維人臉的市場。
打開今日頭條,查看更多圖片蘋果選擇了手機,的盧深視選擇了安防3D結構光,產品化的鼻祖可追溯到微軟。
2010年,微軟將PrimeSense技術最先應用在體感遊戲設備Kinec上,從而催生出一批消費級三維深度相機,也引發了一系列學術上的研究熱潮。
但事實上,體感遊戲這一市場並不成熟,體驗差,內容不足等問題,導致在體感遊戲後,3D結構光的應用陷入一個僵局。
而正當3D結構光折戟體感遊戲市場時,蘋果開始布局,於2013年收購了PrimeSense,以及多家產業鏈上下游企業。
蘋果的這一舉動,也讓業內人士看到了3D結構光應用的更多可能性。
師從高文院士,計算機視覺出身的戶磊,以及與被蘋果收購的動態捕捉技術公司faceshift創始人來自同一實驗室、後來成為的盧深視技術顧問的張舉勇,都敏感的觀察到了這一信號,他們開始思考著3D結構光在其他場景落地的前景。
在對市場有足夠的了解後,戶磊認為體感遊戲等並不成熟,而應用到手機上則存在模型壓縮等小型化的困難。
當時,戶磊和大多數廠家都沒有預料到,蘋果在收購PrimeSense 4年後的2017年,迅速的就將結構光帶到了手機上。但此時的戶磊,也敏銳的將目光投放到了安防領域。
此時的安防領域,所採用的基本是二維人臉識別技術和方案,易受到光照、遮擋等因素影響,且二維人臉識別的防作偽能力較弱,因此在對安全性要求較高的領域,對三維人臉的需要呼之欲出。
但想在B端安防領域的落地,也並不容易。
相對於消費領域,安防領域需要在一個鏡頭內識別多張人臉,逐一進行辨別,演算法的難度以及三維數據的採集、訓練難度都相對加大。
另外,安防領域對準確率的要求更高,要求誤識率更低,不容有失,這也對技術提出了更高的要求。
有契機,又有挑戰,戶磊決定最終在行業還比較空白時,專攻安防這一領域。於是在2015年,戶磊和他的團隊成立了的盧深視,開始正式探索三維人臉的市場。
「為什麼蘋果選擇了在手機上做3D結構光,而我們關注安防邊檢領域呢?」
「其實市場的孕育和市場窗口的出現,是跟實際相關的。我們覺得當時除了安防也沒有更合適的場景。在PrimeSense之後,國內廠商也有跟隨去做體感遊戲以及電影動畫特效的,但現在能看到這個市場並不成熟。而安防領域則有著強需求。」戶磊說道。
在三維人臉識別最初應用的時候,兩家企業選擇了兩個不同的方向,最終都成功打開了市場。
3D結構光技術,切入安防高端市場但當新技術在初初落地之時,總會有關於技術路線之爭。
而對於技術路線的選擇,計算機視覺出身的戶磊,顯然更有自己的見解。
目前較為流行的說法是TOF在識別精度和遠距離識別上都更有優勢。而實際上,戶磊認為,這些說法並不準確。
「這種說法太偏實驗室了」,戶磊說道。
從純理論的角度來說,TOF確實在精度、遠距離識別、抗干擾性具有更大潛能,但目前的測試和實際的應用中,TOF還遠遠達不到,實際來說,結構光在應用上相對更優。
就精度來說,目前結構光是現在唯一能夠在近距離達到毫米級的,毫米級的解析度是人臉識別的一個重要因素,否則臉上的特徵就會被抹掉。
TOF另外一個常被提及的點,就是遠距離下識別深度和精度比較穩定。雖然理論上如此,但實際上還不能達到。並且,運動物體,也會造成TOF的識別深度圖質量嚴重下降。
另外,對於市場上一些已經宣稱實現了三維人臉識別的產品,戶磊表示,這還並不是真正的三維人臉技術。
「目前,市面上很多都是假三維,即用二維人臉進行識別,然後再進行活體檢測。實際來說,這並不是真正的三維技術,它更像是一個二維人臉到三維的過渡產品。在平衡成本和檢測效率的情況下,它確實具有可用性,不過,這不是真正的三維人臉,也不同於我們所做的三維人臉。」戶磊說道。
對於技術有較為成熟的理解,的盧深視也在很多項目的實施中,確實展示出三維人臉的應用前景。
的盧深視在成立之初,就接到了某邊疆省份三維人像卡口項目。
對於這一項目,戶磊認為,是市場對於人臉識別的高要求找到了的盧深視。
在某邊疆省份公安廳的反恐項目中,的盧深視作為三維核心技術及平台產品提供商,共建了全國首個「三維人像資料庫」。
「維穩很難有一個比較明確的名單,需要進行人群甚至全人口庫的比對,因此,對識別精度要求也很高。」
戶磊介紹道,項目自2016年在上線至今,總通行人數超過百億。採集、存儲、布控的三維人臉庫在千萬級規模,產生百萬級別次有效報警,並且在空間上布及南北、各邊境關卡,全天候信息獲取,經受了各種複雜現場狀況和極端惡劣天氣的考驗。
更典型的是國內某大橋的通關項目。
該大橋是國家重點經濟區城市群的重要連接橋樑。城市之間的通行,如何讓人、車實現高效流通,成為一個關鍵問題。
由於地理位置所限,光環境非常複雜。尤其正午陽光直射,對識別提出了更高的要求,這就帶來了一個天然門檻。
被問及如何處理複雜光線,戶磊不無興奮的介紹道:
「這個其實還蠻有趣的,因為本身我們會做相機,就有涉及到光學的部分。有專門負責光學設計的同事,就把當時一些有趣的想法,應用到這個項目上。
舉個例子,針對逆光或者是側光的情況,對識別影響比較大。很多通行關口,會採用中午的時候關閉一些通行閘機來解決這個問題。但這對通行效率造成影響,無法保證實際使用體驗,那麼當時我們就採用了像偏振原理『直接過濾直射光線』,這樣來避免強光。」
這些細節的打磨,是的盧成功贏得項目的關鍵。
行業分工尚未形成,主打「開放的合作」當描述一個新興行業的時候,常常會提到競爭和挑戰。
對此,戶磊認為,三維人臉識別技術和應用還並不算很成熟,行業分工也還未形成。
和二維人臉在落地過程中遇到的一個問題一樣,人臉識別的產業鏈並不完善。
戶磊也提到,如攝像機中需要用到的3D感測器,的盧深視找了很多廠家,都不滿意,最終還是決定自己來做。
「你可以去類比一下,三維人臉的感測器,可能相當於比如說二、三十年前2D相機的狀態,就是非常的初級的一個狀態。我們其實最早的時候沒有打算一定要去做相機,但後面發現你不去做就無法滿足業務場景應用的需求,實際上也等不來。」
另一個問題,在三維人臉數據的處理上。
與二維人臉不同,三維人臉需要處理的是點雲數據。而目前主要應用的深度學習神經網路主要針對的是較為規整的平面圖像類數據。但點雲數據,是分散在一個三維空間中的不規整數據,如何能夠用深度學習的方法處理這些點雲數據,也是目前的一個難點。
第三個問題,則是三維人臉的研究數據嚴重不足。
大規模的深度神經網路訓練,離不開充足的數據進行訓練。相對於社交網路上傳播的很多二維人臉數據,三維人臉數據的獲取存在天然門檻。如果沒有實戰的場景不斷積累足夠的數據,產品化就會很難。「沒有充足的數據,其實是根本沒法去做的。」
因而,對於這個方興未艾的領域而言,產業格局尚未形成,剛剛呈現出清晰的曙光。各方所做的嘗試和努力,遠大於競爭。
戶磊的也認為,在這樣的行業背景下,的盧深視需要進行「開放的合作」。
「3D人臉識別的產業鏈,可大致分為器件、模組、系統和方案設計廠商、演算法廠商,及產品和應用廠商等環節。其實現在還沒有形成一個非常固定的行業,或者說產業上的分工其實還模糊。舉個例子,做相機方案的廠商,也有涉及深度計算的演算法,所以也可能會進一步做上層演算法。做演算法廠商會覺得,我也可以往上,做整個相機系統的設計。這也就是,為什麼我認為要有一個開放合作關係。」
目前,二維人臉識別正逐步落地、可用性不斷提高,但複雜光線、遮擋等問題,依然有待更有效的解決。與此同時,行人再識別、三維人臉等技術也在慢慢興起,共同解決人臉識別的問題。
而作為專註三維人臉的廠商,戶磊認為,短期內,二維人臉識別還要進行更多技術打磨。這其中,3D人臉,還擁有很大的機會。
「我們也很開心的是看到這兩年的學術的論文上,3D圖像正在越來越被大家所重視。我們也在做一些人體測量與動作分析的研究,希望這些東西結合起來,一起解決人的身份識別這個問題。
對於我們來說,我們堅持認為的是3D未來將來會普遍應用,會在廣泛的場景中取代二維的人臉識別,更好的解決準確識別人身份的問題。」雷鋒網雷鋒網雷鋒網
※智慧停車風口下,捷停車的商業邏輯
※微軟修復嚴重漏洞 360提醒XP用戶也要及時打補丁
TAG:雷鋒網 |