當前位置:
首頁 > 科技 > 為爭取到更多手機廠商,AI公司曠視科技正朝人臉識別方向努力

為爭取到更多手機廠商,AI公司曠視科技正朝人臉識別方向努力

圖片來源:視覺中國

毫無疑問,人臉識別已經成為手機廠商日益重視的功能模塊。

不論是vivo今年發布的旗艦機X21,還是OPPO的主打款 Find X,更不用提 iPhone X 在2017年問世時基於3D視覺感知的 Face ID ,與人臉識別相關的應用模塊已明顯成為趨勢。

從具體的應用來說,諸如屏幕解鎖、人臉支付、人像捕捉、美顏修圖等功能背後,均由 3D 的視覺方案來支撐。

什麼是 3D 的視覺方案?

如鈦媒體作者 Kiwi_s在介紹 OPPO的3D 視覺方案中談到的:如果我們把手機比喻為眼睛,那麼在傳統識別技術中,手機這雙「眼睛」看到的都是一個平面的世界,而3D視覺技術,則讓手機從平面視覺升級為立體視覺,從而對人臉識別的速度、精度實現質的提升。

目前行業中三種主流的3D視覺方案為:雙目立體視覺方案、3D結構光方案、TOF方案。

在三種不同的3D視覺方案中,它們各自都有鮮明的優缺點和不同的使用場景。其中,雙目方案屬於被動採集,而3D結構光和TOF技術則為主動採集方案,滿足了3D視覺上拍攝距離不同的應用場景細分。

被稱為國內「視覺識別 AI 四小龍」之一的曠視科技,就是為這些手機廠商提供人臉識別方案的幕後關鍵角色。

今年6月,曠視率先為OPPO、vivo提供基於安卓系統的3D視覺感知技術支持,並於近期發布業內首個「軟硬一體」的移動端3D感知全棧解決方案。

根據曠視的官方披露,所謂全棧方案,就是從演算法創新、應用開發、設備製造到解決方案,形成完整的產業閉環,具體來說,在曠視發布的軟硬一體移動端智能3D產品解決方案中,最上面一層是3D應用層,往下依次至AI演算法、解決方案,最後到攝像、感測等硬體設備製造上。

「手機3D視覺領域雖然已有多種類型的應用案例出來,但該領域包含演算法和模組的軟硬一體整體解決方案仍是缺位的,曠視科技正在嘗試一種從上往下的整合方案。」曠視科技雲事業部高級副總裁吳文昊介紹稱。

曠視科技雲事業部高級副總裁吳文昊

把一個全新的生態通過整合形成更具效率的角色分配,這件事並不容易,不過,曠視之所以成為這條產業鏈的「攢局者」,當中的深層原因一方面來自手機 AI 落地本身的難度;另一方面是來自行業客戶的需求。

從行業總體來說,在手機人臉識別背後的視覺感知技術方案,目前仍屬於起步階段。

蘋果就曾在人臉識別方案的落地遭遇過巨大挑戰,蘋果原本計劃在2016年便推出Face ID技術,並在當時已量產了4萬台 iPhone X 用以驗證方案。但鮮為人知的是,由於蘋果並不是一家做演算法的公司,相關的底層技術、演算法並不完善,出於對用戶體驗的考量,蘋果不得不推遲一年用以測試,到2017年才發布搭載Face ID的新一代iPhone。

產業鏈角色的分散,是手機端 AI 方案落地面臨的第一個難點。吳文昊談到了曠視與手機客戶討論項目的場景:開會時有十多家廠商參與,他們既來自世界各地,又分屬產業內感測器、模組、光電等不同環節,每一家都如同一個孤立的零部件,整個產業無法得到串聯。

「大家相互分散,很多做硬體的不懂軟體,做軟體的對硬體把控也不足,而最後的落地又需要應用去驅動。」吳文昊對鈦媒體說,他以刷臉支付舉例,當中識別人臉的精度、支付安全標準、對活體工攻擊的能力防範,這些問題都需要應用場景來反推驗證,並由產業鏈上的各個角色配合完成。

按照人臉識別在手機落地需要的 AI 方案,曠視也聯合多家合作夥伴,搭建了軟硬一體的移動端產品矩陣,具體為:

3D 應用:曠視研發的3D人臉識別解鎖和3D人像光效應用已經實現了規模化,同時在安全支付、3D 美顏、3D 整形等領域均有所涉獵,根據曠視透露,下一步將投入到AR遊戲、虛擬試穿等應用。

3D 演算法:在AI+3D的底層演算法研發方面,曠視專註於識別和重建兩個大類。識別即機器感知、理解世界的能力;重建即把識別出的物體進行三維重建,是開發針對人、針對物的3D視覺應用核心所在,曠視目前已與Bellus 3D、Altizure等3D視覺企業開展了聯合研發合作。

解決方案:曠視根據不同應用場景中對深度計算、深度修復、深度優化、標定、畸變校正等能力的需求,整合結構光、TOF、雙目等不同的攝像、感測系統架構,設計出基於雙攝、三攝、深攝的解決方案。

硬體模組:移動端3D產業鏈最下面一層是硬體製造,包含攝像頭、感測器、晶元等硬體模組的研發。結構光、TOF和雙目方案涉及到高清攝像頭、IR投射器、IR接收器、激光發光器等設備的搭配組合,曠視目前已經與艾邁斯半導體等3D硬體模組廠商展開合作。

曠視最新推出的3D 視覺全棧方案,即從演算法創新、應用開發、設備製造到解決方案,形成完整產業閉環。

可以看出,曠視在全棧方案的四層中主要涉及3D 應用層與演算法,而在曠視不太擅長的硬體及解決方案中,則採取了與三維技術集成商珠科創新、光場應用服務商疊鏡數字、感測器服務商艾邁斯半導體等合作夥伴共同開發的方式;此外,曠視還宣布將聯合主要晶元廠商合作研發演算法適配性更強的晶元,進一步優化手機3D應用能力。

隨著手機廠商對 3D 視覺識別技術的青睞,曠視在產業鏈上明顯的抱團動作,實則也是用「生態」形成壁壘的一種方式。而在AI 服務手機場景的戰場上,曠視的另一位競爭對手商湯科技也同樣動作頻頻。

今年5月,商湯實現了從2D人臉識別向3D結構光人臉識別的升級,這一技術已搭載於最新發布的小米8透明探索版,商湯科技聯合創始人、研究院院長王曉剛在接受界面新聞採訪時,也談到了對生態鏈的看法。

「蘋果、三星這樣的廠商是軟硬一體,可以提供整體的方案;國內的手機公司和技術提供方是分開的,這就需要兩邊更好地結合,才能和外國廠商抗衡。」

而在具體的合作方面,商湯科技的做法是,在頭部廠商落地方案之後,再把相關的技術標準化,形成類似SDK的整合,然後提供給更加長尾的客戶。之後,商湯科技還會逐漸形成一個平台,來提供更加綜合性的服務。

這樣來看,商湯主打技術產品化形成的「平台」,曠視則專註於搭建「生態」後成為軟硬一體的服務商。對於如何構建自己的門檻,曠視科技雲事業部高級副總裁吳文昊表示:「沒有哪一種策略是不能通過時間與金錢完成的。但重要的是,首先願不願意做改變,這是一個定位的問題;其次才是改變的決心和能力。」(本文首發鈦媒體,作者/蘇建勛)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 鈦媒體APP 的精彩文章:

世界盃的「流量之王」:馬蜂窩、知乎、BOSS直聘誰是最大贏家?
從趣店的現在,看拼多多的將來

TAG:鈦媒體APP |