當前位置:
首頁 > 最新 > 吳毅紅的視覺定位解決方案CASIA-VSLAM究竟如何給機器一雙慧眼?

吳毅紅的視覺定位解決方案CASIA-VSLAM究竟如何給機器一雙慧眼?

快,關注這個公眾號,一起漲姿勢

吳毅紅,中國科學院自動化研究所模式識別國家重點實驗室,教授研究員,博士生導師。

從事三維計算機視覺研究近20年,包括研究:相機標定與定位、圖像匹配、三維重建、SLAM,及在機器人定位與導航,AR,VR中的應用;

在計算機視覺領域頂級期刊、頂級國際會議等上發表論文70餘篇;

授權和申請國內外發明專利11 項,2項授權企業使用;

被法國IRIT實驗室、香港城市大學、諾基亞芬蘭研究中心多次邀請合作研究;

進行國內外大會特邀報告11場;

先後主持國家級863重大課題,973子課題,國家自然科學基金以及企業合作課題華為、三星、諾基亞等20餘項;

為企業提供VSLAM技術服務10年。

隨著第三波人工智慧浪潮的到來,從 AI 手機到智能家居,各種人工智慧設備越來越多的出現在我們的生活中。與此同時,人工智慧的發展也已經上升為國家意志。在《中國製造2025》戰略規劃中,我國明確指出「開發智能產品和自主可控的智能裝置並實現產業化」,「中國製造」要向「中國智造」轉型。《新一代人工智慧發展規劃》中更是明確了「人工智慧成為經濟發展的新引擎」。

正是在國家政策的大力扶持和萬億市場的催化下,中國人工智慧產業「正處在快速擴散階段」,AI、AR、VR等產業也在持續升溫。而視覺系統,是被公認的AI核心入口

在此浪潮下,吳毅紅博士率領模式識別國家重點實驗室機器人視覺團隊,利用幾十年的技術積累和大量的知識產權,推出了「CASIA-VSLAM」——智能移動終端的視覺定位解決方案。

AI的核心入口

機器視覺系統是通過視覺信息的採集和計算,來指導機器進行決策運動,從而實現特定的功能,而 VSLAM 技術是視覺系統的重要組成部分。

VSLAM,指利用視覺系統實現自主定位與地圖創建。簡單來說,就好比在未知的世界裡給了機器人一雙明亮的眼睛,讓它隨時可以知道自己的詳細位置信息。

舉個栗子:我們常用的掃地機器人,通過 VSLAM ,機器人可以一邊走一邊拍照,就和人一樣,走一遍就知道家裡哪裡有什麼,從而制定個最優的打掃路線。

GIF

GIF

這波秦王繞柱怎麼樣

相對於較早進入市場的 SLAM ,VSLAM可以說是進化版了,看的更清楚,判斷更準確,是智能機器人、AR/VR眼鏡頭盔、智能手機等移動終端相關應用中的核心技術。

那到底有什麼區別?栗子:兩塊尺寸相同,但內容卻不同的廣告牌,基於點雲的激光 SLAM 演算法只知道它是個牌子,但不知道牌子里是什麼畫面內容,而基於視覺的 VSLAM 不僅看見了廣告牌還看見了裡面的內容,這就厲害了

由於該技術涉及到複雜的視覺計算及高難度的系統集成能力,對產品的速度、功耗、體積、計算力等都有極高的要求,所以一直沒有很好的解決方案。

正因如此,機器人視覺團隊在三維視覺定位方面的長期技術積累和應用實踐下,推出了面向智能移動終端的視覺定位解決方案——CASIA-VSLAM,能夠為智能服務機器人提供快速、魯棒的三維地圖構建、定位與導航服務,為AR眼鏡、VR頭盔、智能手機等移動終端用戶提供更自然的三維場景交互服務。

「我們提出的這套方案實際上是一個綜合的視覺定位解決方案,分別針對廣告娛樂、在線教育、工業物流等不同場景中的具體應用需求,提出了針對性地視覺定位技術方案」負責團隊視覺定位技術研發與應用的李和平博士如是說。

CASIA-VSLAM 的相關應用場景

CASIA-VSLAM 充分考慮了不同場景中的實際應用需求。

首先,針對動態場景,能夠充分發揮3D信息的獨特性,以3D來輔助光流跟蹤,使得光流特徵跟蹤更精確;同時,對模型質量進行更有效地控制,得到更高質量的地圖點,進行實時跟蹤定位與在線三維重建,幫助解決動態目標AR/VR/MR應用中的定位難題。

沒懂?好,栗子出來吧,虛擬試衣鏡了解一下,雖然現在的虛擬試衣鏡讓人感覺有點「假」,但應用了VSLAM 技術的虛擬試衣鏡就足夠逼真了,讓衣服能夠真正的「穿」在你身上,而不再是敷衍的把衣服貼上去而已

GIF

動態人頭實時定位與在線三維建模

GIF

動態人頭實時定位與增強現實

這個小紅帽很適合你啊,換個眼鏡、圍巾啥的都不是事,還可以跟著你到處走,直播里用一下是不是主播買衣服的錢都省了,一秒換裝!

GIF

水瓶實時定位與增強現實

其次,以視覺為主,通過融合多種輔助感測器,結合多種幾何基元,能夠針對弱視覺場景,進行實時、精確、流暢的視覺定位與地圖構建,讓智能移動終端,在弱視覺區域中,即使只能看到兩個簡單的圓,也能魯棒工作。

例如,市面上現有的大部分跟隨機器人,行李箱等都很難在弱光中繼續使用,而通過 VSLAM ,機器人就可以在弱光中清晰的識別自己身處的環境。告別「人工智障」,從擁有一雙弱視覺環境中的眼睛開始~

GIF

GIF

機器人在弱視覺場景中的點線融合定位

同樣,在相對空曠的區域,或者紋理較單一的環境下,機器同樣能夠做到快速定位。

GIF

機器人在長通道場景中的魯棒定位與構圖

GIF

機器人在強光線/弱紋理場景中的魯棒定位與構圖

GIF

手機在弱紋理區域中的魯棒定位與構圖

GIF

手機在弱紋理配電箱中的魯棒定位與增強現實

我們都知道目前無人車測試多在路面上進行,而通過 VSLAM 技術,無人車還能在車庫裡自由穿梭啦!經常在車庫中迷失方向?以後有了 VSLAM,帶你分分鐘走出停車場!

GIF

弱視覺環境下的輔助駕駛視覺里程計

還記得去年天舟一號與天宮二號的深情相擁嗎?

GIF

類似於航天器的對接,VSLAM 也能僅通過兩個圓來實現視覺定位。

GIF

僅依靠簡單幾何信息(兩個圓)的視覺定位

李和平博士說:「弱視覺場景是指存在弱紋理、強光、弱光、長通道、大片空曠區域等有效視覺信息量非常少的場景。這些場景是計算機視覺領域長期以來存在的頑固性的挑戰難題。我們通過融合單目/雙目、IMU等多種感測器以及點、線、面等多種基元,針對性地解決這些難題。」

最後,針對城市大場景,在千萬級的點雲上,只採用CPU,可達到毫秒級的定位

也就是說,通過VSLAM 技術,不僅能讓你在大街上丟不了,當你進入任何室內場景時,還能繼續提供精準的定位。餓著肚子在商場里繞圈找自己想吃的餐廳?不存在的!

GIF

城市千萬級點雲毫秒級定位

GIF

十萬級點雲實時定位

GIF

安防視頻快速定位跟蹤與信息增強

作為目前國內最頂級的 VSLAM 技術,2018年 CASIA-VSLAM 視覺定位解決方案,將融合多種感測器,陸續在教育、物流、娛樂等應用場景測試落地。相信在人工智慧加持下,一定會帶來新的產業升級變革。

局長貼心福利,想了解該技術合作的特工們可以掃碼添加李博士了解詳情↓

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 華頤AI情報局 的精彩文章:

抖音:花式賣假貨?我家的AI不會再放過你!

TAG:華頤AI情報局 |