吳毅紅的視覺定位解決方案CASIA-VSLAM究竟如何給機器一雙慧眼？

最新 04-07

快，關注這個公眾號，一起漲姿勢

～

吳毅紅，中國科學院自動化研究所模式識別國家重點實驗室，教授研究員，博士生導師。

從事三維計算機視覺研究近20年，包括研究：相機標定與定位、圖像匹配、三維重建、SLAM，及在機器人定位與導航，AR，VR中的應用；

在計算機視覺領域頂級期刊、頂級國際會議等上發表論文70餘篇；

授權和申請國內外發明專利11 項，2項授權企業使用；

被法國IRIT實驗室、香港城市大學、諾基亞芬蘭研究中心多次邀請合作研究；

進行國內外大會特邀報告11場；

先後主持國家級863重大課題，973子課題，國家自然科學基金以及企業合作課題華為、三星、諾基亞等20餘項；

為企業提供VSLAM技術服務10年。

隨著第三波人工智慧浪潮的到來，從 AI 手機到智能家居，各種人工智慧設備越來越多的出現在我們的生活中。與此同時，人工智慧的發展也已經上升為國家意志。在《中國製造2025》戰略規劃中，我國明確指出「開發智能產品和自主可控的智能裝置並實現產業化」，「中國製造」要向「中國智造」轉型。《新一代人工智慧發展規劃》中更是明確了「人工智慧成為經濟發展的新引擎」。

正是在國家政策的大力扶持和萬億市場的催化下，中國人工智慧產業「正處在快速擴散階段」，AI、AR、VR等產業也在持續升溫。而視覺系統，是被公認的AI核心入口。

在此浪潮下，吳毅紅博士率領模式識別國家重點實驗室機器人視覺團隊，利用幾十年的技術積累和大量的知識產權，推出了「CASIA-VSLAM」——智能移動終端的視覺定位解決方案。

AI的核心入口

機器視覺系統是通過視覺信息的採集和計算，來指導機器進行決策運動，從而實現特定的功能，而 VSLAM 技術是視覺系統的重要組成部分。

VSLAM，指利用視覺系統實現自主定位與地圖創建。簡單來說，就好比在未知的世界裡給了機器人一雙明亮的眼睛，讓它隨時可以知道自己的詳細位置信息。

舉個栗子：我們常用的掃地機器人，通過 VSLAM ，機器人可以一邊走一邊拍照，就和人一樣，走一遍就知道家裡哪裡有什麼，從而制定個最優的打掃路線。

GIF

這波秦王繞柱怎麼樣

相對於較早進入市場的 SLAM ，VSLAM可以說是進化版了，看的更清楚，判斷更準確，是智能機器人、AR/VR眼鏡頭盔、智能手機等移動終端相關應用中的核心技術。

那到底有什麼區別？栗子：兩塊尺寸相同，但內容卻不同的廣告牌，基於點雲的激光 SLAM 演算法只知道它是個牌子，但不知道牌子里是什麼畫面內容，而基於視覺的 VSLAM 不僅看見了廣告牌還看見了裡面的內容，這就厲害了

由於該技術涉及到複雜的視覺計算及高難度的系統集成能力，對產品的速度、功耗、體積、計算力等都有極高的要求，所以一直沒有很好的解決方案。

正因如此，機器人視覺團隊在三維視覺定位方面的長期技術積累和應用實踐下，推出了面向智能移動終端的視覺定位解決方案——CASIA-VSLAM，能夠為智能服務機器人提供快速、魯棒的三維地圖構建、定位與導航服務，為AR眼鏡、VR頭盔、智能手機等移動終端用戶提供更自然的三維場景交互服務。

「我們提出的這套方案實際上是一個綜合的視覺定位解決方案，分別針對廣告娛樂、在線教育、工業物流等不同場景中的具體應用需求，提出了針對性地視覺定位技術方案」負責團隊視覺定位技術研發與應用的李和平博士如是說。

CASIA-VSLAM 的相關應用場景

CASIA-VSLAM 充分考慮了不同場景中的實際應用需求。

首先，針對動態場景，能夠充分發揮3D信息的獨特性，以3D來輔助光流跟蹤，使得光流特徵跟蹤更精確；同時，對模型質量進行更有效地控制，得到更高質量的地圖點，進行實時跟蹤定位與在線三維重建，幫助解決動態目標AR/VR/MR應用中的定位難題。

沒懂？好，栗子出來吧，虛擬試衣鏡了解一下，雖然現在的虛擬試衣鏡讓人感覺有點「假」，但應用了VSLAM 技術的虛擬試衣鏡就足夠逼真了，讓衣服能夠真正的「穿」在你身上，而不再是敷衍的把衣服貼上去而已

GIF

動態人頭實時定位與在線三維建模

GIF

動態人頭實時定位與增強現實

這個小紅帽很適合你啊，換個眼鏡、圍巾啥的都不是事，還可以跟著你到處走，直播里用一下是不是主播買衣服的錢都省了，一秒換裝！

GIF

水瓶實時定位與增強現實

其次，以視覺為主，通過融合多種輔助感測器，結合多種幾何基元，能夠針對弱視覺場景，進行實時、精確、流暢的視覺定位與地圖構建，讓智能移動終端，在弱視覺區域中，即使只能看到兩個簡單的圓，也能魯棒工作。

例如，市面上現有的大部分跟隨機器人，行李箱等都很難在弱光中繼續使用，而通過 VSLAM ，機器人就可以在弱光中清晰的識別自己身處的環境。告別「人工智障」，從擁有一雙弱視覺環境中的眼睛開始~

GIF

機器人在弱視覺場景中的點線融合定位

同樣，在相對空曠的區域，或者紋理較單一的環境下，機器同樣能夠做到快速定位。

GIF

機器人在長通道場景中的魯棒定位與構圖

GIF

機器人在強光線/弱紋理場景中的魯棒定位與構圖

GIF

手機在弱紋理區域中的魯棒定位與構圖

GIF

手機在弱紋理配電箱中的魯棒定位與增強現實

我們都知道目前無人車測試多在路面上進行，而通過 VSLAM 技術，無人車還能在車庫裡自由穿梭啦！經常在車庫中迷失方向？以後有了 VSLAM，帶你分分鐘走出停車場！

GIF

弱視覺環境下的輔助駕駛視覺里程計

還記得去年天舟一號與天宮二號的深情相擁嗎？

GIF

類似於航天器的對接，VSLAM 也能僅通過兩個圓來實現視覺定位。

GIF

僅依靠簡單幾何信息（兩個圓）的視覺定位

李和平博士說：「弱視覺場景是指存在弱紋理、強光、弱光、長通道、大片空曠區域等有效視覺信息量非常少的場景。這些場景是計算機視覺領域長期以來存在的頑固性的挑戰難題。我們通過融合單目/雙目、IMU等多種感測器以及點、線、面等多種基元，針對性地解決這些難題。」

最後，針對城市大場景，在千萬級的點雲上，只採用CPU，可達到毫秒級的定位。

也就是說，通過VSLAM 技術，不僅能讓你在大街上丟不了，當你進入任何室內場景時，還能繼續提供精準的定位。餓著肚子在商場里繞圈找自己想吃的餐廳？不存在的！

GIF

城市千萬級點雲毫秒級定位

GIF

十萬級點雲實時定位

GIF

安防視頻快速定位跟蹤與信息增強

作為目前國內最頂級的 VSLAM 技術，2018年 CASIA-VSLAM 視覺定位解決方案，將融合多種感測器，陸續在教育、物流、娛樂等應用場景測試落地。相信在人工智慧加持下，一定會帶來新的產業升級變革。

局長貼心福利，想了解該技術合作的特工們可以掃碼添加李博士了解詳情↓

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 華頤AI情報局 的精彩文章:

※抖音：花式賣假貨？我家的AI不會再放過你！

TAG:華頤AI情報局 |