Magic Leap最新論文：邁向幾何型深度 SLAM

新聞 07-26

選自arXiv

機器之心編譯

參與：Smith

本篇文章把兩個 SLAM（同步定位與地圖構建）子任務作為機器學習問題，研發出了兩個簡單的數據生成器，用幾百行代碼就可以實現，設計了兩個可以實時運行的簡單的卷積神經網路，並且在人工合成數據和真實數據上都對它們進行了評估。

Magic Leap最新論文：邁向幾何型深度 SLAM

論文鏈接：https://arxiv.org/abs/1707.07410

摘要：我們提出了一種由兩個卷積神經網路驅動的點追蹤系統（point tracking system）。第一個網路，MagicPoint，對單一圖像進行操作，並且提取最重要的二維點。被提取的點是「SLAM-ready」的，因為它們是被分離設計，而且在圖像中是均勻分布的。我們把此種神經網路與經典的點探測器（point detectors）進行了比較，並且通過圖像噪點發現了它們之間顯著的性能表現差距。由於當被檢測點具有幾何穩定性時，轉化估計（transformation estimation ）是很簡單的，因此我們設計了第二個網路，MagicWarp，它作用幾幅點態圖像（MagicPoint的輸出）上，而且會對與輸入相關的單應矩陣（homography）進行估計。這一轉換引擎與傳統方法不同，因為它並沒有使用局部點描述器（local point descriptors），只使用了點定位（point locations）。兩個網路都是用簡單的人工數據進行訓練的，減少了對昂貴的外置攝像實況和高級圖形渲染渠道的需求。這一系統是快速且精益的，可以很輕鬆的在單一 CPU 上以 30+ FPS 的狀態運行。

深度點基礎追蹤（Deep Point-Based Tracking）概況：

深度點基礎追蹤系統如圖1 所示。在此追蹤系統中，兩個卷積神經網路是計算過程中的主力軍：MagicPoint 和 MagicWarp 。

Magic Leap最新論文：邁向幾何型深度 SLAM

圖 1：深度點基礎追蹤概況。幾幅圖像會被 MagicPoint 卷積神經網路進行處理，此網路會在圖像中檢測最重要的轉角（corner）。隨後生成的點態圖像會被 MagicWarp （另一個卷積神經網路）一起進行處理，以計算出一個與點態輸入圖像中的點相關的單應矩陣（homography）H 。

MagicPoint 概況：

Magic Leap最新論文：邁向幾何型深度 SLAM

圖 2 ：MagicPoint 架構。MagicPoint 網路作用於灰度圖像，並且對沒一個像素輸出一個「點」（point-ness）概率。我們使用了一個 VGG 樣式的編碼器和一個顯式解碼器。每一個在最後得到的 15x20x65 張量上的空間位置都代表了一個本地 8x8 區域的概率分布，和一個單一的「垃圾」通道（表示沒有檢測到點）。此網路是使用一個標準交叉熵損失（cross entropy loss）來進行訓練的，也使用了二維圖形渲染器的點態監督（見圖 3）。

Magic Leap最新論文：邁向幾何型深度 SLAM

圖 3：人工圖形數據集。人工圖形數據集包括渲染後的三角形，四邊形，線，立方體，棋盤格，還有星星，每一個都帶有實況轉角定位（ground truth corner locations）。它也包括一些沒有真實轉角的負像（negative images），比如橢圓和隨機雜訊圖像。

MagicWarp 概況：

Magic Leap最新論文：邁向幾何型深度 SLAM

圖 4：MagicWarp 架構。幾幅二進位點圖像連接在一起，然後輸入進一個標準化 VGG 類型的編碼器。3x3 單應矩陣 H 通過一個全連層進行輸出。隨後，H 被標準化（normalized），以保證其右下角元素是 1。已知從一張圖像到另一張圖像的對應關係，用彎曲點（warping points）對損失進行計算，並且測量它們和相應真實值之間的距離。

Magic Leap最新論文：邁向幾何型深度 SLAM

圖 5：MagicWarp 數據生成。為了生成二維點集對（2D point set pairs），我們為三維幾何體創建了三維點雲圖，並且在簡易三維軌跡的限制下把它們渲染進了虛擬攝像機。

MagicPoint 網路的部分評測結果：

Magic Leap最新論文：邁向幾何型深度 SLAM

表 1：人工圖形的相關結果。人工圖形數據集中10 種類別圖像的平均準確率（mAP，越高越好）和平均定位誤差（MLE，越低越好）。注意 MagicPointL 和 MagicPointS 在一定程度上不會受到圖像噪點的影響。

Magic Leap最新論文：邁向幾何型深度 SLAM

圖 6：噪點類型對合成圖形的影響。探測器性能會被噪點破壞。對傳統探測器來說，斑點雜訊（Speckle noise）尤其難以處理。

Magic Leap最新論文：邁向幾何型深度 SLAM

圖 7: 30個靜態轉角的數據集。我們在30個靜態轉角的數據集中的真實轉角位置的邊沿，對每一序列的樣幀進行了展示。這些序列來自四個不同的種類：棋盤格，分離的轉角，立方體，以及正方形。

Magic Leap最新論文：邁向幾何型深度 SLAM

表 2：靜態轉角結果。30個真實數據序列的平均準確率（mAP，越高越好），平均定位誤差（MLE，越低越好）和重複率（R，越高越好）。

MagicWarp 網路的部分評測結果：

Magic Leap最新論文：邁向幾何型深度 SLAM

表 3：匹配演算法的 90% 擊穿點實驗。這張表格比較了 MagicWarp 和最近鄰（Nearest Neighbor）匹配方法的匹配能力。

Magic Leap最新論文：邁向幾何型深度 SLAM

圖 8：工作中的 MagicWarp。四種轉換類型的 MagicWarp 實例在表 3 中有所總結。最左邊的一列展示了覆蓋在一個單一圖像上的點態圖像輸入對（point image input pair）。最右邊的一列展示了應用在灰色點集上的 MagicWarp 原始預測單應矩陣。中間的一行展示的是原始預測單應矩陣應用最近鄰方法所得到的 MagicWarp 結果，對正確的點的箭頭進行捕捉。

Magic Leap最新論文：邁向幾何型深度 SLAM

圖 9：工作中的 MagicPoint。這張圖展示了MagicPointS 與傳統轉角檢測基準的 15個實例結果。我們對每一張圖都展示了 MagicPointS 輸出，輸出概率熱圖，覆蓋對數（概率）熱圖（使低概率提高），還有 FAST，Harris，和 Shi 的相應情況。最頂行的一些實例是來自沒有雜訊的30個靜態轉角。中間的實例也來自沒有雜訊的30個靜態轉角。最底層的實例來自沒有雜訊的合成圖形。注意，我們的方法能夠處理大量的雜訊，並且能生成富有意義的熱圖，可以用一種特定應用的方式來開啟。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之心 的精彩文章:

※CVPR 2017最佳論文解讀：密集連接卷積網路
※CVPR 2017論文解讀：特徵金字塔網路FPN
※DeepMind ICML 2017論文：超越傳統強化學習的價值分布方法

TAG:機器之心 |

您可能感興趣

※邁向偉大之後 ? LeBron James 再稱 Lonzo Ball 為「Young King」
※Think Global, Think Hong Kong ——《邁向國際化的拍檔：香港》大型推廣會在東京舉行
※Yoshua Bengio談邁向硬體友好的深度學習
※擁抱變革 VMware創新Workspace ONE助力企業邁向現代數字化工作空間
※邁向世界的＋Ultra，noitaminA不會停下
※DeepMind眼疾AI準確度媲美頂尖醫生，準備邁向商用
※Silicon Labs:物聯網該怎樣邁向更大規模的新一代無線連接？
※邁向智能，最新操作系統Android P來了！
※印度Reliance邁向電商第一步，併購物流創業公司
※DataStoryCSO胡湛湛博士：如何由 CI 邁向AI 實現智能商業決策
※Yoshua：深度學習AI邁向人類水平的挑戰
※邁向5G的重要一步，英偉達收購Mellanox
※Roadstar.ai又添砝碼：自建模擬器，邁向運營深水區
※同步SGD等現有分散式訓練方式將過時，Yoshua Bengio談邁向硬體友好的深度學習
※高通最新的2Gbps LTE數據機是邁向5G的重要一步
※邁向IPO的WeWork，不斷收購的軟體戰略
※微軟混合設備HoloLens 2發布逐漸邁向成熟
※引領4K激光電視邁向普及海信（Hisense）80L5
※邁向成功的Chrome OS 這匹黑馬最近又進行了更新
※DirectX光線追蹤是圖形革命的第一步，微軟的3D API邁向了電影質量的圖形