Autodesk提出機器學習新演算法:使用「自動編碼器網路」探索生成3D形狀
原文來源:https://www.autodeskresearch.com
作者:Nobuyuki Umetani
「雷克世界」編譯:嗯~阿童木呀、多啦A亮
「機器人圈」正式更名為「雷克世界」,後台回復「雷克世界」查看更多詳情。
在本文中我們提出了一種新演算法,可以將非結構化三角形網格轉換為具有一致拓撲結構的機器學習應用程序。我們將正交深度圖計算(orthogonal depth map computation)和收縮包裝法(the shrink wrapping approach)結合在一起,從而在不考慮諸如反面、孔和自交點等缺陷的情況下,有效且穩健地參數化三角幾何形狀。轉換後的網格是經過連續地、緊湊地參數化的,因此是非常適用於機器學習的。我們使用自動編碼器網路來提取同一類別中的多個形狀來探索和合成各種形狀。除此之外,我們還引入一個直接操作界面來對合成過程進行導航。 我們在用非結構化三角形網格表示的1000多個汽車形狀中展示了我們的方法。
圖1:從非結構化三角形網格(左),我們的方法可以有效和具有魯棒地構造一個具有一致拓撲結構(中間)的四邊形網格,它是一個被緊湊參數化的高度圖(height map)(以顏色輪廓表示)。自動編碼器構造一組形狀的低維表示以合成新形狀(右)。我們的界面使得用戶在合成過程中能夠通過直接操縱形狀來交互地引導合成。
CCS概念
?計算方法神經網路;形狀建模
?應用計算計算機輔助設計;
關鍵詞
機器學習3D形狀,互動式形狀探索
簡介
眾所周知,近年來在機器學習領域取得了非凡的發展成就,從而引入了諸如分類、風格遷移和生成等各種應用,而這些應用的目標媒體就是圖像和音頻。不過非常遺憾的是,儘管現在互聯網上有大量的3D形狀可供使用,但3D形狀並沒有從機器學習中獲得諸多益處。這主要是因為機器學習演算法要求輸入和輸出數據具有一致的表示,例如正交排列的網格(即圖像中的像素)。非結構化三角形網格是計算機圖形中最受歡迎的曲面表示,但它們的拓撲結構通常是彼此互不相同的,從而阻礙了在機器學習的使用。
在本文中,我們提出了一種新的參數化技術,該方法可以有效地將給定的非結構化網格轉換為使用深度信息的具有一致連通性的流形網格。我們的參數化方法對於諸如孔、間隙和倒三角形之類的缺陷是具有非常穩健的魯棒性的。我們通過將形狀表示為一個強場(hight field),從而實現了對一個3D形狀的緊湊和明確的參數化,它是從一個簡單的原始多邊形的細分中得以提升的。我們通過對超過1000個汽車形狀進行參數化從而來證明我們方法具有穩健的魯棒性。
我們參數化的主要優點是生成準備進行機器學習的輸入和輸出數據(圖1-中間)。從同一類別中的許多形狀中,我們的自動編碼器網路構成了這些形狀的流形(manifold)。使用自動編碼器的低維表示,我們可以在交互速率下生成和探索三維形狀的變化(見圖1右)。我們還提供了互動式操縱三維形狀合成結果的界面,允許用戶直接指定生成形狀的頂點的位置。我們的貢獻概括如下:
?緊湊和高效地參數化三維形狀。
?自動編碼器構建三維形狀的流形。
?用於探索生成形狀的直接操縱界面。
結論
我們引入了一個參數化方法,將深度圖和吸塑包裝法結合起來,強有力地構建了一個連續參數化的三維形狀的機器學習。我們進一步展示了使用自動編碼器構造形狀流形,並提出了一個界面來直接操縱三維形狀的產生。
我們的方法不適用於高度凹陷的形狀,如字元的形體,因為粗糙的幾何體離立方體很遙遠。 這不是一個根本的限制,因為我們可以將基本最粗的網格改變為非立方體(如粗四邊形網格),或者將形狀分割成多個參數化的凸起部分。我們也考慮使用汽車形狀的多重表示來改善自動駕駛汽車的物體檢測框架。
論文下載:https://www.autodeskresearch.com/sites/default/files/paper.pdf
![](https://pic.pimg.tw/zzuyanan/1488615166-1259157397.png)
![](https://pic.pimg.tw/zzuyanan/1482887990-2595557020.jpg)
※神經網路中的「注意力」是什麼?怎麼用?這裡有一篇詳解
※「詞嵌入」在NLP中扮演什麼角色?一文搞懂Word Embeddings背後原理
※他是吳恩達導師,被馬雲聘為「達摩院」首座
※DeepMind最新論文提出「Rainbow」,將深度強化學習組合改進
TAG:雷克世界 |