一文教你如何輸入3D網格物體，得到分類概率的輸出

最新 07-13

在我們談到自動識別3D物體時很多人都認為幾乎是不可能的，但今天想要跟大家介紹的是如何輸入 3D 網格物體（原始三角形和頂點），得到分類概率的輸出。

▌數據準備

如今，圖像數據集包含大量樣本。但就 3D 模型數據集而言，並非如此。3D模型數據集中沒有成千上萬的圖像，因此 3D 模型識別沒有得到深入研究，3D 模型數據集也不均衡。大多數數據集包含有未進行方向對齊的物體。

ModelNet10 是一個相對清晰的 3D 物體數據集。3D 物體在數據集中被存儲為包含點線面的.off文件。 .off文件格式不支持顯示布料、紋理以及其他材質。

這裡是物體種類與樣本數量：

▌開始識別！

我們在上一步中做了一件非常重要的事情，即找到一種合適的方法將 3D 物體轉換成圖像，我們可以將其提供給神經網路（NN）。

步驟如下所示：

我們之前已經完成了第 1 步，所以現在我們開始第 2 步和第 3 步。

讓我們從模型創建開始。

你可以在架構中看到 RWMP 層。根據DeepPano論文，RWMP層的作用在於，在 3D 物體圍繞主軸旋轉的情況下，保持識別精度不變。從技術上講，RWMP 只是一個行式的 MaxPooling。

模型準備就緒並編譯完成後，讀取數據，然後將其刷新，並通過圖像尺寸調節創建 ImageDataGenerator。

請注意，數據預先按照 70:15:15 的比例進行了訓練、驗證和測試。由於圖像是合成的，並且代表了 3D 物體，因此數據無法進行擴增，因為：由於圖像是灰度的，所以不能進行顏色增強。由於 RWMP 的存在，不能進行水平翻轉。

垂直翻轉意味著將物體顛倒。

由於圖像的合成性質，無法使用ZCA白化。

隨機旋轉會損失寶貴的物體邊角信息，我無法確定這會對3D物體轉換產生什麼影響。

所以我想不出任何可以應用在這裡的數據擴增方法。

現在開始訓練模型。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 電子發燒友網 的精彩文章: