當前位置:
首頁 > 最新 > 一文教你如何輸入3D網格物體,得到分類概率的輸出

一文教你如何輸入3D網格物體,得到分類概率的輸出

在我們談到自動識別3D物體時很多人都認為幾乎是不可能的,但今天想要跟大家介紹的是如何輸入 3D 網格物體(原始三角形和頂點),得到分類概率的輸出。

▌數據準備

如今,圖像數據集包含大量樣本。但就 3D 模型數據集而言,並非如此。3D模型數據集中沒有成千上萬的圖像,因此 3D 模型識別沒有得到深入研究,3D 模型數據集也不均衡。大多數數據集包含有未進行方向對齊的物體。

ModelNet10 是一個相對清晰的 3D 物體數據集。3D 物體在數據集中被存儲為包含點線面的.off文件。 .off文件格式不支持顯示布料、紋理以及其他材質。

這裡是物體種類與樣本數量:

▌開始識別!

我們在上一步中做了一件非常重要的事情,即找到一種合適的方法將 3D 物體轉換成圖像,我們可以將其提供給神經網路(NN)。

步驟如下所示:

我們之前已經完成了第 1 步,所以現在我們開始第 2 步和第 3 步。

讓我們從模型創建開始。

你可以在架構中看到 RWMP 層。根據DeepPano論文,RWMP層的作用在於, 在 3D 物體圍繞主軸旋轉的情況下,保持識別精度不變。從技術上講,RWMP 只是一個行式的 MaxPooling。

模型準備就緒並編譯完成後,讀取數據,然後將其刷新,並通過圖像尺寸調節創建 ImageDataGenerator。

請注意,數據預先按照 70:15:15 的比例進行了訓練、驗證和測試。由於圖像是合成的,並且代表了 3D 物體,因此數據無法進行擴增,因為:由於圖像是灰度的,所以不能進行顏色增強。由於 RWMP 的存在,不能進行水平翻轉。

垂直翻轉意味著將物體顛倒。

由於圖像的合成性質,無法使用ZCA白化。

隨機旋轉會損失寶貴的物體邊角信息,我無法確定這會對3D物體轉換產生什麼影響。

所以我想不出任何可以應用在這裡的數據擴增方法。

現在開始訓練模型。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 電子發燒友網 的精彩文章:

從0到1硬體工程師學習如何開始?(附七大主流單片機的詳情)
中興高管大換血,新董事長李自學何以「中興」?

TAG:電子發燒友網 |