用深度學習理解遙感圖像，識別效率提升90倍，PaddlePaddle＆中科院遙感地球所

科技 04-21

乾明發自凹非寺

量子位報道 | 公眾號 QbitAI

高爾夫球場，長期以來的高端社交地，但其存在的背後，卻是對資源環境的侵襲。

不僅大量佔用土地資源、耗費水資源，而且在維護草坪的時候大量使用化肥農藥，會造成嚴重污染。

有多嚴重呢？

曾任江蘇省副省長的徐鳴此前接受《中國經濟周刊》專訪給出了一個對比：

「一個高爾夫球場的污染比一座普通工廠的污染還要嚴重。」

從2004年開始，有關部門就開始出台一系列政策限制球場建設，並在2017年前後開展了專項清理整治。

但整治效果該如何核查？

球場相對分散，且佔地面積比較大，通過遙感圖像來檢測，是較優方案，高解析度光學遙感影像的普及也為球場檢測提供了有力數據支持。

哪怕這些數據都有，檢測起來卻不容易。

下面就是一張遙感圖像，忽略綠框，你能發現其中的高爾夫球場有多少，都在哪嗎？

一個熟練解譯人員從這樣的遙感圖像中檢測出來所有的高爾夫球場，需要15分鐘左右。

而現在，深度學習技術改變了這項工作的面貌。

只需10秒，就能夠在這樣的圖中，自動檢測出高爾夫球場。

相比之下，效率提高90倍。識別的準確度也達到了84%。

這並不是個案特例，而是整個應用方向的集體提升，正切切實實發生在中科院遙感地球所。

這一躍遷是怎麼發生的？又是一個怎樣的過程？

AI在圖像識別領域中已經頗有建樹許多年，為什麼到現在能力才體現出來？

想要回答這些問題，需要先回答——

為什麼原來處理遙感圖像很慢？

利用遙感圖像監測地表，是一個持續的過程。

中科院遙感地球所研究人員說，其中最大的難點就在於，同一個地方的環境和氣候，每年都會發生變化。

這會對理解遙感圖像的演算法造成極大的影響。

最直接的體現就是，原本針對這些地方構建的演算法，過了一年之後，就要有針對性地調優，適應這些變化，不然就會「罷工」。

而且，這些演算法都與人的經驗有很強的關聯性，如果設計演算法的人離職，整個演算法就難以為繼了。

需要注意的是，這些演算法並不是自動化的，仍舊需要人工去配合。

中國960萬平方公里，想要完成一遍，至少需要千餘人集中工作2到3個月。

怎麼辦？可以用深度學習。現在，遙感所是這樣做的：

針對一個地方構建樣本庫，然後基於樣本庫中的圖像訓練深度學習模型。

第二年，這一地方的環境和氣候發生變化，只需要把新的圖像加進樣本庫，然後重新把模型訓練一遍就可以了。

同時，這樣也能夠減少對人的依賴，模型的調整不再受限於專家經驗，而是依靠數據的變化。

而且，數據越來越多，也不再是累贅，而是提高模型精度的「養料」。

雖然現在看來，這一切都很高效且非常簡單。

但在從傳統的人工演算法模式到現在深度學習的模式切換中，還經歷了不少困難。

用AI理解遙感圖像，有什麼難的？

圖像識別，可以說是當前AI領域比較成熟的技術了，各種用於圖像理解的深度學習模型層出不窮，而且在特定領域已達到了人類同等水準。

但問題在於，這些深度模型，主要是針對自然圖像的，如果直接用於理解遙感圖像效果就會大打折扣。

因為這兩類圖像之間有很大的差別。

首先，遙感圖像波段比較多，除了自然圖像的RGB三個波段之外，遙感圖像至少還要多出一個近紅外波段，一些衛星獲取的遙感影像有8個波段，高光譜圖像甚至有多達200多個波段。

其次，圖像的尺度差異也非常大，與自然圖像中利用尺度金字塔進行多尺度的識別相比，遙感圖像的尺度差異甚至要達到1：30 以上，才能較好地識別各個目標地物。

第三，有局部空間特徵失真的問題。自然圖像的失真，主要是因為感測器的邊緣失真和鏡頭失真，整體是可控的。但遙感圖像成像的失真，是由於在圖像獲取中的誤差產生的，相對來說是不可控的。

這些問題的存在，讓現有的深度學習演算法很難直接應用到遙感圖像理解任務中。不僅模型需要進一步優化，還需要框架提供支持：

不僅要在遙感影像讀入方面提供多波段的支持，還需要添加針對遙感影像的圖像增強演算法，考慮到多波段的顏色增強，以及局部空間特徵變形增強等等方面。

這些，正是百度在其深度學習框架PaddlePaddle中所做的事情，藉助這一框架，中科院遙感地球所，也正在完成一輪新的技術迭代。

應用正越來越廣泛

具體到我們一開始提到的高爾夫球場識別問題，中科院遙感所的研究人員藉助PaddlePaddle框架的支持，使用了Faster R-CNN目標檢測模型。

在專業、標準的高爾夫球場遙感數據集中，只需要10秒，就能夠檢測出遙感圖像中的所有球場。

用人工演算法來識別，則需要15分鐘。

深度學習新方法讓工作效率提高了90倍，檢出準確率也能夠達到84%。

而且，深度學習並不僅僅只是用於自動化檢測高爾夫球場，還正在被用於理解遙感圖像中的機場，建設在山區中的風力和光伏發電站。

藉助深度學習技術，研究人員能夠根據遙感圖像快速識別出一個地區有多少太陽能面板，就有可能對這一地區能夠發多少電有清晰的預估，並為電網建設提供決策支持，避免「有電沒網」或者「有網沒電」的窘境。

根據國家能源局給出的數據，僅2018年，光伏發電就浪費了54.9億度，相當於200多萬家庭一年的用電量（按一家庭每月用電200度來計算）。

這背後的社會價值可見一斑。

而且，理解遙感圖像，只是PaddlePaddle解決實際問題的一個範例。

在計算機視覺領域，這個框架已經能夠支持模型完成圖像分類、目標檢測、圖像語義分割、場景文字識別、圖像生成、人體關鍵點檢測、視頻分類、度量學習等任務。

最後，附上一篇使用指南。如果你感興趣，可以收藏觀看~

—完—

訂閱AI內參，獲取AI行業資訊

加入社群

量子位AI社群開始招募啦，量子位社群分：AI討論群、AI 行業群、AI技術群；

歡迎對AI感興趣的同學，在量子位公眾號（QbitAI）對話界面回復關鍵字「微信群」，獲取入群方式。（技術群與AI 行業群需經過審核，審核較嚴，敬請諒解）

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話界面，回復「招聘」兩個字。

喜歡就點「好看」吧 !

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 量子位 的精彩文章:

※天文學家首次拍到黑洞：質量是太陽400萬倍，照片4月10日晚公之於眾
※63萬張！曠視發布最大物體檢測數據集Objects365，物體檢測競賽登陸CVPR

TAG:量子位 |