當前位置:
首頁 > 科技 > 用深度學習理解遙感圖像,識別效率提升90倍,PaddlePaddle&中科院遙感地球所

用深度學習理解遙感圖像,識別效率提升90倍,PaddlePaddle&中科院遙感地球所

乾明 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

高爾夫球場,長期以來的高端社交地,但其存在的背後,卻是對資源環境的侵襲。

不僅大量佔用土地資源、耗費水資源,而且在維護草坪的時候大量使用化肥農藥,會造成嚴重污染。

有多嚴重呢?

曾任江蘇省副省長的徐鳴此前接受《中國經濟周刊》專訪給出了一個對比:

「一個高爾夫球場的污染比一座普通工廠的污染還要嚴重。」

從2004年開始,有關部門就開始出台一系列政策限制球場建設,並在2017年前後開展了專項清理整治。

但整治效果該如何核查?

球場相對分散,且佔地面積比較大, 通過遙感圖像來檢測,是較優方案,高解析度光學遙感影像的普及也為球場檢測提供了有力數據支持。

哪怕這些數據都有,檢測起來卻不容易。

下面就是一張遙感圖像,忽略綠框,你能發現其中的高爾夫球場有多少,都在哪嗎?

一個熟練解譯人員從這樣的遙感圖像中檢測出來所有的高爾夫球場,需要15分鐘左右。

而現在,深度學習技術改變了這項工作的面貌。

只需10秒,就能夠在這樣的圖中,自動檢測出高爾夫球場。

相比之下,效率提高90倍。識別的準確度也達到了84%。

這並不是個案特例,而是整個應用方向的集體提升,正切切實實發生在中科院遙感地球所。

這一躍遷是怎麼發生的?又是一個怎樣的過程?

AI在圖像識別領域中已經頗有建樹許多年,為什麼到現在能力才體現出來?

想要回答這些問題,需要先回答——

為什麼原來處理遙感圖像很慢?

利用遙感圖像監測地表,是一個持續的過程。

中科院遙感地球所研究人員說,其中最大的難點就在於,同一個地方的環境和氣候,每年都會發生變化。

這會對理解遙感圖像的演算法造成極大的影響。

最直接的體現就是,原本針對這些地方構建的演算法,過了一年之後,就要有針對性地調優,適應這些變化,不然就會「罷工」。

而且, 這些演算法都與人的經驗有很強的關聯性,如果設計演算法的人離職,整個演算法就難以為繼了。

需要注意的是,這些演算法並不是自動化的,仍舊需要人工去配合。

中國960萬平方公里,想要完成一遍,至少需要千餘人集中工作2到3個月。

怎麼辦?可以用深度學習。現在, 遙感所是這樣做的:

針對一個地方構建樣本庫,然後基於樣本庫中的圖像訓練深度學習模型。

第二年,這一地方的環境和氣候發生變化,只需要把新的圖像加進樣本庫,然後重新把模型訓練一遍就可以了。

同時,這樣也能夠減少對人的依賴,模型的調整不再受限於專家經驗,而是依靠數據的變化。

而且,數據越來越多,也不再是累贅,而是提高模型精度的「養料」。

雖然現在看來,這一切都很高效且非常簡單。

但在從傳統的人工 演算法模式到現在深度學習的模式切換中,還經歷了不少困難。

用AI理解遙感圖像,有什麼難的?

圖像識別,可以說是當前AI領域比較成熟的技術了,各種用於圖像理解的深度學習模型層出不窮,而且在特定領域已達到了人類同等水準。

但問題在於,這些深度模型,主要是針對自然圖像的,如果直接用於理解遙感圖像效果就會大打折扣。

因為這兩類圖像之間有很大的差別。

首先,遙感圖像波段比較多,除了自然圖像的RGB三個波段之外,遙感圖像至少還要多出一個近紅外波段,一些衛星獲取的遙感影像有8個波段,高光譜圖像甚至有多達200多個波段。

其次,圖像的尺度差異也非常大,與自然圖像中利用尺度金字塔進行多尺度的識別相比,遙感圖像的尺度差異甚至要達到1:30 以上,才能較好地識別各個目標地物。

第三,有局部空間特徵失真的問題。自然圖像的失真,主要是因為感測器的邊緣失真和鏡頭失真,整體是可控的。但遙感圖像成像的失真,是由於在圖像獲取中的誤差產生的,相對來說是不可控的。

這些問題的存在,讓現有的深度學習演算法很難直接應用到遙感圖像理解任務中。不僅模型需要進一步優化,還需要框架提供支持:

不僅要在遙感影像讀入方面提供多波段的支持,還需要添加針對遙感影像的圖像增強演算法,考慮到多波段的顏色增強,以及局部空間特徵變形增強等等方面。

這些,正是百度在其深度學習框架PaddlePaddle中所做的事情,藉助這一框架,中科院遙感地球所,也正在完成一輪新的技術迭代。

應用正越來越廣泛

具體到我們一開始提到的高爾夫球場識別問題,中科院遙感所的研究人員藉助PaddlePaddle框架的支持,使用了Faster R-CNN目標檢測模型。

在專業、標準的高爾夫球場遙感數據集中,只需要10秒,就能夠檢測出遙感圖像中的所有球場。

用人工 演算法來識別,則需要15分鐘。

深度學習新方法讓工作效率提高了90倍,檢出準確率也能夠達到84%。

而且,深度學習並不僅僅只是用於自動化檢測高爾夫球場,還正在被用於理解遙感圖像中的機場,建設在山區中的風力和光伏發電站。

藉助深度學習技術,研究人員能夠根據遙感圖像快速識別出一個地區有多少太陽能面板,就有可能對這一地區能夠發多少電有清晰的預估,並為電網建設提供決策支持,避免「有電沒網」或者「有網沒電」的窘境。

根據國家能源局給出的數據,僅2018年,光伏發電就浪費了54.9億度,相當於200多萬家庭一年的用電量(按一家庭每月用電200度來計算)。

這背後的社會價值可見一斑。

而且,理解遙感圖像,只是PaddlePaddle解決實際問題的一個範例。

在計算機視覺領域,這個框架已經能夠支持模型完成圖像分類、目標檢測、圖像語義分割、場景文字識別、圖像生成、人體關鍵點檢測、視頻分類、度量學習等任務。

最後,附上一篇使用指南。如果你感興趣,可以收藏觀看~

訂閱AI內參,獲取AI行業資訊

加入社群

量子位AI社群開始招募啦,量子位社群分:AI討論群、AI 行業群、AI技術群;

歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「微信群」,獲取入群方式。(技術群與AI 行業群需經過審核,審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

喜歡就點「好看」吧 !

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

天文學家首次拍到黑洞:質量是太陽400萬倍,照片4月10日晚公之於眾
63萬張!曠視發布最大物體檢測數據集Objects365,物體檢測競賽登陸CVPR

TAG:量子位 |