自動駕駛的最大難點之一「地圖繪製工作」,被RoadTracer解決了一半
RoadTracer 能夠將錯誤率降低 45% 這一事實,對於谷歌這樣的科技巨頭所構建的自動化地圖繪製系統來說至關重要。
編譯 | 王宇欣
來源 | ScienceDaily
地圖類應用對現實世界影響深遠,然而已經繪製出的地圖卻僅僅是現實世界的一小部分。
地圖繪製是一件尤其乏味的工作:即使在拍攝了航拍圖像之後,谷歌之類的科技巨頭仍然需要耗費很多時間去手動繪製地圖。因此到目前為止,科技巨頭們還未完成全球約 2000 多萬英里道路的地圖繪製工作。
此外,地圖信息的缺失一直是一個棘手的問題,尤其對於仍處於開發階段的自動駕駛汽車系統來說更是如此。
為了解決這一問題,麻省理工學院計算機和人工智慧實驗室(CSAIL)的研究員們研發了一種自動構建路線圖的方法——RoadTracer(道路追蹤器),比現有方法的精確度高出 45%。
該團隊表示,在利用航拍圖像數據的基礎上,RoadTracer 不僅比現有方法更加精確,而且更具成本效益。
麻省理工學院的教授 Mohammad Alizadeh 認為,這項工作不僅會對谷歌這樣的科技巨頭起到作用,對一些缺乏資源創建地圖、糾正地圖錯誤的小型機構來說也是大有助益。
「RoadTracer 非常適合繪製那些經常需要更新地圖的區域,其中包括人口較少但卻頻繁施工的地方,」Alizadeh 說道,Alizadeh 近期與他人聯合發表了一篇關於 RoadTracer 的論文。
「以泰國郊區為例,一些偏遠郊區的地圖經常丟失了很多道路信息。RoadTracer 可以幫助繪製出更加精確的地圖。」
在使用紐約市航拍圖像的測試中,RoadTracer 可以正確繪製出 44% 的道路交叉口,不僅準確度比基於圖像分割的傳統方法 (通常只能繪製出 19%)高出兩倍,而且在效率上也不遑多讓。
這篇論文將在 6 月份猶他州鹽湖城舉辦的計算機視覺和模式識別會議(CVPR)上發布。本文是麻省理工學院 CSAIL 實驗室和卡達計算機研究所(QCRI)合作的成果。
Alizadeh 方面在麻省理工的合著者還包括 Fayven Bastani 和 Songtao He 等研究生以及 Hari Balakrishnan、Sam Madden 和 David DeWitt 等教授。
QCRI 方面的合著者包括高級軟體工程師 Sofiane Abbar 和 QCRI 數據分析小組的研究主管 Sanjay Chawla。
RoadTracer 系統如何創建地圖
訓練神經網路識別航拍圖像是當前自動化地圖繪製領域的常用方法,使用神經網路識別單個像素點,將其歸類為「道路」或是「非道路」。
因為航拍圖像通常模糊不清並且不甚完整,因此這類系統的運作通常還需要一個後續的處理步驟,來 填補圖像中的空白。
不幸的是,這些所謂的「分割方法」往往不大精確:如果模型錯誤地標記了一個像素點,這個錯誤將會在最終成型的地圖中被放大。
尤其是當航拍圖像中包含樹木、建築和陰影等干擾因素時,會模糊地圖中道路的開始與結束點,在這樣的情況下,錯誤尤其可能出現。(後處理步驟還需要根據僅有少量情況成立的假設作出決策,比如因為兩條道路彼此間隔很小就將其相連等。)
相比之下,RoadTracer 系統則是一步一步地創建地圖。
從道路上已知的位置開始,使用神經網路檢查周邊地區,以確定哪些點最有可能成為下一部分的道路。系統將最有可能的一點添加進地圖,不斷重複上述步驟,慢慢追蹤出這條道路。
Bastani 表示,「RoadTracer 並非同時檢索地圖中成千上萬個不同的點,決定它們分別代表道路的哪一部分,而是首先著眼於一個簡單的問題,即從一個已知道路的特定地點出發,再決定向哪個方向探索。在很多方面,這和我們人類構建周圍世界的心智模型的方式很像。」
該團隊使用了北美和歐洲的六個國家共計 25 個城市的航拍圖像在 RoadTracer 上進行訓練,然後又在另外 15 座城市評估了這個工具的繪圖能力。
「測繪系統需要在未訓練過的城市中達到優異的效果,這一點非常重要,因為那些地圖不存在或是不準確的區域才是 RoadTracer 大顯身手的地方。」Balakrishnan 說道。
Bastani 表示,RoadTracer 能夠將錯誤率降低 45% 這一事實,對於谷歌這樣的科技巨頭所構建的自動化地圖繪製系統來說至關重要。
「如果錯誤率太高的話,比起從推測的地圖中移除錯誤道路,還是從頭開始手動繪製地圖更加有效。」
儘管如此,實施像 RoadTracer 這樣的方式並不會讓人類 完全當一個旁觀者。該團隊表示 RoadTracer 的參與方式首先是繪製出大區域的路線圖,隨後讓人類專家仔細地進行二次檢查。
Alizadeh 說道,「很明確,RoadTracer 系統可以大大減少人類要完成的繁複工作。」
事實上,RoadTracer 的漸進式繪圖法有一個優點,它可以更容易地糾正錯誤——這樣人類監督者可以簡單地糾正錯誤,並從出錯的地方重新運行演算法,而不是像往常那樣由當前不準確的信息繼續探索地圖的其他部分。
當然,航拍圖像只是圖像繪製中眾多問題的一部分。航拍圖像不會顯示天橋和地下通道的信息,從空中根本不可能確定這些信息。
因此,該團隊還開發了可以從 GPS 數據創建地圖的演算法,並將這些方法合併到單個系統中進行地圖繪製。
目前,這個項目得到了卡達計算研究所的部分支持。
機器之能開年對話
8位AI行業局內人講述對過去、對未來的看法
※華為P20深度評測:這就是你期待能打破三星、蘋果壟斷市場的那部手機?
※谷歌在多倫多規劃的這座未來之城,漫無邊際的挑戰與陷阱
TAG:機器之能 |