深度學習訓練決策,Waymo披露ChauffeurNet進展
Waymo毫無疑問是全球目前唯一一家取得多個自動駕駛里程碑的公司,截止今年8月份其路測里程超過了1000萬英里,上周推出了商業無人駕駛計程車服務Waymo One。
現在,Waymo還在不斷挑戰未來。
在今天發表的一篇博文中,Waymo研究人員Mayank Bansal和Abhijit Ogale詳細描述了一種人工智慧駕駛系統培訓的方法,該方法以監督的方式利用標記的數據。
近年來,使用大量標記數據對深層神經網路進行有監督的訓練,在很多領域,特別是在物體感知和預測領域,已經迅速改進了最新技術,而且這些技術在Waymo得到了廣泛的應用。
憑藉感知能力,汽車可以使用相機和其他感測器檢測前面的車輛,識別它們是否成為潛在危險,並知道連續跟蹤它們的運動。這種能力擴展到車輛周圍的360度區域,使得車輛能夠在行駛時檢測和跟蹤所有移動和靜態物體。
感知是自動駕駛汽車安全運行的第一階段。一旦車輛能夠從周圍環境提取相關數據,它就能夠規劃前進的路徑。
為了滿足自動駕駛的複雜感知需求,Waymo獨立開發了一系列感知感測器,實現了車輛360°監控,包括:激光雷達、視覺系統、雷達系統以及其他感測器。
目前,Waymo搭載的激光雷達有三種類型,短距監控車輛周邊環境;中距高解析度;遠距激光雷達。
視覺系統由多組高解析度相機組成,在白天和光線較暗的地方也能很好地工作。定製化的雷達系統具有連續360°的視野,可以跟蹤在本車前後左右不同方位的其他車輛。
現在,上述研究人員表示,「隨著神經網路用於感知的成功,我們自然地問自己這樣一個問題:……我們能否用純監督的深度學習方法來訓練熟練的駕駛系統?」
為了建立一個能夠模仿專家駕駛員的系統,他們精心設計了一個神經網路,叫做ChauffeurNet,通過觀察真實和模擬數據的組合,包括地圖、周圍物體、紅綠燈,學習生成駕駛軌跡。
低級控制器將10點軌跡轉換為轉向和加速度指令,允許AI模型同時驅動真實車和數字車。
這個模型來自於「大約60天的專家駕駛數據」,使用技術確保它不會從過去的運動中推斷出來,而是對環境的變化做出實際反應。在測試中,它響應交通控制,如停止標誌和交通燈,但可以預見,當暴露於從未見過的情況時,性能很差。
研究人員指出,問題在於從現實駕駛中獲得的駕駛演示是有偏見的——它們只包含了在良好情況下駕駛的例子。為了訓練深度神經網路從邊緣案例中學習,研究小組綜合了很多車輛接近與物體碰撞的案例,從而與人工智慧模型進行配對。
目前,ChauffeurNet在模擬環境中表現得更好,比如在交通燈從黃色過渡到紅色時停止,並且從其軌跡的微小偏差中恢復。當用於在現實世界的路測時,它也能成功地遵循車道標誌和轉彎。
ChauffeurNet的目標是通過模擬學習來訓練一種自主駕駛策略,這種策略足夠健壯,可以駕駛真正的車輛。但問題是標準的行為克隆不足以處理複雜的駕駛場景,即使利用感知系統對輸入進行預處理,並利用控制器在汽車上執行輸出,但3000萬個例子仍然不夠。
但研究人員認為,完全自主的駕駛系統需要能夠處理現實世界中出現的長尾情況。今天在Waymo車輛上運行的規劃系統使用機器學習和顯式推理的組合來持續地評估大量的可能性,並在各種不同的場景下做出最佳的駕駛決策。
不過,最終對於完全機器學習的系統來替換Waymo現在使用的規劃器(目前Waymo的軟體系統由很多不同的部分組成,主要包括三大組件:感知、行為預測和規劃器)的標準非常高,這樣的系統組件可以暫時在Waymo規劃器的模擬測試期間用於創建更現實的「智能代理」。
活動預告
※自動駕駛的棘手難題:how safe is safe enough
※入圍年度Top100,愛馳首款量產車為何是一輛不給用戶添堵的車
TAG:高工智能 |