當前位置:
首頁 > 最新 > 一種聚類「車輛駕駛相遇」數據的深度無監督學習方法

一種聚類「車輛駕駛相遇」數據的深度無監督學習方法

摘要:從「駕駛相遇」中學習到的東西可以幫助自動駕駛汽車在複雜的環境中與附近的車輛一起行駛時做出適當的決策。本文通過將自動編碼器與k均值聚類( AE - kMC )相結合,開發了一種無監督分類器,將自然「駕駛相遇」分成可區分的聚類。AE-kMC的有效性得到了驗證,它使用了密歇根大學(University of Michigan)過去5年收集的1萬次自然「駕駛相遇」的數據。我們將我們開發的方法與k-means聚類方法進行了比較,實驗結果表明AE-kMC方法優於原始的k-means聚類方法。

作者:Sisi Li, Wenshuo Wang, Zhaobin Mo, and DingZhao

索引項:「駕駛相遇」分類、無監督學習、自動編碼器

I.介紹

本論文中的「車輛駕駛相遇」指的是兩輛或多輛車在駕駛時在空間上靠近並彼此相互作用的場景。近年來,自動駕駛已經成為工業界和學術界的熱門話題,讓汽車在複雜的交通場景中與人類駕駛員一樣做出類似人的決定給自動駕駛車輛帶來了巨大的挑戰。

目前,處理複雜「駕駛相遇」的最流行的方法之一是,根據其具體應用,憑經驗手動將其分為幾個簡單的駕駛場景。例如,基於人類駕駛員主動-被動決策行為[3],將自動駕駛應用的變道行為分為不同類別[1]、[2],然後引入機器學習技術,如馬爾可夫決策過程(MDP)和部分可觀察的MDP(POMDP)[4],[5],以學習具體的決策模型。

一個訓練有素的模型通常需要足夠數量的自然駕駛數據[ 6 ]。[7]的作者將強化學習與博弈論相結合,利用交通模擬器生成的車輛交互數據,為自動駕駛汽車開發決策控制器。但是,當在現實世界的交通環境中部署時,[7]中訓練有素的控制器可能變得無效。此外,直接將訓練數據輸入模型而不進行任何分類無法充分利用基礎數據資源,從而可能錯過實際交通設置中的一些罕見但重要的駕駛場景。解決此問題的最大挑戰之一是從自然交通設置中獲取大量高質量的標記和分類交通數據,這對於學習決策模型的穩健性和準確性至關重要。

現代感測技術,如攝像機,激光雷達和雷達,可以收集多輛車遇到的大規模交通數據,具有很大的優勢;例如,密歇根大學交通研究所(UMTRI)在安娜堡配備了帶有GPS跟蹤器的多輛公共汽車,以收集自動駕駛汽車研究的車輛交互數據以及[8][9]中列出的更多已發布的資料庫,可以探索收集車輛的交互數據,用以開發自動駕駛車輛控制器並生成測試運動以評估自驅動演算法[10] - [12]。

然而,如何有效地標記如此龐大的數據集並以合理的方式分組「駕駛相遇」仍然是挑戰。手動標記大量數據是一項耗時的任務,這需要數據分析師具有豐富的先驗知識,涵蓋交通、智能車輛以及人為因素等領域。阿克曼聲稱,一小時標記良好的訓練數據,大約需要800個人工小時。Ohn-Bar [13]花費了相當長的時間來手動注釋錄製的駕駛視頻中的對象,以研究駕駛時有趣物體的重要性等級。

為了滿足基於數據的學習方法,工業界和學術界都需要一種能夠使標籤過程自動化的工具,從而有效地消除標籤成本[14]。近年來,除了對「駕駛相遇」進行分類之外,還已經對自動化數據標註過程進行了不少研究。例如,從使用監督學習方法[ 15 ]自動標註模糊推文到使用無監督學習方法(例如k - means ) [ 16 ]和半監督學習方法(例如,半監督支持向量機) [ 17 )對駕駛風格進行分類。

儘管上述無監督和半監督方法可以減少標記工作,但它們不適合處理大量高維時間序列數據。為了深入了解此類數據,深度學習方法越來越受歡迎。例如,自動編碼器及其擴展已被用於分析駕駛風格[18]和駕駛員行為[19],這從經驗上證明了它的有效性。對於自動駕駛汽車,來自這些手動預定類別的學習模型可能會受到以下限制:

1)手動標記大量高維數據需要過多的時間和資源成本,並且由於數據分析師的各種先驗知識而可能產生大的偏差。

2)用最適合人類理解的「駕駛相遇」分類來學習自動駕駛汽車的決策,可能不會產生最合適的結果。

本文提出了一個無監督的框架,即結合自動編碼器和k - means聚類( AE - kMC ),以較少的主觀干擾自動聚類「駕駛相遇」。自動編碼器被用作在「駕駛相遇」分類器中提取隱藏特徵的組件。這些數據是由M市歷時五年時間收集的,該市有2800多輛汽車,包括商用卡車和過境車輛。這項工作的最初貢獻是開發並實現了一個基於自動編碼器的框架,根據識別出的特徵自動標記「駕駛相遇」。據我們所知,這在其他地方還沒有被提出過。最後,我們對實驗結果進行了綜合分析。源代碼可以在這裡找到:https://github.com/zhao-lab/li-18-deep-unsupervised-ivs.

論文的其餘部分組織如下:第Ⅱ節詳細介紹了開發的AE - kMC方法;第III節顯示了「車輛相遇」數據收集和模型訓練程序;第IV節展示了實驗結果;第V節是結論和今後的工作。

Ⅱ.無監督學習方法

在本節中,我們將介紹兩種不同的無監督方案,使用k - means聚類和AE - kMC自動聚類「車輛相遇」。接下來,我們將介紹傳統自動編碼器的理論基礎、自動編碼器神經網路的結構以及k - means聚類方法。

A.自動編碼器框架

在這項工作中實現的自動編碼器是一個典型的自動編碼器,包含一個編碼器和一個解碼器,如圖1所示。

圖1:典型自動編碼器的結構。

1 )編碼器:在圖1中用橙色框標記的編碼器將輸入數據X∈Rn映射成隱藏表示X∈Rm[ 20 ]:

其中W∈Rm*n權重矩陣,b∈Rm是偏差項。

圖2 :本文使用的自動編碼器的結構。

與只有一個輸入層和一個輸出層的普通編碼器不同,我們使用的編碼器是四層神經網路包含一個輸入層( L1 )、兩個隱藏層( L2和L3 )和一個輸出層( L4 ),如圖2所示。添加了兩個隱藏層,因為根據通用逼近器定理[21],這兩個額外層中的每一個都代表任何函數的近似值。改進的編碼器有利於新的深度,因為可以降低訓練成本(計算成本和訓練數據大小)[21]。

其中Xi是層Li的輸入數據表示,而Wi,i+1和bi,i+1是權重向量和偏向量,分別能夠將Xi映射到Xi+1。請注意,第4層的數據表示是輸入數據的代碼或隱藏特徵。

2)解碼器:編碼數據或來自編碼器的隱藏表示將通過層L5和L7映射回,層L5和L7是原始輸入數據X的重建表示。注意,這項工作中使用的解碼器是一個深層神經網路,它包含一個輸入層( L4 )、兩個隱藏層( L5和L6 )和一個輸出層。

B.優化

為了從隱藏特徵重構輸入數據,重構的表示和原始輸入之間的誤差應該被最小化。因此,成本函數可以定義為:

其中Ω是包含權重向量和每層偏置向量的參數集,gΩ是將隱藏表示x映射到的映射。然後,優化問題被定義為:

C.k-Means聚類

k - means聚類是一種流行的無監督機器學習分類技術。將訓練好的自動編碼器應用於原始「車輛相遇」數據,可以提取隱藏特徵,然後將其輸入k - means聚類。給定n個觀測值並定義k類,k-means聚類方法通過求解優化問題將觀測值聚類成k組。

其中|xi-vj|是質心和觀測之間的歐幾里德距離[22]。目標函數嘗試選擇能夠最小化到屬於其各自聚類的所有點距離的質心,從而使這些質心代表周圍的數據點聚類。

III.數據收集和實驗

A.數據收集

圖3:「駕駛相遇」的示例。暗點是起點,光點是終點

我們使用的是安全試驗模型部署(SPMD)資料庫,該資料庫提供了足夠的自然數據[6]。該資料庫由密歇根大學交通研究所( UMTRI )負責,提供了過去五年在安娜堡地區記錄的駕駛數據。它包括大約3,500輛裝備的車輛和總共600萬次旅程。由機載GPS採集用於聚類的緯度和高度信息。對於每輛配備的車輛,數據收集過程從點火開始,以10hz的採樣頻率收集。

我們使用了100,000次旅程的數據集,從1900輛車中收集了12天的運行數據。我們提取的軌跡信息包括車輛的緯度,經度,速度和航向角。選擇範圍限制在市區,緯度和經度範圍分別為(-83.82,-83.64)和(42.22,42.34)。「車輛相遇」被定義為車輛距離小於100米的情況,如圖3所示。點表示每個採樣時間的車輛位置。在從SPMD資料庫查詢後,我們遇到了49,998次「車輛相遇」。

這些遭遇的分布如圖4所示。可以包含軌跡的最小矩形的中心點用於在一幅圖像中包含大量軌跡。注意,為了減少計算負荷,隨機選擇10,000次相遇來測試無監督的聚類方法。

圖4:「駕駛相遇」的分布。

B.模型訓練過程

圖5:模型訓練過程中的成本。

一次「車輛相遇」的GPS數據被用作自動編碼器的輸入。在此之前,數據被標準化因而可以將所有訓練數據放在相同的範圍內。在均勻分布之後,使用1和-1之間的隨機數初始化每個層的權重。更具體地說,我們設定了、、、、。採用經典的隨機梯度下降法進行學習,訓練過程中的成本函數值如圖5所示,訓練誤差收斂到0.041,這表明訓練有素的自動編碼器可以重建隱藏特徵的輸入數據。圖6示出了自動編碼器的原始輸入的示例,即原始車輛GPS軌跡。

圖6:原始車輛交互軌跡。 水平軸和垂直軸分別是車輛的經度和緯度。

IV.結果分析與討論

在這一部分,我們將展示和比較兩種無監督學習方法獲得的聚類結果。在真實的交通環境中,典型的「駕駛相遇」主要包括四種情況:

1)A類:兩輛車在交叉路口相遇。

2)B類:兩輛車在道路的相反方向相遇。

3)C類:一輛車繞過另一輛車;

4)D類:兩輛車在同一條道路上相互作用(有或沒有車道變換)。

圖7顯示了一個聚類結果的例子,其中包含交叉路口的交互行為。開發的AE-kMC成功地將車輛相互作用分為上述四類。

圖7:在交叉點遇到的兩輛車的集群。圓圈表示起始位置,十字表示終點位置。

圖8顯示了兩輛車從相反方向在同一道路上相遇的情景;圖9顯示了兩輛車在同一條道路上的相互作用。請注意,車道更改操作包含在此群集中,但很難從結果中識別。

圖8 :兩組車輛在同一條道路上相遇,方向相反。

圖9 :在同一條道路上遇到的兩輛車的集群。

一輛車經過另一輛車的交通場景如圖10所示。注意,在這種情況下,一輛車是靜止的(圖10a、圖10b、圖10c和圖10d ),或者是移動的,但是距離另一輛車較遠(圖10e和圖10f )。

圖10 :一輛車經過另一輛車的集群。

為了評估準確性,我們隨機混洗並重新採樣了從提議的方法中獲得的每個聚類的100個樣本然後我們手動識別那些不符合聚類中大多數樣本顯示模式的樣本。因此,每個群集的性能通過以下方式計算

其中nabnormal是異常數據的數量,Nsample= 100。我們提出的方法可以對具有相似地理特徵的「車輛相遇」進行聚類,但是每個聚類仍然包含異常「駕駛相遇」。表一顯示了集群的性能。還評估了僅使用k - means聚類的方法,結果表明,與使用AE - kMC的方法相比,該方法還可以將上述具有較低性能的車輛交互類別進行聚類。

表一:聚類性能分析

V.結論和今後的工作

在本文中,我們提出了一種無監督學習方法來聚類「車輛相遇」數據。更具體地說,引入自動編碼器來提取「駕駛相遇」的隱藏特徵,然後使用k - means聚類方法對提取的特徵進行分組。所提出的AE - kMC方法最終獲得了五種主要的典型車輛相遇類型,包括:1)兩輛車相互交叉; 2)兩輛車合併; 3)兩輛車在一條道路的相反方向相遇; 4)一輛車繞過另一輛車; 5)兩輛車在同一條道路上相互作用(有或沒有車道變換)。我們還比較了改進的AE - kMC方法和k - means聚類方法,結果表明我們改進的AE - kMC方法優於k - means聚類方法。

在未來的工作中,我們將專註於提高無監督聚類方法的準確性,包括評估不同類型的自動編碼器和聚類方法。此外,將研究目標「車輛相遇」提取,例如,環形交通環境中的車輛交互。

致謝

感謝豐田研究院(「TRI」)提供資金協助作者進行研究,但本文僅反映其作者的意見和結論,而非代表TRI或任何其他豐田實體。

REFERENCES

[1] J. Nilsson, J. Silvlin, M. Brannstrom,E. Coelingh, and J. Fredriksson,「If, when, and how to perform lane change maneuvers on highways,」IEEEIntelligent Transportation Systems Magazine, vol. 8, no. 4, pp.68–78, 2016.

[2] J. Nilsson, M. Br¨annstr¨om, E. Coelingh,and J. Fredriksson, 「Lane change maneuvers for automated vehicles,」 IEEETransactions on Intelligent Transportation Systems, vol. 18, no. 5, pp.1087–1096,2017.

[3] Q. H. Do, H. Tehrani, S. Mita, M.Egawa, K. Muto, and K. Yoneda,「Human drivers based active-passive model for automated lane change,」IEEE Intelligent Transportation Systems Magazine, vol. 9, no. 1, pp. 42–56,2017.

[4] C. Hubmann, M. Becker, D. Althoff, D. Lenz,and C. Stiller, 「Decision making for autonomous driving considering interactionand uncertain prediction of surrounding vehicles,」 in Intelligent VehiclesSymposium (IV), 2017 IEEE. IEEE, 2017, pp. 1671–1678.

[5] M. Kuderer, S. Gulati, and W. Burgard,「Learning driving styles for autonomous vehicles from demonstration,」 inRobotics and Automation (ICRA), 2015 IEEE International Conference on. IEEE,2015, pp. 2641–2646.

[6] W. Wang, C. Liu, and D. Zhao, 「How muchdata are enough? A statistical approach with case study on longitudinal drivingbehavior,」 IEEE Transactions on Intelligent Vehicles, vol. 2, no. 2, pp. 85–98,2017.

[7] N. Li, D. W. Oyler, M. Zhang, Y. Yildiz,I. Kolmanovsky, and A. R. Girard, 「Game theoretic modeling of driver andvehicle interactions for verification and validation of autonomous vehiclecontrol systems,」 IEEE Transactions on Control Systems Technology, vol. PP, no.99, pp. 1–16, 2017.

[8] W. Wang and D. Zhao, 「Extractingtraffic primitives directly from naturalistically logged data for self-drivingapplications,」 IEEE Robotics and Automation Letters, 2018, DOI: 10.1109/LRA.2018.2794604.

[9] D. Zhao, Y. Guo, and Y. J. Jia,「Trafficnet: An open naturalistic driving scenario library,」 arXiv preprintarXiv:1708.01872, 2017.

[10] D. Zhao, H. Lam, H. Peng, S. Bao, D.J. LeBlanc, K. Nobukawa, and C. S. Pan, 「Accelerated evaluation of automatedvehicles safety in lane-change scenarios based on importance sampling techniques,」IEEE transactions on intelligent transportation systems, vol. 18, no. 3, pp.595–607, 2017.

[11] D. Zhao, X. Huang, H. Peng, H. Lam, andD. J. LeBlanc, 「Accelerated evaluation of automated vehicles in car-followingmaneuvers,」 IEEE Transactions on Intelligent Transportation Systems, 2017.

[12] Z. Huang, H. Lam, D. J. LeBlanc, and D.Zhao, 「Accelerated evaluation of automated vehicles using piecewise mixturemodels,」 IEEE Transactions on Intelligent Transportation Systems, 2017.

[13] E. Ohn-Bar and M. M. Trivedi, 「Are allobjects equal? deep spatiotemporal importance prediction in driving videos,」Pattern Recognition, vol. 64, pp. 425–436, 2017.

[14] T. Appenzeller, 「The scientists』apprentice,」 Science, vol. 357, no. 6346, pp. 16–17, 2017.

[15] M. Erdmann, E. Ward, K. Ikeda, G. Hattori,C. Ono, and Y. Takishima,「Automatic labeling of training data for collecting tweets for ambiguoustv program titles,」 in 2013 International Conference on Social Computing, Sept2013, pp. 796–802.

[16] C. M. Martinez, M. Heucke, F.-Y. Wang,B. Gao, and D. Cao, 「Driving style recognition for intelligent vehicle controland advanced driver assistance: A survey,」 IEEE Transactions on IntelligentTransportation Systems, 2017, DOI: 10.1109/TITS.2017.2706978.

[17] W. Wang, J. Xi, A. Chong, and L. Li,「Driving style classification using a semisupervised support vector machine,」IEEE Transactions on Human-Machine Systems, vol. 47, no. 5, pp. 650–660, 2017.

[18] W. Dong, T. Yuan, K. Yang, C. Li, andS. Zhang, 「Autoencoder regularized network for driving style representationlearning,」 arXiv preprint arXiv:1701.01272, 2017.

[19] H. Liu, T. Taniguchi, Y. Tanaka, K.Takenaka, and T. Bando, 「Visualization of driving behavior based on hiddenfeature extraction by using deep learning,」 IEEE Transactions on IntelligentTransportation Systems, vol. 18, no. 9, pp. 2477–2489, 2017.

[20] P. Vincent, H. Larochelle, I. Lajoie,Y. Bengio, and P.-A. Manzagol,「Stacked denoising autoencoders: Learning useful representations in adeep network with a local denoising criterion,」 Journal of Machine LearningResearch, vol. 11, no. Dec, pp. 3371–3408, 2010.

[21] I. Goodfellow, Y. Bengio, A. Courville,and Y. Bengio, Deep learning. MIT press Cambridge, 2016, vol. 1.

[22] A. K. Jain, 「Data clustering: 50 yearsbeyond k-means,」 Pattern recognition letters, vol. 31, no. 8, pp. 651–666,2010.

[23] X. Huang, D. Zhao, and H. Peng, 「Empiricalstudy of dsrc performance based on safety pilot model deployment data,」 IEEETransactions on Intelligent Transportation Systems, 2017.


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 智車科技 的精彩文章:

基於信道模擬的車聯網外場通信模擬測試方案
平行無人駕駛通用小車平台2.0 現已開始訂購!

TAG:智車科技 |