機器學習演算法在自動駕駛汽車中扮演怎樣的角色
轉自:大數據文摘 | bigdatadigest
當今,機器學習演算法已被廣泛運用,尤其是處理自動駕駛中遇到的問題時。隨著電子控制單元感測器數據處理這項技術的繼續發展,人們也越來越期待運用更優化的機器學習,來完成更多新挑戰。未來的潛在應用場景包括:通過內外部感測器(包括激光雷達,聲學雷達,相機和物聯網等)數據綜合評估駕駛者狀態,分類情景駕駛,等等。
這項車載系統中的應用能夠通過分析上述感測器收集到的訊息作出應對。比如,檢測到駕駛者異常,則將車輛自動駕駛到醫院。這項基於機器學習的應用還具備識別駕駛者語音、手勢和自動翻譯等功能。這裡所提到的演算法,包括無監督學習和監督學習兩類,兩者區別在於差異化的學習方式。
監督學習是利用訓練數據集進行學習的,學習過程持續直至演算法達到了它們需求的置信水平(錯誤概率的最小化)。它又進一步可分為回歸、分類和異常檢測。
無監督學習則是嘗試從當前可用數據中獲取價值。也就是說,這種方式是在已有信息中建立聯繫,以期發現模式,或者根據數據之間的相似度將數據集進一步劃分。無監督學習大部分歸為相關學習和聚類。
強化學習演算法則是介於監督學習和無監督學習之間的演算法。監督學習中,每一個訓練樣本對應著一個目標標記;無監督學習中沒有相應的標記;強化學習則是由延遲並稀疏的標記——回報函數來構成。
(和上面一段合并)回報函數能夠輔助學習如何在環境中行動。
通過理解演算法的優點與不足,以期實現開發更高效的演算法這一目標。強化學習擁有著廣泛的應用前景,包括人工智慧、控制工程,或者運籌學,等等。而上述這些也都與開發自動駕駛汽車息息相關。
在自動駕駛技術中,機器學習演算法主要任務即不間斷監控周圍環境,並預測將會發生的變化。這類任務又能進一步劃分為:
物體檢測
物體識別或分類
物體定位和行為預測
於此相對應的機器學習演算法大致又會分為四類:決策矩陣演算法,聚類演算法,模式識別演算法和回歸演算法。每一類演算法都可被用於完成兩個或多個任務。例如,回歸演算法可以用於物體定位以及物體檢測和行動預測上。
決策矩陣演算法
決策矩陣演算法能夠系統分析、確定並評估信息集和價值集之間的關聯表現。這類演算法主要用於決策。車輛在行駛中是否需要剎車或是向左轉,就是基於演算法對於識別、分類和物體行動預測的置信水平下所做的決策。決策矩陣演算法模型由許多獨立訓練的決策模型所組成,最終預測結果也由這些模型的預測結匯總組成,這會大大降低決策出錯率。AdaBoosting就是該類型中最常用到的演算法。
適應性增強
適應性增強,或者說AdaBoost,是由不同的可用於回歸和分類的學習演算法所組成。相較於其他機器學習演算法,它能克服對於異常值和雜訊敏感的過擬合問題。為了創造一個複合的強力學習器,AdaBoost利用了多次迭代,具有更強的適應性。通過迭代式地加入弱學習器,AdaBoost創造了一個強學習器。一個新的弱學習器會被附於整體,然後通過調整各學習器的權重向量來讓演算法更多關註上一輪迭代時錯誤分類的數據。最終我們會獲得一個比弱學習器精準得多的分類器。
AdaBoost可以增強一個弱的閥值分類器到一個強的分類器。上面的這張圖描述了這一實現過程。函數由弱學習器和增強組分構成。弱學習器嘗試在某單一維度確定理想分類閥值來分開兩類數據。而在增強階段,該基礎分類器被不斷迭代式地調用,每一步分類之後,演算法改變錯誤分類數據的權值。由於此,一串弱分類器能表現得像一個強分類器。
聚類演算法
有時,會出現系統獲得的圖像不清晰,難以定位、檢測物體。還會有些情況,分類演算法沒檢測到物體,系統分類彙報失效。引起上述問題的原因可能是不連續的數據,不足量的數據點或是低解析度的圖片。
聚類演算法就專門用於發掘數據中的結構。它描述了像回歸一樣一類的演算法。它由層級結構和中心結構所組織起來。所有的方法利用了數據的內生結構使得同組數據有最大的共通之處。K-均值,層次聚類是最常用的演算法。
K-均值
K-均值是著名的聚類演算法。K-均值演算法儲存了定義相應簇的k個中心點。如果某一個點離某個中心點最近,那麼就被分到那一簇中去。演算法在當前數據集各簇分布來選擇新的簇中心和根據簇中心重新分配數據點之間交替迭代。
K-均值演算法圖示-叉表示簇中心,點表示數據點。(a)原始數據集;(b)隨機初始簇中心;(c-f)K-均值演算法兩次迭代的演示。每次迭代中,每個訓練點被歸為離對應簇中心最近的簇中,之後簇中心被更新為該簇所有點的均值。
模式識別演算法(分類)
先進駕駛輔助系統(ADAS)中感測器獲得的圖片由各種環境數據所組成。為了確定圖像中物體的類別,需要通過去除無關數據點進行圖像濾波。在分類物體之前,數據集中模式的識別是至關重要的一步。這類演算法被定義為數據降維演算法。數據降維演算法通常可以用於減少數據集中物體的邊和多段折線(擬合線段),以及圓弧 。到一個角之前,線段按邊來排列,一個新的線段在這之後開始。圓弧按線段序列排列,類似一條弧。圖像的特徵(圓弧和線段)以許多方式組合在一起,並被加以利用決定了一個物體。
伴隨主成分分析和方向梯度直方圖,支持向量機是ADAS中最常運用的識別演算法。K近鄰和貝葉斯決策規則也會被使用到。
支持向量機(SVM)
支持向量機是基於定義決策邊界的超平面概念。超平面劃分了數據集中不同類別的數據點。下圖是一個例子。其中,一類物體被標記為綠色,另一類為紅。一條邊界區分了紅色和綠色的物體。任一個落入左邊的物體將會被標記為紅色,右邊的則是綠色。
回歸演算法
這類演算法可應用於預測。回歸分析會尋求兩個或更多變數之間的關聯,收集並結合不同尺度間變數影響。這個過程通常由以下三種度量驅動:
回歸線的形狀
相關變數的種類
無關變數的數量
相機和雷達圖像在ADAS系統中驅動和定位方面扮演著重要的角色。無論何種演算法,面對的最大挑戰都是開發一個可實現基於圖像選擇特徵和預測的模型。
回歸演算法利用環境的可重複性,創建出可描述圖像中物體位置和物體關聯的統計模型。再通過圖像採樣,可實現快速在線檢測和離線學習;這些也可以被擴展到不需要大量人力建模的情形中。作為一個在線階段的輸出,演算法給出一個物體的位置和一個物體出現的置信水平。
回歸演算法也可被用於短期預測,長期學習。決策樹回歸,神經網路回歸,貝葉斯回歸等回歸演算法則可被用於自動駕駛汽車中。
神經網路回歸
神經網路被用於回歸,分類和無監督學習中。它將未標記的數據分組,監督學習之後分類數據,預測連續的數據值。神經網路最後一層通常使用邏輯回歸將連續的數據值轉變為0或1的變數。
上圖中,『x』 是輸入,上一層傳來的特徵。許多x會被傳入到最後一個隱層的節點上,並且每一個x會乘上對應的權值w。加上一個常數項後,這些乘積的和會進入一個激活函數。激活函數之一是ReLU(線性整流函數),由於不會像Sigmoid激活函數那樣在前幾層神經網路使得梯度飽和,而被廣泛使用。ReLU對每一個隱層節點提供了輸出激活函數,所有激活函數相加後進入輸出節點。這意味著,一個神經網路進行回歸時包含了單一輸出節點,該節點的值則是上一層的激活函數輸出值之和乘以1。結果是網路的估計。是所有輸入x映射到的相關變數。以這種方式使用神經網路,你可以獲得你試圖預測的從x(一些不相關的變數)到y(相關變數)的函數。
量化投資實戰課程——尖端量化精英薈萃寬潮六大實力巨匠傾力分享
丁鵬(中國量化投資學會理事長)
聶軍(凱思博香港總經理)
劉宏(好菜鳥投資董事長)
吳帆( AIMA中國區總經理)
張弘(深圳盈富總經理)
林健武(量化總監)
2017年8月18—8月20日 深圳
點擊展開全文
※機器學習產品寶典:這是谷歌內部總結的七大要點
※谷歌瞄準 AI 交互,開源兩大機器學習可視化數據工具
※「機器學習」未必就是「人工智慧」……
※機器學習簡史
※這是一節1000+人報名的機器學習課
TAG:機器學習 |
※自動駕駛汽車訓練演算法的挑戰
※自動駕駛技術中的機器學習演算法有哪些?
※MIT團隊研發演算法 自動駕駛汽車變道自如
※MIT新型動態演算法,讓自動駕駛汽車計算緩衝區以改變車道
※自動駕駛汽車硬體系統概述
※亞馬遜另類布局機器學習和自動駕駛:推出自動駕駛四輪賽車
※自動駕駛汽車的歷史
※優步停止研發自動駕駛卡車 集中打造自動駕駛汽車
※自動駕駛汽車的運動規劃技術綜述
※自動駕駛汽車概述
※自動駕駛汽車的功能
※MIT 展示新演算法,自動駕駛汽車學會更安全,更主動地變道
※自動駕駛汽車操作系統簡述
※自動駕駛汽車技術生態圈
※發展自動駕駛應是怎樣的技術路線
※一錘定音:自動駕駛汽車不能成為移動殺人機器
※汽車自動駕駛系統的硬體和軟體
※自動駕駛車需要怎樣的電子架構?
※傳賓士將在以色列測試自動駕駛電動轎車
※自動駕駛汽車技術讓未來汽車方向盤的命運難料