自動駕駛如何到來?
這是一個很大的話題,自動駕駛是非常複雜的交叉學科,所涉及的每一領域都值得細細探討,本文淺嘗輒止,希望能給讀者一個大體的印象,並引發更多的思考。
以下為正文
自動駕駛的發展,是人工智慧在汽車和出行行業的投影,所以要回答這個問題,需要先清楚:什麼是人工智慧。
什麼是人工智慧
由於人工智慧(Artificial Intelligence)這個詞是舶來品,且最早的傳播者,被稱為人工智慧之父的約翰·麥卡錫(John McCarthy,提出者存疑)是美國人,所以我選擇去看英文的解釋:
牛津詞典的解釋如下:
能夠執行通常需要人類智能的任務的計算機理論和先進產品,如視覺,語音識別,決策和不同語言間的翻譯。
The theory and development of computer systems able to performtasks normally requiring human intelligence, such as visual perception, speechrecognition, decision-making, and translation between languages.
而韋氏詞典的解釋是:
一個在計算機上用來模擬智能行為的計算機科學分支
A branch of computer science dealing with the simulation ofintelligent behavior in computers.
所以你看,人工智慧首先是一門計算機科學;其次,它是用於模擬人類智能的。那麼問題來了,智能(intelligence)又是什麼呢?
還是牛津詞典:
獲取和使用知識和技能的能力
The ability to acquire and apply knowledge and skills.
韋氏詞典:
(1)學習,理解或處理新的或困難的處境,即理由,以及有技巧的使用理由。
the ability to learn or understand or to deal with new ortrying situations :reason;
also : the skilled use of reason
(2)應用知識來操縱某個環境的能力,或以客觀標準(如測試)評價的抽象思考。
the ability to apply knowledge to manipulate one"senvironment or to think abstractly as measured by objective criteria (such astests)
最後是新華字典:好了我什麼都沒查到……(強烈要求出在線版新華字典)
言歸正傳,很明顯智能的關鍵在於學習和應用,並且需要一定程度的抽象。那麼推而廣之,人工智慧就是具備學習,認知和應用能力的計算機。同樣自動駕駛汽車,也應當能夠學習,認知周圍的環境,並且能夠做出正確的應對。
美國交通部下屬的NHSTA(國家高速路安全管理局)和美國汽車工程學會SAE都對自動駕駛進行了分級,級到2級都是已經實現了量產的產品,統稱為「高級駕駛輔助系統」,即ADAS。網上資料很(如下圖),在此不再贅述。
無論哪一種分級方式,最終的目標都是一樣:實現任意路況下的完全自動駕駛。聽起來很容易理解,但這背後需要無比巨大的技術進步才可實現。
現在我們在哪兒呢?先看看級到2級自動駕駛汽車能做些什麼,如圖:
看上去還不錯嘛,而且2級自動駕駛汽車也確實可以在高速公路上讓駕駛員放開手腳了,但是,沒有對比就沒有傷害,如果是人類駕駛員,情況如何?
如果是一個人類駕駛員,他能做的事情則要多的多,他可以感知到周圍所有的移動和非移動障礙物,地面畫好的車道和導向箭頭,路邊的限速標識,前方的紅綠燈以及剩餘的通過時間,地上的石頭和塑料袋,後面車輛催促的喇叭聲以及旁邊超過的跑車引擎轟鳴,作為一個老司機,他還知道這條路上哪兒有坑,下個路口該往哪轉不堵車,然後在一瞬間規划出路徑,手腳並用讓車輛流暢行駛,還能一邊聽著音樂廣播一邊和副駕駛的女友吵架。更加神奇的是,他不僅僅「看」到了,還可以理解這些信息背後的含義,比如塑料袋是軟的可以不減速就碾過去,但石頭就不行。
而2級的自動駕駛汽車在此刻心中是崩潰的,它還是一個孩子,它不認識很多東西,也不理解這些東西有什麼含義,更沒有強壯的身體(執行機構)。
按照慣常的思維,我們會理所當然的認為孩子會長大,馬上將要實現的是3級自動駕駛,然而事情在此發生了變化,出現了一個詞,叫做「特定路況」,這是一個很模糊的描述,而且是工程師們自己畫出來的圈圈。有一個很強大的燈廠叫奧迪,他在高速公路上的某個擁堵路段畫了一個圈圈,然後把自家的孩子放在裡面,很開心的告訴所有人,我們家的娃三年級了(3級自動駕駛)!它的名字叫TJP(Traffic Jam Pilot)。
這個孩子比二年級的強很多,他可以「看到」更多的東西(識別更多的目標),也可以做出更靈活的動作(更強的執行機構),但它還是個熊孩子,還需要有老師在旁邊盯著,這個老師的名字叫駕駛員,一旦孩子開始調皮,老師就要去糾正它的行為,但熊孩子終究是熊孩子,99%的時間它可能都很乖,但是1%的時候它突然就不乖了,哪個老師會時時刻刻盯著學生,特別是一個成績還不錯的?就是班主任也做不到,所以這就很危險。海的那邊有家姓特斯拉的,家裡的孩子已經鬧出幾次人命了,就是因為家長心急,明明只有二年級的小身板,偏要送到三年級,還告訴老師們不用管……
扯遠了。最讓人不能接受的是,這個熊孩子總是屢教不改,只要是犯過的錯誤,它會永遠的犯下去,無論老師們糾正多少次。為什麼呢?因為自動駕駛汽車沒有學習能力,無論是學習認識新的物體,新的規則,還是新的應對策略,而人是會學習並吸取教訓的。唯一能解決這個問題的方法,是不斷的更新軟體,由工程師爸爸們去總結,然後把新的知識教給它,這種解決方法有個名字,叫「專家系統」。
即使是3級自動駕駛,依然是一個孩子,讓孩子上高速公路上去玩,是不是有點嚇人?而且誰也不知道孩子什麼時候會長大成4級自動駕駛,這要看專家系統強大到什麼程度,作為一個工程師我實在沒有信心拍胸脯保證這一點,也許一夜長大,也許一夜腐朽,嗯……畫風錯了。
另外,專家系統自身並不具備成長性,它本質上依然是人類知識的歸納總結,即使是4級自動駕駛,在目前的規劃中,我們也沒有看到「學習能力」的規劃和應用,所以,如果真的這樣繼續發展,它和現在的自動駕駛並沒有本質上的區別,至少,從人工智慧的角度來看是這樣。
那麼,還有什麼辦法呢?別忘了畫圈圈的是工程師,雖然我沒有能力改變整個世界,但是我可以把圈圈畫小一點啊。所有當過爸媽的人都知道,孩子還小的時候,家裡的危險品一定要收起來,然後才可以放心讓它自己玩。
所以另一個解決方案,就是嚴格劃分「特定路況」,這個特定路況可以是公共道路,也可以是非公共道路,還可以是某個非露天的場景。說起來雖然簡單,但其實並不容易,車主有自己的需求,如果限定的場景過小,或者過於罕見,即使可以實現,對車主來說也毫無價值。
讓我們再溫習一下人工智慧的解釋:
能夠執行通常需要人類智能的任務的計算機理論和先進產品,如視覺,語音識別,決策和不同語言間的翻譯。
視覺,這是一個非常重要的,也許是最重要的感知手段,所獲取的信息量巨大,是其他手段無法比肩的。自動駕駛汽車之所以如此受到關注,其引爆點正是圖像識別技術的大發展。基於深度學習的圖像識別技術,為自動駕駛提供了強大的感知能力,目標識別能力如果和目標屬性結合起來,將會為決策提供更多的有效信息。視覺感知技術的發展,對自動駕駛乃至人工智慧的進步,起到決定性的作用。
決策,取決於場景閱讀的能力,這是最複雜和難以攻克的部分,即使對於人類來說,理解能力也是最重要的能力之一,如何通過圖像去搭建場景,並用計算機可以理解的方式傳遞這些信息,是一個非常有意思的課題,以後會單獨討論這個問題。
學習能力,現在的計算機都還不具備,機器學習也僅僅是「用數據或以往的經驗,以此優化計算機程序的性能標準。」並不具備聯想能力,一旦這個課題被攻克,那專家系統就將正式壽終正寢,成為資料庫的一部分。
P.S:看到這兒,是不是明白了為什麼所有的互聯網巨頭都那麼瘋狂的收集數據?你踩過的坑,總有一天會變成別人家孩子的養分。
當然現在的自動駕駛專家系統還遠遠沒有達到它的極限,其所需要的感測器和執行器成本也沒有降低到大規模應用的水平,隨著應用的推廣,高級駕駛輔助功能,將是大多數人很快就能看到並享受到的便利。
至於執行機構,現在並沒有什麼技術上不可攻破的理論難點,更多是現有架構的約束,以及成本的限制。想像一下諾基亞吧,再好的軟體,也不可能在諾基亞上得到很好的體驗,推倒重來是一個辦法,汽車行業的壁壘更高,推起來更難,但是別忘了,只需要一家蘋果,一個喬布斯,所有的傳統手機廠家就基本上都死了,現在大家都在爭著做汽車行業的蘋果,所以李書福說有危機感,那是一點都不假。
最後用一張圖來總結髮展路徑。
隨著技術的進步,更多的應用場景會像汽水中的氣泡一樣不斷的冒出來,但彼此之間可能會不那麼連貫。機器自學習出現後,通用型的平台將很快實現所有場景,如果說之前都是量變,那麼這就是質變。
歡迎參與討論和指正。
TAG:果殼機動 |