當前位置:
首頁 > 新聞 > 專訪AutoX肖健雄:攝像頭和激光雷達並用,三款無人車落地LBS

專訪AutoX肖健雄:攝像頭和激光雷達並用,三款無人車落地LBS

專訪AutoX肖健雄:攝像頭和激光雷達並用,三款無人車落地LBS

有肖健雄的地方,就有關於攝像頭方案的討論。

在自動駕駛行業,肖健雄的名字幾乎已經與攝像頭方案綁在了一起。以往的報道中,我們看到最多的是這位 CV 界權威對攝像頭方案一貫的篤定和推崇,也因此,在激光雷達代表著「技術正確」的自動駕駛領域,人們對於從實驗室走出來的研究者究竟能不能順利完成商業化轉身,總是懷著一連串問號,雖然我們知道,這位被稱為 X 教授的學術大牛是三維點雲深度學習的開創者,是普林斯頓大學計算機視覺和機器人實驗室的創辦人,也是 ECCV 最佳學生論文獎和 Google Research Awards 得主。

前情鋪墊是,2016 年 6 月,從普林斯頓大學助理教授職位離開的肖健雄在矽谷創辦了自動駕駛公司 AutoX,團隊組建 6 個月後,就改造出了一輛自動駕駛原型車,公司發布的路測視頻中,開頭便是「USING ONLY CAMERAS」的醒目標識,這輛僅搭載 7 個攝像頭的林肯 MKZ 在 2017 年初完成了 AutoX 的自動駕駛首秀。

創業兩年後,這位在學生和同行口中獲得無數稱讚的 X 教授頻繁用「exciting」來形容眼下的狀態,「速度」「商業化」「大眾」「LBS 運力」是貫穿整個訪談的關鍵詞。你問「之前一直堅持攝像頭路線的 X 教授也使用激光雷達了,這是在妥協嗎」,他說:「沒有任何變化」;你問「商業化落地的哪個環節最重要」,他說「沒有一個環節不重要」;你問「又有哪個環節最困難」,他說「每一個環節都困難」......這不是面對媒體的太極打法,而是如他自己所說,從大學教授到創業公司 CEO,在發現問題、解決問題的日常進階中,他自己也在發生著變化。

自動駕駛的商業化起點:互聯網下半場的運力之爭

在肖健雄教授的闡述中,自動駕駛與互聯網的用場沒有本質分別,兩者都屬於基礎的生活設施建設,為各種日常應用賦能。互聯網只有應用領域之分,而不具指某家公司,自動駕駛也是一樣;互聯網有電商、外賣、打車、旅遊等垂直化應用,自動駕駛也會有園區車、掃地車、乘用車等不同落地方式。

「互聯網的競爭已經進入下半場,其中,LBS 是近幾年被革命化的新領域。LBS 的上半場是互聯網算力之爭,但效率已經提升到極限,下半場其實就是運力之爭,誰的運力強,誰就佔領市場。」

「運力的主要問題是"運力池"不足,限制了業務發展。現在的外賣或打車業務量其實可以進一步增長,只是沒有足夠多的人去送、去開車,導致價格太貴。如果"運力池"更大,整個服務會更好,大家的用量會更上一個台階。」這是肖健雄的基本判斷。

所以,今天我們所看到的出行和運輸瓶頸並非需求的飽和,而是運力的匱乏,並非平台的獨大,而是成本的可壓縮空間已接近極限。

「所謂自動駕駛其實不是來代替人類工作,而是讓這個"運力池"增大。」這是 AutoX 的商業主線,肖健雄將其闡釋為「平民化自動駕駛」,即讓自動駕駛連接城市衣食住行等日常需求。

三條落地路線

根據這些,AutoX 給出了基於三款無人駕駛車的 LBS 解決方案:同城低速物流配送車,同城全速物流配送車,和同城 L4 自動駕駛乘用車。

「我們想快速把 L4 落地。在這個過程中,如果做別的也可以,但中間停太多站反而會減慢速度。」肖健雄就此解釋了其對 L4 而非輔助駕駛或 L3 方案的青睞。

AutoX 的低速配送車類似之前京東、智行者推出的園區自動配送車大小,因為速度較低,體積較小,安全可控性也相對更強,全速配送車則更像一個移動的蜂巢快遞櫃。目前,AutoX 的低速送貨車隊已經在深圳某園區試運營,到今年年底,車隊規模將增加到上百台,而目前仍在內部測試的全速車(包括送貨車和送人車)到時也將上線試運營。

但今天的技術成熟度是否足以支撐城市道路上 L4 自動駕駛技術的落地,這款自動駕駛乘用車又如何進行商業化定義?

肖健雄表示,車輛會率先以固定路線巴士的形式出現,由此道路情況處於可控範圍內,車輛運行難度也會相對降低。「L4 的難點就是測試問題,如果搞成滴滴,確實很難,因為整個北京城,任意兩點之間的每條路得測試很多遍,這樣算起來,路的數目就很大。固定路徑的話,你一上來就 50 台車來測,測一年,我覺得已經測到比較有信心了,該見到的東西都基本見過了。」

專訪AutoX肖健雄:攝像頭和激光雷達並用,三款無人車落地LBS

*左為低速配送車,右為全速配送車

還是攝像頭為主

之前,肖健雄曾在多個場合強調攝像頭為主的感測器方案,這是基於其對技術快速落地的商業化考慮,「夠便宜,用戶才能接受」,也來自其對攝像頭功能演進的信心——演算法的優化可幫助彌補攝像頭的現有缺陷。

但這次 AutoX 給出的技術方案不僅使用了攝像頭,也出現了激光雷達:在低速車型上,車輛兩邊各放一個廣角攝像頭,前後各放兩個攝像頭,並配備一個速騰的 16 線激光雷達,包括車輛在內的整體成本在 1 萬美元左右(非量產);全速車型上,團隊則設計了一個由 8 個單目攝像頭組成的 360 環繞組合,並使用了一個 40 線激光雷達。

攝像頭組合的想法是初次在自動駕駛公司中實現,AutoX 團隊從幾百個攝像頭中選出了 8 個單目攝像頭,完成了整體設計,成本在 300 美元左右(非量產),內部的攝像頭分布,日後也可根據適配車型進行調試。

關於激光雷達的作用,目前有兩種主要論點,一種認為其是車輛感知的必要配置;一種則認為激光雷達僅僅是作為冗餘存在,自動駕駛車輛運行的主要工作依然要靠攝像頭來完成,如 Mobileye CEO Amnon Shashua 就曾在多個場合闡述這種主張,顯然,肖健雄也是後種論斷的支持者,所以也堅持不會在現有基礎上使用更多激光雷達。

「加入激光雷達首先是為了必要的冗餘,但大家的意識也被谷歌訓練了,覺得頭上有個頂很重要,要是沒有,人家反而覺得不好,就算藏在車身里,他也不敢坐。」一直強調「要榨乾攝像頭性能」的 X 教授並沒有放棄自己的「初心」,這次訪談中,他也展示了團隊在強化演算法的基礎上完成的攝像頭測試,包括雨天、黑夜、太陽直射等多種情境下的優秀感知效果,與普通的激光雷達相比,其對遠距離物體的探測也表現出了明顯優勢。

「其實現在攝像頭技術是非常成熟的,而且非常廉價,比方說它的動態範圍可以很高,有的甚至超過人眼。當然肯定不能亂選,要選對的。我們團隊有很多視覺領域的專家,有多年的行業經驗,會選擇最高性能的攝像頭。我覺得未來的前景肯定是攝像頭越來越強。」

當然,對攝像頭的執著仍是源於成本優化的考慮,肖健雄也表示,攝像頭與激光雷達並非對立面,只是各家的演算法有差。

在 AutoX 的自動駕駛車輛上,還設置了一個 LED 顯示屏來告知車輛狀態,與外部車輛、行人交互。而這類交互設計也已經被越來越多的公司接受和使用,最近宣布即將落地自動駕駛打車服務的 Drive.ai 也使用了類似的外部設計。

正確決定

與從事學術研究的漫長生涯相比,肖健雄創業僅僅只有兩年時間,但在他口中不時發出的卻是「創業走了很長路」的感慨,讓他振奮的是團隊「效率越來越高,打法越來越清晰」,而如何更快完成產品化落地,讓用戶接受這項新技術也是他每天需要重複思考的第一命題。

快速落地,快速進入實際場景應用,快速獲取大量數據,確保公司和技術都「不是活在真空里」,他用這幾個「快速」追趕行業,也催促自己,卻很少顯出疲態。

「我很興奮,我特別看好這個,我覺得選中創業是很正確的決定。」

以下為雷鋒網與肖健雄教授的部分採訪實錄,雷鋒網做了不改變原意的編輯:

雷鋒網:現在 AutoX 把重心放在了 L4,但之前您對 L4、L5 的預期好像還是比較保守的。

肖健雄:現在也還是比較保守的,很多人說到 2020 年就有大規模的自動駕駛車了,我覺得很難達到,固定路徑落地會更快,但城市的任意兩點,2020 年是達不到的,我現在還是處於保守的那一幫。

雷鋒網:到底是先做 L3 還是 L4,如何看待這兩者的爭議?

肖健雄:L3 其實基本上就是 L4,做 L3 的基本上要做到 L4 水平,然後把它倒退回來,用在 L3 上。很多業界的人覺得 L2、L3 跟 L4 是不可融合的,我覺得是可以的,而且是必須的。我覺得 L3 只是面向 L4 的一個中間步驟,關鍵是用不用這個中間步驟,這就要看和具體商業合作夥伴的碰撞。我們不是說完全不做 L3,我們現階段重點是在做 L4,但這個技術上我們覺得是通用的。

好的 L3 一定能基本上達到 L4,因為 L3 就是我們說的,可能有 10 秒鐘 hand over,這個要求太高了,你要是開在美國道路上,大概 120 公里每小時,10 秒鐘都可以跑 300 多米,這個基本上就是 L4,L4 大家一般也就最多看 200 米。除非把 L4 用在 L3 上,要不然 L3 就是個偽命題。甚至做的好的 L2,比方通用的 Super Cruise,也已經用了一些 L4 的技術了。

雷鋒網:自動駕駛從技術成熟,到大範圍落地,這之間的商業化鴻溝是什麼?

肖健雄:我覺得更多是產品化的問題,不是說自動駕駛做好了,當天就產品化了,有很多問題需要解決。比方說,我剛剛說了好多硬體設計,硬體要夠可靠,相機抖動範圍有嚴格要求,而且 Durability 要很久,所以有大量產品化的問題。

第二就是 AI 產品化應用問題。比如說現在自動駕駛車停在那裡,等用戶來拿包裹,這時候發現擋住別人的路了,後面有人倒車倒不了,怎麼辦?以前人家肯定會喊一句,別擋我,我要走了,那你就開走了。現在車裡沒人,你怎麼喊它,喊它也沒用。所以這其實有個產品化的過程,需要考慮的實際應用問題大大超過了自動駕駛技術本身。

雷鋒網:之前您一直堅持攝像頭方案,現在加上激光雷達更多是為了說服合作方嗎?

肖健雄:主要還是為了安全冗餘,但我覺得也要說服合作方、說服普通老百姓,讓大家去接受這個新事物。我們做了很多前融合和後融合演算法,也把激光雷達用在了定位上。

雷鋒網:這算是一個妥協嗎?

肖健雄:其實我們一直說的都是 Camera First,我覺得現在沒有任何變化,我們是強調攝像頭的潛力有多大,能力有多強,比如那些說激光雷達好的自動駕駛公司,也不止是用激光雷達,也用了攝像頭,所以我們是說 Camera First,不是 Camera Only。

大家可能覺得 Oamera Only 更好說,我們其實向來都是 Camera First,我們不排斥其它感測器,以攝像頭為主,其它感測器為輔,要不然我們就得裝很多激光雷達,現在我們用一個就夠了,不用很多很多個,也不用很高解析度的。

所以這也是我們的一個考慮,我們就以攝像頭為主,這個肯定是沒有變,因為只有成本夠低,才有商業價值,太貴了就沒辦法落地。

雷鋒網:40 線的激光雷達,加上這樣一個攝像頭組合,您對它的安全性有足夠信心嗎?

肖健雄:這個是絕對有足夠信心的,我覺得已經夠了,這已經很貴了。

雷鋒網:我們是自己做的高精地圖,為什麼沒有找專門的圖商來做?

肖健雄:首先,我們這個要求蠻高的,很多圖商其實並沒有做自動駕駛全套系統,他其實並不知道自動駕駛的需求是什麼,做出的地圖也不一定是最優的。

還有,比如有的採集車用了很多感測器,那跟我們的感測器不一樣,采了也沒什麼用。因為不同感測器,大家可能還有一點不一樣,你的相機跟我的相機不大一樣,你的激光雷達跟我的激光雷達又不大一樣,裝的位置又不大一樣.......這裡面有大量技術難點。我們的好處就是一模一樣的車去采,一模一樣的車來開,能達到定位性能最優。

第二,我們公司的一個特色,就是效率特別高,有什麼需求馬上調,馬上改,調起來性能達到最優。我回到那一點,自動駕駛安全要求非常高,就意味著什麼環節都不能掉鏈子,什麼環節都得緊密配合,有些東西可做可不做,我們都不做,像晶元已經很成熟了,自己發明晶元也沒有什麼提高,但是像地圖這種,其實還不是很成熟,我們自己做的好處是能確保它的性能非常好。

第三,還有成本問題,很多圖商的製圖成本大大超過了我們的成本,我們設計了非常廉價的製圖方式。

雷鋒網:我們未來的商業模式是如何設定的?

肖健雄:收費模式我們有兩種,一種是長租,一種是短租。

短租現在很流行,像滴滴這種,Driving As Service,主要是賣服務,主要是小 B 和 C 端用,但是對大 B 來說,他們可能有更高要求,可能想徹底佔有這個車,這個更像長租,我們也需要提供一些服務,例如地圖、維修等。

雷鋒網:我們的合作夥伴會是哪些?誰來運營車輛?

肖健雄:我們跟快遞、物流、超市、飯店和一切需要運力的公司合作,我們其實就是給這些公司提供里程服務的運力公司。以前是有人駕駛,有兩種運營模式:物流公司運營,或者第三方車隊運營。分界點就是開車的人到底是物流公司的員工還是第三方公司的員工,一旦無人駕駛以後,其實這個界限就非常模糊了,不好說到底誰運營,這個其實不好界定。

有一種合作方式,就是車廠給我們提供車,我們裝上我們的東西,再拿去運營,我們是車廠的客戶。

所以,這是一種可能反過來的合作模式,不是說我們把東西賣給車廠,再賣給消費者。

雷鋒網:現在看起來,我們跟 Tier 1 的接觸反而會比較少一些。

肖健雄:主要是速度問題。我們要走傳統車廠那條路,落地速度比較慢,我們想今年運營幾百台,等不了,這樣速度太慢了。一旦技術成熟,馬上要商業化,我們現在已經到達那個點了,已經很成熟了,所以需要商業化,等不急了。

雷鋒網:與做學術相比,創業讓你興奮的點主要是什麼?

肖健雄:我覺得是團隊變化,這也是我們為什麼想創業的原因。實際上很多東西變化非常快,幾個月後你回頭一想,好像好幾年前的感覺。而且團隊效率也很高,大家很有鬥志,現在是一個比較大的團隊一起作戰,不是單打獨鬥,學術還是主要靠單打獨鬥。

公司發展越來越快,效率越來越高,打法越來越清晰,團隊磨合的速度也很快,很快就進入下一個級別。當然能力的提升是非常強的,這點也是創業最重要的一點,就是快速學習能力,在這個過程中可以學到很多。一定要親身體驗一遍,才能學到這麼多,很多東西很難靠看書看出來。

雷鋒網註:6 項會員專享特權,全年 100 期精華內容,帶你深入淺出看懂自動駕駛。如果想加入雷鋒網「新智駕會員計劃」,歡迎點擊鏈接 :https://www.leiphone.com/aidrive/vip 或掃描海報下方二維碼了解詳情。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

智能體的白日夢,谷歌大腦又出來PR文了?
技術詳解以太坊二層擴容解決方案:實現鏈下交互擴展公有鏈可用性

TAG:雷鋒網 |