自動駕駛數據流如洪水般襲來:「數據公司」英特爾如何發力?
雷鋒網按:如今,各家汽車廠商和科技公司都拼盡全力追逐自動駕駛技術,很少有人會提起幕後的開發工作。不過,晶元巨頭英特爾是個特例,自稱是「數據公司」的它們將自動駕駛領域遭遇的挑戰看成是數據流的問題。
在開發自動駕駛汽車的過程中,英特爾主要將精力集中在監督和分析數據是如何採集、分類、學習和模擬的。英特爾希望這些點滴的知識能幫它找到處理車輛所獲數據的最佳方式。
最近,英特爾開始意識到自動駕駛汽車會帶來數據洪流。據估算,一輛自動駕駛汽車每 1.5 個小時就能產生 4TB 的數據。
那麼,2021 年前後上路的自動駕駛汽車都會搜集、存儲並上傳如此多的數據嗎?
「不完全是。」英特爾自動駕駛解決方案首席架構師 Jack Weast 答道。「要解決這個問題,我們首先要了解自動駕駛汽車的數據處理,而開發階段的數據處理與部署階段大不相同。」
英特爾強調,所謂的 1.5 小時產生 4TB 數據只是估算,而且這是開發階段的事情。
假設一輛測試車每天要在路上跑 4 到 5 小時,那麼一天工作下來它將採集「接近 20TB 的數據,而這些數據將存儲在測試車裡的硬碟上。」Weast 說。
在這種狀態下,數據只是存儲在硬碟中,車輛不會對其進行實時處理。
*1.5 小時 4TB 數據量,英特爾能吞的下嗎?
對無線傳輸來說,以 TB 計的數據傳起來可不容易。因此,Weast 更偏向於直接取下硬碟送到數據中心。
數據中心的架構很重要數據進入數據中心後,下一步就變得至關重要,數據中心的架構在這裡將派上大用場。Weast 表示,數據中心共有 5 個不同的處理階段。
據雷鋒網了解,數據處理的 5 個階段:
第一個階段為基本的攝取。存儲在硬碟中的數據需要歸檔至數據中心。
第二階段為數據分析。工作人員會對歸檔的數據進行分類,以便數據科學家和應用開發者從中搜尋特殊的信息。
「舉例來說,數據科學家可能想要看某個特殊情境下的詳細數據:無人車開到一個四向停車區(需要停車查看,確認沒有車輛和行人即可自行通過),當時天上飄著雨且有不少行人出現在街角。」Weast 說道。「這些數據必須經過細緻的整理來方便人們搜索。」
第三階段是用數據訓練人工智慧和機器學習。這一步最關鍵的就是「如何縮短訓練時間。」
第四階段是對應用開發者開放數據,他們可以為自動駕駛汽車開發泊車應用,而只有獲得相關的數據集(包括車輛的延遲和反應時間),這些應用才能有更棒的體驗。
最後一個階段是模擬。這段時間裡,數據將成為演算法精進的最好幫手,而這些演算法最終將被整合進自動駕駛汽車。
*數據處理的 5 個階段
不過要想在這五個階段都做到完美,Weast 稱「你需要能與五個階段的數據處理任務完美結合的不同硬體。」這也意味著:至少神經網路訓練所需要的硬體肯定與其他階段不同。
Weast 指出,過去一招鮮吃遍天的時代已經過去,數據中心的架構必須進行調整,一切的設計都必須符合性能要求。
在這方面,英特爾可有值得吹噓的資本,它旗下的 Xeon,Xeon E5,FPGAs 和定製化的加速器與內存都是市場上的佼佼者。當然,英特爾還得找出到底哪款產品更能提升數據中心的性能。
不過別高興的太早,因為 Weast 指出以上這些任務只是自動駕駛汽車開發階段必須完成的,而要想讓車輛自行處理數據,還需要滿足其他要求。
自動駕駛汽車部署階段的數據處理在車輛的部署階段,通常用到的演算法更重注捕捉異常情況,Weast 解釋。
舉例來說,自動駕駛汽車在路上可能會遇到一個從未見過的物體。那物體雖然看起來像人類,但卻有大幅超越人類的移動速度,這樣自動駕駛汽車就會陷入迷茫,這是不是一個踩著懸浮板飛奔的人呢?為了解答這一謎題,無人車首先會給雲端發送一個文本描述,隨後再上傳一段視頻。
這樣一來,數據中心就不用接受 1.5 小時 4TB 數據的折磨了,其運行可以輕快很多。
在不久的將來,5G 技術將成為 V2V 通訊的主幹技術,藉助超高的傳輸速度,後面跟隨的車輛就能看到車隊前方車輛傳來的實時畫面,Weast 說。
除此之外,汽車製造商還希望能實時採集車輛健康狀況的數據。同時,高清地圖公司則需要路上行駛的車輛上傳道路信息。
Weast 認為,眼下 HERE 地圖已經可以使用 Mobileye 的 Roadbook(路書)功能,借眾包數據繪製高清地圖。與 HERE 原有的 HD Live Map 結合使用,能獲得更好的實時道路信息。
除了以上這些要上傳至雲端或其他車輛的數據,自動駕駛汽車能應付得了車上感測器搜集的大量數據流嗎?
Weast 指出,在 Level 2 級別,每輛車只搭載 1-2 個感測器,感測器模組自己就能完成數據的處理了。不過隨著感測器數量的增加,「我們就需要引入高性能計算集群。」
集中融合原始數據不但能讓數據處理更高效,還成了一種必要的方式,Weast 補充道。舉例來說,一輛自動駕駛汽車的中央融合單元必須能將攝像頭、激光雷達和雷達收集來的數據相結合,刨除數據中的空白和重疊,最終生成 360 的車輛視角。
英特爾打造的定製版 SoC 還遠嗎?
眼下,英特爾暫時還沒公布自家的自動駕駛汽車定製版 SoC,不過業內人士猜想這款產品會與英偉達的 Xavier 類似。
Xavier 是集成在英偉達全新 GPU 架構 Volta 中的 SoC,它擁有特別定製的 8 核 CPU 架構,同時也是全新的計算視覺加速器。同樣,英特爾的解決方案中恐怕也會加入 CPU、FPGA 和加速器等計算元件。
*自動駕駛汽車的「大腦」需要配備多種處理器
此前,英特爾自動駕駛解決方案部門副主席兼主管 Kathy Winter 在接受採訪時表示,為了迎接全自動駕駛車輛的到來,英特爾正在開發全新的定製版 SoC,它將融合多個 Xeon 核心並集成硬體加速單元。「新的 SoC 將在性能和功耗上取得完美平衡,同時安全也是這款 SoC 設計時的重要考量。」Winter 說。
去年,英特爾也表示,關於該 SoC 的具體細節將在 2017 年研發接近完成時正式公布。
「我們的目標是提供高效的計算能力,在高性能和低功耗間找到平衡。」Weast 表示。「同時,英特爾的平台還將擁有超強的可擴展性。」
雷鋒網推薦閱讀:
自動駕駛戰爭新轉折點:英偉達、豐田聯姻令英特爾如芒在背
※AI界的邁克爾·喬丹來中國簽約了,要出任螞蟻金服的技術顧問
※微信朋友圈遭封禁,只因網友好奇嘗試「程序漏洞」
※企業級SSD市場,英特爾霸榜首,三星僅第二
TAG:雷鋒網 |
※數據洞察:如何從數據當中挖掘騰飛「源動力」
※如何自動挖掘其中的數據呢?
※水數據寶貴如油:運用數據保護水資源
※數據驅動 英特爾「自能」新機遇
※數據中心該如何與自動駕駛汽車中的人工智慧系統聯繫起來
※如何讓醫療數據動起來、用起來?
※數據贏未來 英特爾用「自能」演進「智能」
※如何解讀動態血糖監測的數據?
※如何讓機器智能化,究竟是生物啟發還是數據驅動?
※麥肯錫:如何讓數據分析為你所用
※是不是自動駕駛惹禍 特斯拉用新辦法快追「黑匣子」數據
※《大數據》的書筆記:數據是什麼?數據從哪來?數據如何用?
※如何理解跨境數據流動的重要性
※無解!杜蘭特直言不知道如何防住自己!一數據追平詹姆斯笑傲聯盟!
※韋德曬出自己與詹姆斯對戰時各自場均數據
※怎麼除甲醛?數據說話:負離子發生器優於空氣凈化器
※車禍之後:特斯拉將定期發布自動駕駛安全性數據
※「脫水」數據更精彩:熱巴比楊冪還熱 鹿晗不如吳秀波
※抖音爆款流光數據線,動感流光,越充越快!
※大數據下如何運用先進智能語音輸入來創作自媒體,能成為未來的趨勢嗎?