如何打造自動駕駛計算中樞?地平線車規級AI處理器背後的「秘密」
*地平線(上海)晶元研發總經理吳征
雷鋒網新智駕按:10 月 26 日至 27 日,2018 全球智能駕駛峰會在蘇州召開,本次峰會由蘇州市相城區人民政府主辦,蘇州高鐵新城管理委員會、雷鋒網新智駕和數域承辦,邀請到來自主機廠、科技公司、資本機構和產業研究機構等領域的多位專家,共同打造了一場智能汽車和自動駕駛領域的頂級峰會。
本次峰會上,地平線(上海)晶元研發總經理吳徵發表了題為《車規級AI處理器—打造自動駕駛計算中樞》的主題演講。吳征博士曾在三星半導體、矽瑪特、飛思卡爾和摩托羅拉等多家跨國公司擔任中國區高管職位。吳征博士從事晶元/半導體行業超過二十年,近期加入地平線,負責研發自動駕駛的AI車規級處理器。這也是吳征博士加入地平線以來的第一次公開演講。以下為吳征演講全文,雷鋒網(公眾號:雷鋒網)新智駕進行了不改變原意的編輯(略有刪減):
地平線是一家什麼樣的公司?
如今我們已進入一個大數據時代,無論是人們在淘寶、京東網上購物,或使用手機上網、拍照,或在市區里開車「一不小心」被拍......生活中無時無刻不在產生大量的數據。日積月累的數據量非常龐大,但多數情況下,眾多貌似是重複性的、無用的數據被擱置在旁,真正使用時又非常困難。
如何將大量的無用數據轉化成有用數據,挖掘其背後的價值?這是一個很大的挑戰。這涉及到如何有效地進行數據處理,本質上看,這是一大計算問題。
AI作為一種的關鍵技術,它基於大數據進行訓練和推理,可將無用數據進行「識別」, 把非結構化數據轉化成結構化數據,提取有用的信息。首先,我們來回顧一下近幾年AI計算晶元的發展:
英特爾的CPU傳統架構,在處理大量數據方面顯得效率不高,算力不足;
後來,英偉達的GPU被應用,其計算能力強,性能強大,但也有局限性,比如功耗高,成本貴;
最近幾年,FPGA盛行,其架構適合CNN計算,能耗比高,現場可編程適合各種場景,但對一般開發者來說,其開發較難;當大規模量產時,成本、功耗也比較高。
最近幾年,一些平台公司,例如Google,本質上是一家軟體互聯網公司,亦開始擁抱硬體,甚至進軍晶元。很重要的一點是,龐大的數據量需要有效處理。目前越來越多的公司開始考慮軟硬體融合,打造生態圈。
作為一家技術驅動型的公司,有著強大人工智慧演算法的地平線,自成立即定位於一家軟硬體結合的公司, 其核心是要打造自己的BPU (Brain Processing Unit)晶元,類似於 Google 的TPU。地平線瞄準的是嵌入式AI 晶元,應用在物聯網方面的終端產品,節點和控制設備, 專註於邊緣計算。這與研發伺服器,雲端AI晶元不同, 前者計算性能更強大,同時功耗和成本也是需要考慮的問題。
AI計算技術與應用場景高度相關。以人臉識別和自動駕駛環境識別為例,其訓練、推理及演算法不同。 在一定程度上可以理解為:場景決定演算法,演算法決定晶元。反之,晶元又要求有演算法,只有軟硬體接合,提供解決方案應用到場景才能最終解決問題,這是一個閉環系統。
2015年成立之初,地平線確定專攻AI嵌入式晶元,當年9月開始研發BPU;這期間地平線也在發力FPGA,同英特爾合作開發ADAS系統;去年6月,地平第一代AI晶元(BPU)流片,並在去年年底發布了第一代AI晶元「征程」和「旭日」。地平線BPU架構正在不斷完善,性能更強,於今年初發布基於BPU第二代架構的Matrix視覺感知方案,並在CES上進行公開實車Road Show。今年地平線兩款晶元已經開始量產。
今年底,地平線將完成新一輪融資,金額為5-10億美元,投資方包括一家和英特爾規模相當的晶元公司,以及一家知名汽車廠商。
以BPU為核心,地平線提供的是一整套軟硬體綜合解決方案,包括晶元,演算法,編譯器和運行時庫,以及訓練模擬的綜合平台。業務覆蓋三大領域:智能駕駛、智慧城市、智慧零售。
車規級AI處理器
算力是智能駕駛晶元的核心問題,地平線專註於視覺感知領域。
車規級AI處理器的研發目前面臨幾大挑戰:強大的計算能力,可靠性,功能安全,和質量管理與長周期的支持體系。
目前一輛汽車大多裝載多個攝像頭,每個攝像頭或720P,或1080P,每秒30幀。未來車身上會有越來越多的攝像頭,6個、8個甚至12個,逐漸升級的解析度,為自動駕駛帶來的是巨大的數據處理量。另外一方面,基於神經元網路的AI計算量也是巨大的。
就目前看來,面向L2、L3級自動駕駛處理器的算力要求達到數十個TOPS,L4到L5級將達到數百,甚至千TOPS級的要求。
不同於用在一般消費產品方面的晶元,用於汽車方面的半導體面臨的環境更嚴苛,對可靠性要求高。感知決策關係著汽車與人身安全,所以對功能安全要求更高。
一款晶元從晶元定義,設計,流片,測試和驗證,到獲得車規級認證需要花費很長的時間。另一方面,汽車晶元進入供應商或主機廠,從導入設計到設計採納,一輪輪測試與驗證,一款晶元與OEM磨合成功,並實現真正量產至少需要3-5年。這是一筆很大的投入。而且,汽車上的MCU、信息娛樂等晶元目前並沒有中國品牌的身影,可見應用到汽車方面的半導體晶元的門檻非常高。
應用於汽車方面的晶元或車規級晶元與消費級晶元不同,可從以下幾個維度進行對比:
溫度方面:消費級晶元使用溫度一般在0°—70°;工業級半導體使用溫度更寬一點;在汽車上,溫度需要低至-40°,高溫要到105度到125°;
從使用周期來看:消費型半導體為1—3年,而一輛汽車的壽命至少為10—15年;
從現場失效率來說,消費等級的是小於10%, 而汽車晶元的目標要求為零失效率。
值得一提的是,汽車半導體需要通過AEC-Q100認證。在質量認證方面,除零失效率,汽車半導體產商還需經過TS16949質量管理認證和10年以上的支撐體系。
另外,和安全相關的晶元應用到汽車上,需經過功能安全認證,來保證安全護航。這是值得重視的一點。
為什麼功能安全認證如此關鍵?
和手機相同,電子信息化比重越來越大的汽車可以看作為是一個複雜的嵌入系統,無法做到盡善盡美,失效是不可避免的,一般分為兩種情況:
系統失效,或因產品的系統規格不完善,或因硬體晶元設計或軟體開發中的「錯誤」;
隨機失效,這或是個永久性錯誤,例如汽車的老化效應造成電路某處連接出現問題,或者是瞬態錯誤,例如某一瞬間的電干擾。所以參局者需要遵從業界最好規範來減少這些系統失效的風險,實施安全機制來減少隨機失效的風險。
功能安全對應汽車方面即ISO26262標準。這是一整套流程,即從需求,開發,驗證到認證,從IP,EDA工具到晶元設計,從硬體到軟體,系統均有規範,形成一套完整的功能安全體系。面向量產的晶元需經過認證達到一定ASIL等級,例如和ABS,EPS相關的晶元必須達到ASIL-D等級。
接下來,再看面向自動駕駛的AI處理器如何滿足強大算力的需求。
傳統的馮諾依曼架構已無法滿足深度學習的計算要求,地平線自主創新的BPU,是一種多指令多數據MIMD架構,其能夠滿足數據流的計算要求,實現靈活的數據分發和計算的並發非同步處理,並對CNN計算中關鍵的乘加運算(MAC)單元達到很高的利用率,所以地平線BUP的每瓦TOPS性能相當突出。
地平線車規級AI處理器晶元的最新進程
地平線BPU於去年發布的第一代高斯架構,到目前的第二代基於伯努利架構,均採用新型稀疏二值化神經網路結構,可支持更多路視頻輸入,支持多感測器融合,目前主要集中在感知領域,後期將進行定位,建模,預測,路徑規划到最終決策。
地平線面向智能駕駛的BPU和Matrix視覺感知系統,已經向歐美汽車廠商交付。BPU 2.0可以實現多路攝像頭、多場景融合,能效更佳, 可在30W的功耗下實現基於像素級的圖像識別分割,可識別人、牌照、車型、交通紅綠燈、路標、障礙物等等。
地平線目前的第二代車規級AI晶元,已進入最後的開發階段。與第一代不同,前者從方框級的識別精確到像素級的語義識別。
總體來看,基於自動駕駛,地平線打造的是車規級AI處理器或SoC,提供相關的軟體演算法,核心編譯器、運行時庫,訓練,工具鏈一整套的平台和整體解決方案。
最後,以地平線量產的兩款晶元名字來結尾,用於智能IPC的旭日(Sunrise)和用於智能駕駛的征程(Journey)。在地平線看來,自動駕駛目前正在蓬勃發展階段,但未來的發展依舊面臨挑戰,無論是商業大規模落地還是技術實現方面。但這是一段美好的征程,我們將像AI的深度學習一樣,不斷的學習,不斷的進步,攀登一座又一座的高峰,最終達到幸福的彼岸。
※曠視科技聯合IDC發布AI+手機行業白皮書 人工智慧引領手機「視」界革命
※2018網易未來科技峰會召開 科技新浪潮改變商業
TAG:雷鋒網 |