當前位置:
首頁 > 最新 > 並行MAC/減少內存訪問,東芝發布第五代Visconti系列圖像識別SoC

並行MAC/減少內存訪問,東芝發布第五代Visconti系列圖像識別SoC

自動駕駛需要相當複雜的感測器組合,而這些感測器提供的數據量遠遠高於現有汽車搭載的感測器。

為了滿足對更強大的圖像處理的需求,東芝歐洲公司(TEE)宣布推出一種集成了深度學習加速器的圖像識別SoC。測試數據顯示,新款SoC與該公司現有產品相比,圖像識別速度提高了10倍,能效提高了4倍。

深度神經網路(Deep neural network, DNN)是一種以大腦神經網路為模型的演算法,與傳統的模式識別和機器學習相比,它能更準確地進行識別處理,並在自動駕駛技術研發領域被大量應用。

然而,傳統處理器基於DNN的圖像識別需要時間,因為它依賴於大量的multiply- aggregation (MAC)計算。使用傳統高速處理器的DNN也會消耗太多電能。

與L3級及以下自動輔助駕駛系統相比,L4/L5級自動駕駛汽車對計算能力的要求提高了100倍。這包括需要處理來自汽車周圍多個攝像頭、雷達和激光雷達感測器的輸入,解釋數據,並使用這些數據做出駕駛決策。

晶元製造商英偉達去年10月發布的一份有關自動駕駛車載計算能力的報告。該公司稱,一輛裝有10個高解析度攝像頭的汽車每秒產生20億像素的數據,每秒處理這些數據需要250萬億次操作。

三年前,東芝與日本汽車零部件供應商DENSO合作,共同開發上述深度神經網路技術。目前,東芝已經通過DNN加速器克服了這一問題,該加速器實現了硬體級的深度學習加速。

它有三個特點:

? 並行的MAC單元。DNN處理需要很多MAC計算。東芝的新設備有四個處理器,每個處理器有256個MAC單元。這提高了DNN的處理速度。

? 減少DRAM訪問。傳統的SoC沒有本地內存來保持DNN執行單元附近的時間數據,並且訪問本地內存會消耗大量的電能,載入權重數據(用於MAC計算)也會消耗電能。

在東芝的新產品中,SRAM是集成在DNN執行單元中,DNN處理分為子處理塊,將時間數據保存在SRAM中,減少了DRAM的訪問。

此外,東芝還為加速器增加了一個解壓裝置。通過解壓縮單元載入預先壓縮並存儲在DRAM中的權重數據,這減少了從DRAM載入權重數據所涉及的功耗。

? 減少SRAM訪問。傳統的深度學習需要在處理完DNN的每一層後訪問SRAM,這消耗了太多的能量。這款加速器在DNN執行單元中具有流水線的層結構,允許通過一個SRAM訪問執行一系列DNN計算。

新的SoC符合ISO26262汽車應用功能安全標準。東芝還表示,將繼續提高開發的SoC的功率效率和處理速度,並將於今年9月開始對下一代東芝圖像識別處理器Visconti5(DNN硬體IP與傳統圖像處理技術集成)進行樣品發貨。

對於低成本的自動駕駛方案來說,攝像頭和圖像識別的作用更為明顯。同時,在多感測器融合中,圖像識別也被視為主感測器的角色。

此前,東芝已經提供了TMPV75和TMPV76兩個系列的圖像識別處理器,它們集成了RISC架構的媒體處理引擎(MPEs),以提高圖像數據處理性能。該處理器能夠實時處理1到4個攝像頭的輸入圖像,並允許最多連接8個攝像頭。

ARM等其他晶元製造巨頭也都在推陳出新。去年9月,ARM推出了Cortex-A76AE (Automotive Enhanced),這是ARM專門為自動駕駛汽車設計的CPU架構。

ARM對A76平台進行了重新設計,增加了一種名為Split-Lock的功能,允許兩個CPU內核以鎖定步進(都執行相同的任務)或分割模式(執行不同的任務和應用程序)進行操作。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 高工智能汽車 的精彩文章:

賺錢是當務之急,多家Tier1重心轉向L2/L2+

TAG:高工智能汽車 |