當前位置:
首頁 > 知識 > 華為最強自研 NPU 問世,麒麟 810 「拋棄」寒武紀

華為最強自研 NPU 問世,麒麟 810 「拋棄」寒武紀

整理 | 一一

責編 | 胡巍巍

「能效高、運算元多、精度高」,華為消費者業務手機產品線總裁何剛用一句話總結了自研達芬奇架構給最新麒麟810晶元帶來的變化。

6 月 21 日,在 HUAWEI Nova 5 系列新品發布會上,最大的亮點之一當屬華為發布的麒麟 810 全新人工智慧手機晶元,這是首款採用華為自研達芬奇架構的手機 AI 晶元。

去年 10 月,華為推出達芬奇架構的雲端 AI 晶元昇騰 Ascend 910 和昇騰 Ascend 310 後,首次將達芬奇架構落地至終端晶元的 NPU,同時這也意味著,他們在 NPU 中拋棄了寒武紀 IP。

最新的麒麟 810 了採用業界最先進的 7nm 工藝製程,相比 8nm 工藝,能效提升 20%,晶體管密度提升 50%,這讓它成為目前全球第三款採用該尖端工藝的手機 SoC 晶元,也是華為繼麒麟980 之後推出的第二款 7nm 手機 SoC 晶元。

近年來,隨著端側AI高速發展,手機廠商對晶元的適配性和靈活性提出更高要求,而華為對此的探索處於一路領跑狀態。

2017年,以麒麟 970 為代表的晶元首次採用獨立NPU神經網路處理單元,業內也開始探索端側人工智慧應用。2018 年,麒麟 980 採用雙核 NPU,進一步提升了端側 AI 算力,帶來 AI 人像留色、卡路里識別等豐富的 AI 應用。

此次,最新麒麟 810 再次領跑業界,首度採用華為自研達芬奇計算架構,再度提升端側 AI 的性能,並且首次將旗艦級的 AI 性能在中高端手機中落地。

達芬奇架構是華為在 2018 年推出的全新自研AI計算架構,針對 AI 計算特點進行設計。不同於以往的二維運算模式,達芬奇架構以高性能 3D Cube 計算引擎為基礎,針對矩陣運算進行加速,大幅提高單位面積下的AI算力,激發端側 AI 的運算潛能。另外,麒麟 810 晶元具有端側能效業界最優的 AI 運算單元。

根據 ETH Benchmark 測試,麒麟 810 NPU跑分 32280 分,遠超驍龍 710(6556 分)、驍龍730(13908 分)和驍龍 855(25428 分)。

對於麒麟 810 搭載華為自研的達芬奇架構,最直接的受害者是寒武紀,因為麒麟 970 第一代的 NPU 用的是寒武紀架構,但實際上,華為要在手機 AI 晶元搭載自研架構早在意料之中,只是很多人可能沒想到落地速度來得如此之快。正如徐直軍此前所說,「寒武紀的(IP)也很好,但是它無法支持我們的全場景,我們需要從雲、到端、到物聯網終端的人工智慧設備,因此我們要創造性地打造一款新的架構。而達芬奇架構能夠解決極致的功耗與極致的算力需求。」

按照這個勢頭,麒麟 810 應該只是開始,我們有理由相信,無論是 600 系列還是 900 系列,未來也會很快走向全定製化架構,華為移動計算生態將進一步擴大

以下從 CPU,GPU,拍照和通信方面的變化介紹麒麟 810 晶元:

CPU 方面,麒麟 810 採用全新系統級 AI 調頻調度技術,2 6 大小核架構,即搭載兩個基於Cortex-A76開發商用的大核,針對移動終端的使用場景進行深度優化,以及六個 Cortex-A55 小核實現能效升級。

據華為方面介紹,麒麟 810 全新 2 6 能效架構將提供更加精準的調度層次,讓 CPU在 遊戲、購物等重載場景,以及社交、瀏覽網頁等輕載場景下靈活適配,大大降低 CPU 在實際應用場景中的功耗,實現更持久的續航和更流暢的操作體驗。

GPU則升級到 Mali-G52 定製,支持 Kirin Gaming 技術,遊戲實力全面升級,通過系統級 AI 調頻調度技術、60fps 高性能及 HD 畫質和 GPU 負載優化全面升級遊戲體驗。

具體而言,AI 調頻調度技術能夠實時學習幀率、流暢度和觸屏輸入變化,預測手機任務負載,動態感知手機使用過程中存在的性能瓶頸,及時進行調頻調度,預測準確性比傳統預測方法提升 30% 以上;GPU 的系列優化技術,可減少重複指令及 GPU 過載,並加快 CPU、GPU 和內存之間的數據傳輸速度;HD 遊戲特效優化可以提升遊戲畫質、清晰度、明暗對比度等,帶給遊戲玩家更接近真實世界的遊戲體驗。

拍照方面,麒麟 810 集成細節增強(DE)模塊,支持最新一代自動白平衡演算法(AWB)和 AR特徵點雲計算加速,ISP 性能和演算法雙提升,這將解決夜景照片出現的噪點和過曝問題,提升畫面的細節處理能力和降噪效果。

通信方面,麒麟 810 延續旗艦晶元的通信能力,支持雙卡雙 VoLTE,讓手機的雙卡同時保持 4G 在線,將有效防禦偽基站的騷擾,有效降低手機信號回落至 2G 網路的風險。

此外,麒麟 810 推出自研中間運算元格式,運算元數量多達 240 ,支持Tensor, Vector, Scalar,更多運算元、開源框架的支持以及提供更加完備的工具鏈將助力開發者快速轉換集成基於不同AI框架開發出的模型,大幅增強華為 HiAI 的兼容性,易用性,以加速更多 AI 應用落地。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 程序員之家 的精彩文章:

「水氫車」真跑起來了!但現場出現尷尬一幕……又一個「水變油」騙局?
華為邀請google play開發者加入華為應用商店

TAG:程序員之家 |