當前位置:
首頁 > 知識 > Kirin 970完爆A11,但華為手機的真正利器是HiAI移動計算平台

Kirin 970完爆A11,但華為手機的真正利器是HiAI移動計算平台

機器之心原創

作者:黃小天

9 月 2 日,德國柏林 IFA 2017 電子展上,華為消費者業務 CEO 余承東推出全球第一款手機端 AI 晶元麒麟 970(Kirin 970),以芯、端、雲協同發展戰略積極部署移動端 AI 生態,在演講中,描繪了一幅浩瀚未知而又令人芯馳神往的未來圖景。

25 日,華為在北京召開媒體溝通會,華為 Fellow 艾偉對 Kirin 970 作了進一步的深度解讀;十年來,從 K3V1 到 Kirin 970,華為晶元一路走來,堅守 SoC 策略,持續集成,異構創新;堅持用戶體驗優先,奮力實現從智能到智慧的轉變。下文是機器之心對 Kirin 970 媒體溝通會的報道,希望讀者對這顆「中國芯」有更多了解。

Mobile AI

如果說移動端 AI 革命已經興起,那麼華為 Kirin 970 無疑是打響了第一槍。華為把 Kirin 970 比做智能手機的「新大腦」,它是實現最終智能體驗「Mobile AI=On-Device AI+Cloud-AI」的關鍵;有了 Kirin 970,華為的芯、端、雲戰略才能免於空談,並為後來的移動端 AI 生態布局打下堅實基礎,形成商業閉環。

Kirin 970 CPU 採用 big.LITTLE 架構,內置 4 個用於處理重負載任務的 Cortex A73 核心,4 個 Cortex A53 核心,GPU 則為全新一代具有 12 個核心的 Mali-G72 MP12,所有參數都達到了旗艦產品級別;採用台積電(TSMC)10nm 製程工藝,晶體管總數達 55 億;支持全球最高的通信規格 LTE Cat.18/Cat.13,實現了業界最高的 1.2Gbps 峰值下載速率;同時升級了自行研製的 ISP,並且在前一代雙攝 ISP 的基礎上進行了全面升級,其針對特定場景進行了性能和效果優化,可幫助使用者拍出更自然、更美的照片。在硬體參數的升級之外,Kirin 970 最引人關注的新特性就是全新設計的 HiAI 移動計算平台了。

訓練與推斷

想像一下,如果 AI 是《瘋狂動物城》里的樹懶「閃電」,這個世界會怎麼樣?答案是 AI 將銷聲匿跡。自 1956 年 AI 誕生以來,三起兩落也罷,百家爭鳴也罷,人類始終最希望的是 AI 能夠快速地「學以所用」:不僅要快速地學習知識(訓練),還能快速地應用知識(推斷),讓知識在瞬間爆發出來,這樣 AI 才能為人所用。所以,對知識的及時處理是 Mobile AI 應用的關鍵。

這意味著 Kirin 970 作為手機端 AI 晶元要在知識處理,即推斷上猛抓,且做足功夫,因為全球人工智慧的基本趨勢是企業級市場依然是一門「雲生意」,毫無變革念頭;消費級市場則正在從雲端下沉到終端,華為以及蘋果、三星等搶佔的正是這塊高地。令人欣慰的是 Kirin 970 在 Mobile AI 方面確實是先聲奪人、先人一步。

那麼,華為如何提供一套兼顧完備性、個性化和隱私保護的知識模型方案呢?

在日常生活中,人類需要個體智慧和集體智慧相互協同產生更巨大的力量;而未來的智慧終端想要不斷地發展,相應的 AI 體系除了要充分發揮終端自身的能力和價值,也要結合大數據和雲技術帶來的海量信息、服務和超強計算力,如此才能整合通用知識模型與個人知識模型,激發出移動端 AI 在訓練與推斷方面的雙料潛力。所以不會存在純粹終端的 On-Device AI,否則知識模型的完備性將會喪失。

全球化時代背景下,個性化顯得越發珍貴;在手機中,個性化更是提升用戶體驗的重頭戲。一般來講,雲端多以訓練為主,終端多以 Inference 推斷為主,華為的當前這代 NPU 作為一款 AI 加速器則側重加速端側推斷能力。接下來後面如果 NPU 或者 GPU 可以通過個人數據自我訓練,那麼手機就具備了學習能力,它吸取的個人數據越多就越智能,越個性化,越懂我。並真正做到學以所用,而最重要的是這一切發生在本地終端,省去了隱私泄漏的擔憂。

性能與功耗

今年 5 月份谷歌推出 TPU 2.0。TPU 是谷歌研發的一款深度學習加速 ASIC 晶元,第一代 TPU 僅支持推斷(即不可用於訓練模型),並在 AlphaGo 人機大戰中提供了致勝的算力支撐。目前 TPU 2.0 除推斷以外,還能高效支持訓練環節的深度學習加速。據谷歌披露,32 塊 GPU 並行訓練一整天而完成的深度學習翻譯模型訓練任務,只需在 TPU2.0 上通過 1/8 TPU Pod(TPU 集群,每 64 個 TPU 組成一個 Pod)就能在 6 小時內完成。

同樣在今年 5 月,英偉達在 2017 GPU 技術大會(GTC 2017)上正式發布新一代處理器架構 Volta V100,「Volta 並不是 Pascal 的升級,而是一個全新的架構!」英偉達應用深度學習研究副總裁 Bryan Catanzaro 如是說。英偉達通過該架構耗資 30 億美元打造了一款深度學習加速器 Tesla V100,其採用台積電(TSMC)12nm FFN 專屬工藝,包含 211 億個晶體管,速度超越 100TFlops,英偉達號稱這是全球最先進的數據中心 GPU,主打企業級超大規模深度神經網路加速。

以上是 2017 年業界對 AI 處理性能探索的兩個典型代表,Tesla V100 與 TPU2 作為伺服器端的 AI 晶元性能無可挑剔,但前提是它們沒有尺寸的考慮和功耗方面的明顯限制,可以一直插著電,並配有先進的降溫系統,這些要求手機端的 AI 晶元顯然無法滿足。大家知道 Kirin 970 含有 55 億個晶體管,那麼它們是如何封裝進指甲那麼小的空間呢?並且需要同時保證性能與能耗甚至還有所提升,這一切不能超出手機電池的承受範圍,其難度可想而知。除此之外,Kirin 970(CPU、GPU、NPU、ISP、DSP)還需要考慮實際 APP 的各種需求,難度就更大了。

面對這一問題,華為如何實現從伺服器端到手機端的跨越呢?答案是華為在傳統解決方案 SoC 的深厚積澱之上,創造性地提出了「HiAI 異構架構」,非常好地異構融合了 CPU、GPU、NPU、ISP 與 DSP,在處理同樣 AI 應用任務時,擁有大約 25 倍性能和 50 倍能效優勢,使 Kirin 970 成為了名副其實的全球首款手機端 AI 晶元和 AI 計算平台。

挑戰

Kirin 970 之後,蘋果隨後也推出了手機端 AI 晶元 A11,以及搭載該晶元的 iPhone X、iPhone 8、iPhone 8 Plus,後來居上。華為與蘋果在移動端 AI 方面搶佔了其他手機廠商如三星、小米的先機,那麼兩家之間孰優孰劣呢?蘋果無疑是 Kirin 970 目前面臨的最大挑戰。

安卓與 iOS

安卓與 iOS 之間的拉鋸戰迎來了新的範式轉換——手機端 AI 晶元。這一次的變革天然有利於蘋果 iOS。一個完整的手機生態需要算力+開發+硬體,三者缺一不可。蘋果軟硬體高度一體化的封閉生態很適合把 A11 晶元的強大算力順利導給開發者,而開發者藉助強大算力把想法通過硬體實現出來,從而形成一個良性循環、上下游多贏的局面,最終帶來收穫口碑的不二王道——絕佳的用戶體驗。

而安卓系統的開放性所帶來的天然缺陷恰恰是無法把 AI 晶元的強大算力從底層順利導向開發和硬體,從而使得算力打折扣。慶幸的是採用安卓系統的華為手機(以及其他國內手機如小米)通過去 GMS 在相當程度上克服了安卓系統的缺陷,這樣華為在手機系統上並未失利,蘋果華為幾乎在同一起跑線上,兩家真正的共同挑戰在於應用場景與共同體驗。從過往的手機體驗以及 iPhone X、iPhone 8、iPhone 8 Plus 的最新表現來看,華為 Mate 10 似乎承受著不小的壓力。

這次的溝通會上,華為給出了一個不正常的對標。通過多張拍照效果對比,華為證明 Kirin 970 在拍照上完爆 iPhone 8 Plus。注意,華為給出的對標是自家的晶元與別家的手機,這顯然不對。其實華為真正想說的是 Kirin 970 要比蘋果 A11 牛,不僅是在拍照效果上,在相同網路模型下每分鐘識別的圖像數量上也是如此(Kirin 970 為 2005 張,iPhone 8 Plus 為 889 張)。Kirin 970 的 AI 性能優於 A11 是可信的,但這並不意味著華為 Mate 10 的最終性能和用戶體驗同樣優於 iPhone 8 Plus,這才是問題的關鍵。

HiAI 移動計算平台

華為 Mate 10 未出,目前一切皆是「雲測評」。或許只有等到 Mate 10 出來,答案才能揭曉。但這顯然不是手機端 AI 的最後答卷,兩家都有著先發紅利,把握先機、吸引開發者打造爆款應用才是當務之急。Kirin 970 完爆 A11,固然不錯,但 HiAI 移動計算平台才是當下華為手機的真正利器。

HiAI 移動計算平台推出的最終目的在於把 Kirin 970 的 AI Computing 的能力開放出來,期望更多的 AI 合作夥伴與開發者探索更好的應用。可以說這是大勢所趨,華為別無二擇。Kirin 970 的推出使得華為在移動端 AI 晶元上先發制人,堪稱驚艷,但後續的應用場景同樣關鍵,華為如何做到繼續領先呢?唯有走場景生態的路子,迅速培育出利用 NPU 計算力的殺手級應用,形成商業閉環。HiAI 移動計算平台可謂這次 Kirin 970 溝通會的唯一重頭戲。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

黃仁勛全面解讀英偉達發展戰略:打造面向未來的AI技術平台
從剪枝法到低秩分解,手機端語言模型的神經網路壓縮
這台對世界好奇的機器,竟然還玩起了超級馬里奧?
如何解讀決策樹和隨機森林的內部工作機制?
這支8000人的AI軍團,可能就是微軟的未來

TAG:機器之心 |