全球AI晶元榜單：華為第12 七家中國公司入圍Top24

知識 05-07

近日，市場研究公司Compass Intelligence發布了最新研究報告，在全球前15大AI晶元企業排名表中，前三名是英偉達(Nvidia)、英特爾(Intel)以及IBM，華為位列第12名，成為TOP15的中國「獨苗」。

據了解，在此次報告的AI晶元組索引中的 A列表包括提供AI晶元組的軟體和硬體組件的公司。

而AI晶元組產品包括中央處理器（CPU），圖形處理器（GPU），神經網路處理器（NNP），專用集成電路（ASIC），現場可編程門陣列（FPGA），精簡指令集計算機（RISC）處理器，加速器等等。一些晶元組針對邊緣處理或設備，一些針對雲計算中使用的伺服器，另一些針對機器視覺和自動車輛平台。其中一些產品是AI的計算框架，另一些則是AI培訓平台。

報告還提到，過去三年，在自己的研究和開發投入之外，還總共在人工智慧領域投入高達600億美元，我們看到，目前有超過1700家創業公司對AI晶元感興趣，當然，業界對於AI晶元的需求也在加大。

與此同時，在TOP15排名之外，Compass Intelligence還對多達100多家的晶元公司進行了評估，最終排名之中有24家公司入圍，它們包括英偉達、英特爾、IBM、谷歌、蘋果、AMD、ARM、高通、三星、恩智浦等等，值得注意的是，中國企業華為依然位列第12位，寒武紀和地平線分別為第22和24位。

在Top24的榜單排行中，共有七家中國公司入圍。

華為（海思）位列這份榜單的第12位；

聯發科（MediaTek）排名第14位；

Imagination排名第15位；

芯原（Verisilcon）排名第21位；

寒武紀（Cambricon）排名第23位；

地平線（Horizon）排名第24位；

華為的「造芯之路」

2004年10月華為創辦海思公司，它的前身是華為集成電路設計中心，這也正式拉開了華為的手機晶元研發之路。

2009年華為推出了第一款面向公開市場的K3處理器，定位跟展訊、聯發科一起競爭山寨市場，華為自己的手機沒有使用。因為K3產品不夠成熟以及不適的銷售策略，這款晶元並沒有成功。，這也是國內第一款智能手機處理器。

2012年華為海思推出K3V2處理器，這一次用在了自家手機中，而且是定位旗艦的Mate 1、P6等機型。2012年手機處理器已經開啟多核進程， K3V2成為了世界上第二顆四核處理器。

而後，麒麟910是海思的第一款SoC，如果說CPU是手機大腦，那SoC就是集成身體各種機能並給它們分配任務的系統，一個移動SoC除了CPU還包括基帶（Baseband）、圖形處理器（GPU）、數字信號處理器（DSP）、圖像信號處理器（ISP）等重要模塊。

從K3V2以來，部分華為手機特別是旗艦機一直使用自己的海思晶元，更重要的是，華為旗艦的綁定倒逼海思，必須迅速進步並且穩定供貨。

我們可以看到，2014年華為的研發投入比A股400家企業的總和還多。2017年華為研發費用高達897億人民幣，大大超過蘋果和高通。過去十年，華為投入的研發費用超過3940億元，居於世界科技公司前列。

這樣的成績也就不足為奇了。

經過十幾年的發展，2017年9月，華為在德國柏林國際電子消費品展覽會（IFA）上正式推出其最新 AI 晶元「麒麟970」（Kirin 970）。麒麟970採用行業高標準的 TSMC 10nm 工藝，在指甲大小的晶元上，集成了55億個晶體管，功耗降低了20%，並實現了 1.2Gbps 峰值下載速率。麒麟 970集成 NPU 專用硬體處理單元（寒武紀IP），創新設計了 HiAI 移動計算架構，其 AI 性能密度大幅優於 CPU 和 GPU。相較於四個 Cortex-A73核心，處理相同 AI 任務，新的異構計算架構擁有約50倍能效和 25 倍性能優勢。

而且，華為第二代AI晶元海思麒麟 980也將在本季度正式量產，採用台積電 7nm 製程工藝。這款處理器將配置第二代 NPU，在前代的基礎上，支持更多的場景應用，NPU 的性能提升 2 倍以上。

中國「造芯運動」

5月3日，寒武紀在上海發布了新一代終端 IP 產品，採用7nm工藝的終端晶元Cambricon 1M、首款雲端智能晶元MLU100以及搭載了MLU100的雲端智能處理計算卡。

第三代機器學習終端處理器1M其性能比此前發布的寒武紀1A高10倍。配置方面，寒武紀1M使用台積電7nm工藝生產，其8位運算效能比達5 Tops/watt（每瓦 5萬億次運算）。寒武紀提供了2Tops、4Tops、8Tops三種尺寸的處理器內核，以滿足不同場景下不同量級智能處理的需求。

而MLU100採用寒武紀最新的MLUv01架構和台積電16nm工藝，可工作在平衡模式（主頻 1Ghz）和高性能模式（主頻1.3GHz）兩種不同模式下，等效理論峰值速度則分別可以達到128萬億次定點運算和166.4萬億次定點運算，而其功耗為80w和110w。

寒武紀介紹，MLU100雲端晶元同樣具備高通用性，可支持各類深度學習和常用機器學習演算法，他們還提出「端雲協作」的理念，也就是說，MLU100雲端晶元可以和寒武紀1A/1H/1M系列終端處理器進行適配，協同完成複雜的智能處理任務。

而在此前，阿里巴巴、地平線、雲知聲、Rokid等中國高科技公司都宣布加入「造芯運動」，就阿里巴巴而言，他們正研發神經網路晶元Ali-NPU，這款晶元性能將是目前市面上主流 CPU、GPU 架構 AI 晶元的 10 倍，而製造成本和功耗僅為一半，性價比超過 40 倍，一天之後，阿里巴巴再度宣布全資收購中天微，而後者是中國大陸唯一的自主嵌入式?CPU IP Core 公司。

早在去年年底，地平線就發布嵌入式人工智慧晶元——面向智能駕駛的征程（Journey）1.0處理器和面向智能攝像頭的旭日（Sunrise）1.0處理器。余凱認為：「地平線看到的未來是人工智慧處理器，實際上也是我們國家的科技競爭實力的制高點，如果未來中國的人工智慧產業要騰飛，要起飛，必須具有航空發動機，這個航空發動機是什麼？它一定是人工智慧處理器」。

加入這場大戰的創業公司還有很多，雲知聲和Rokid都宣布了完成晶元研發的消息，雲知聲即將發布AI晶元，它是基於Unisound的AI指令集和DSP指令集，結合語音應用場景，以麥克風陣列信號處理、語音識別及語音合成為一體的全新的晶元架構。

據介紹，這款AI晶元通過運算單元之間的可編程互聯矩陣保證運算效率的同時，採用多級-多組-多埠的Memory架構保證片內數據帶寬的提升及降低晶元功耗。在架構靈活性方面，通過Scratch-Pad將主控CPU與AI加速器內部RAM相連，提供高效的CPU與AI加速器之間的數據通道，以便CPU對AI加速器運算結果進行二次處理。另外，連接各個運算單元的可編程互聯矩陣架構，提供了擴展運算指令的功能，從而進一步提升硬體架構的靈活性及可擴展性。晶元架構方面的其餘探索，包括多級多模式喚醒、從能量檢測到人類聲音檢測到喚醒詞檢測、針對語音設備及使用場景的定製化Power Domain等技術，將晶元功耗降至最低。(來自：網易智能編輯：王超_NT4133）

- 加入人工智慧學院系統學習 -

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI講堂 的精彩文章:

※想轉行做AI工程師的同學趕緊看！
※清華＆斯坦福提出深度梯度壓縮DGC，大幅降低分散式訓練網路帶寬需求

TAG:AI講堂 |