當前位置:
首頁 > 知識 > 全球AI晶元榜單:華為第12 七家中國公司入圍Top24

全球AI晶元榜單:華為第12 七家中國公司入圍Top24

近日,市場研究公司Compass Intelligence發布了最新研究報告,在全球前15大AI晶元企業排名表中,前三名是英偉達(Nvidia)、英特爾(Intel)以及IBM,華為位列第12名,成為TOP15的中國「獨苗」。

據了解,在此次報告的AI晶元組索引中的 A列表包括提供AI晶元組的軟體和硬體組件的公司。

而AI晶元組產品包括中央處理器(CPU),圖形處理器(GPU),神經網路處理器(NNP),專用集成電路(ASIC),現場可編程門陣列(FPGA),精簡指令集計算機(RISC)處理器,加速器等等。一些晶元組針對邊緣處理或設備,一些針對雲計算中使用的伺服器,另一些針對機器視覺和自動車輛平台。其中一些產品是AI的計算框架,另一些則是AI培訓平台。

報告還提到,過去三年,在自己的研究和開發投入之外,還總共在人工智慧領域投入高達600億美元,我們看到,目前有超過1700家創業公司對AI晶元感興趣,當然,業界對於AI晶元的需求也在加大。

與此同時,在TOP15排名之外,Compass Intelligence還對多達100多家的晶元公司進行了評估,最終排名之中有24家公司入圍,它們包括英偉達、英特爾、IBM、谷歌、蘋果、AMD、ARM、高通、三星、恩智浦等等,值得注意的是,中國企業華為依然位列第12位,寒武紀和地平線分別為第22和24位。

在Top24的榜單排行中,共有七家中國公司入圍。

華為(海思)位列這份榜單的第12位;

聯發科(MediaTek)排名第14位;

Imagination排名第15位;

芯原(Verisilcon)排名第21位;

寒武紀(Cambricon)排名第23位;

地平線(Horizon)排名第24位;

華為的「造芯之路」

2004年10月華為創辦海思公司,它的前身是華為集成電路設計中心,這也正式拉開了華為的手機晶元研發之路。

2009年華為推出了第一款面向公開市場的K3處理器,定位跟展訊、聯發科一起競爭山寨市場,華為自己的手機沒有使用。因為K3產品不夠成熟以及不適的銷售策略,這款晶元並沒有成功。,這也是國內第一款智能手機處理器。

2012年華為海思推出K3V2處理器,這一次用在了自家手機中,而且是定位旗艦的Mate 1、P6等機型。2012年手機處理器已經開啟多核進程, K3V2成為了世界上第二顆四核處理器。

而後,麒麟910是海思的第一款SoC,如果說CPU是手機大腦,那SoC就是集成身體各種機能並給它們分配任務的系統,一個移動SoC除了CPU還包括基帶(Baseband)、圖形處理器(GPU)、數字信號處理器(DSP)、圖像信號處理器(ISP)等重要模塊。

從K3V2以來,部分華為手機特別是旗艦機一直使用自己的海思晶元,更重要的是,華為旗艦的綁定倒逼海思,必須迅速進步並且穩定供貨。

我們可以看到,2014年華為的研發投入比A股400家企業的總和還多。2017年華為研發費用高達897億人民幣,大大超過蘋果和高通。過去十年,華為投入的研發費用超過3940億元,居於世界科技公司前列。

這樣的成績也就不足為奇了。

經過十幾年的發展,2017年9月,華為在德國柏林國際電子消費品展覽會(IFA)上正式推出其最新 AI 晶元 「麒麟970」(Kirin 970)。麒麟970採用行業高標準的 TSMC 10nm 工藝,在指甲大小的晶元上,集成了55億個晶體管,功耗降低了20%,並實現了 1.2Gbps 峰值下載速率。麒麟 970集成 NPU 專用硬體處理單元(寒武紀IP),創新設計了 HiAI 移動計算架構,其 AI 性能密度大幅優於 CPU 和 GPU。相較於四個 Cortex-A73核心,處理相同 AI 任務,新的異構計算架構擁有約50倍能效和 25 倍性能優勢。

而且,華為第二代AI晶元海思麒麟 980也將在本季度正式量產,採用台積電 7nm 製程工藝。這款處理器將配置第二代 NPU,在前代的基礎上,支持更多的場景應用,NPU 的性能提升 2 倍以上。

中國「造芯運動」

5月3日,寒武紀在上海發布了新一代終端 IP 產品,採用7nm工藝的終端晶元Cambricon 1M、首款雲端智能晶元MLU100以及搭載了MLU100的雲端智能處理計算卡。

第三代機器學習終端處理器1M其性能比此前發布的寒武紀1A高10倍。配置方面,寒武紀1M使用台積電7nm工藝生產,其8位運算效能比達5 Tops/watt(每瓦 5萬億次運算)。寒武紀提供了2Tops、4Tops、8Tops三種尺寸的處理器內核,以滿足不同場景下不同量級智能處理的需求。

而MLU100採用寒武紀最新的MLUv01架構和台積電16nm工藝,可工作在平衡模式(主頻 1Ghz)和高性能模式(主頻1.3GHz)兩種不同模式下,等效理論峰值速度則分別可以達到128萬億次定點運算和166.4萬億次定點運算,而其功耗為80w和110w。

寒武紀介紹,MLU100雲端晶元同樣具備高通用性,可支持各類深度學習和常用機器學習演算法,他們還提出「端雲協作」的理念,也就是說,MLU100雲端晶元可以和寒武紀1A/1H/1M系列終端處理器進行適配,協同完成複雜的智能處理任務。

而在此前,阿里巴巴、地平線、雲知聲、Rokid等中國高科技公司都宣布加入「造芯運動」,就阿里巴巴而言,他們正研發神經網路晶元Ali-NPU,這款晶元性能將是目前市面上主流 CPU、GPU 架構 AI 晶元的 10 倍,而製造成本和功耗僅為一半,性價比超過 40 倍,一天之後,阿里巴巴再度宣布全資收購中天微,而後者是中國大陸唯一的自主嵌入式?CPU IP Core 公司。

早在去年年底,地平線就發布嵌入式人工智慧晶元——面向智能駕駛的征程(Journey)1.0處理器和面向智能攝像頭的旭日(Sunrise)1.0處理器。余凱認為:「地平線看到的未來是人工智慧處理器,實際上也是我們國家的科技競爭實力的制高點,如果未來中國的人工智慧產業要騰飛,要起飛,必須具有航空發動機,這個航空發動機是什麼?它一定是人工智慧處理器」。

加入這場大戰的創業公司還有很多,雲知聲和Rokid都宣布了完成晶元研發的消息,雲知聲即將發布AI晶元,它是基於Unisound的AI指令集和DSP指令集,結合語音應用場景,以麥克風陣列信號處理、語音識別及語音合成為一體的全新的晶元架構。

據介紹,這款AI晶元通過運算單元之間的可編程互聯矩陣保證運算效率的同時,採用多級-多組-多埠的Memory架構保證片內數據帶寬的提升及降低晶元功耗。在架構靈活性方面,通過Scratch-Pad將主控CPU與AI加速器內部RAM相連,提供高效的CPU與AI加速器之間的數據通道,以便CPU對AI加速器運算結果進行二次處理。另外,連接各個運算單元的可編程互聯矩陣架構,提供了擴展運算指令的功能,從而進一步提升硬體架構的靈活性及可擴展性。晶元架構方面的其餘探索,包括多級多模式喚醒、從能量檢測到人類聲音檢測到喚醒詞檢測、針對語音設備及使用場景的定製化Power Domain等技術,將晶元功耗降至最低。(來自:網易智能 編輯:王超_NT4133)

- 加入人工智慧學院系統學習 -


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI講堂 的精彩文章:

想轉行做AI工程師的同學趕緊看!
清華&斯坦福提出深度梯度壓縮DGC,大幅降低分散式訓練網路帶寬需求

TAG:AI講堂 |