華為的麒麟NPU IP製造商寒武紀，生產出一個大AI晶元和PCIe卡

最新 07-03

寒武紀科技公司與華為海思合作，為麒麟970智能手機晶元組提供AI IP，並為數據中心創建了自己的系列晶元。

麒麟970內部的IP被稱為Cambricon-1A，是該公司的第一個可授權IP。當時，查找寒武紀的信息非常困難：它的網站是一系列靜態圖像，中文嵌入圖像本身。有趣的是，我們的AI加速翻譯功能應用在華為Mate 10上來翻譯網站內容。快進12-18個月，寒武紀網站現在可以互動並提供即將推出的產品的相關信息，包括一些最近發布的信息。

大晶元：走向數據中心

基於台積電16FF，MLU-100是一款80W晶元，在1.0 GHz，或"標準"模式下，使用機器學習演算法中常用的8位整數度量，具有64 TFLOPS的傳統半精度或128 TOPS功能。寒武紀的首席執行官陳天石博士表示，他們的新晶元具有1.30 GHz的高性能模式，允許83.2 TFLOPS（16位浮點）或166.4 TOPS（ 8位整數），但功耗上升到110W。這在技術上降低了能源效率，但是允許使用更快的晶元。所有這些數據都依賴於啟用稀疏數據模式。

該晶元背後的技術是寒武紀最新的MLUv01架構，該架構被理解為是用於麒麟晶元組的Cambricon-1A的一種變體，但規模更大更快。顯然，與移動IP相比，必須對數據和電源管理實施額外的優化。寒武紀也有它的1H架構和最新公布的1M架構，但是沒有公開如何將數據傳遞到晶元。

WikiChip的David Schor（本文的主要來源）指出，如果提供給商業合作夥伴，這可能是NVIDIA的首次機器學習ASIC競賽。為此，寒武紀還在製造PCIe卡。

很明顯，NVIDIA在這方面擁有強大的用戶群和多代產品，以及利用其硬體優勢的軟體。 Cambricon沒有詳細說明他們計劃如何支持新晶元的SDK，但是它的網站上有一系列的SDK，支持TensorFlow，Caffe和MXNet。

進入數據中心：PCIe

在數據中心中即插即用的最佳方式是通過PCIe卡。 Cambricon的MLU100加速器卡就是這樣的：一個PCIe 3.0 x16實現256位16或32 GB DDR4-3200內存，這對於102.4 GB / s的帶寬是有好處的。要在NVIDIA上獲得大量內存，需要高端顯卡，但這些顯卡提供多倍的顯存帶寬。 MLU100卡上的存儲器也啟用了ECC。

迄今為止的報告稱，聯想將其卡作為ThinkSystem SR650雙Intel Xeon伺服器的附加產品; 每台機器最多兩個。從聯想網站上看，它目前並不能使用。鑒於華為在企業中的巨大影響力，我們很可能會看到這些系統中的晶元。

下一代：5TOPS/Watt

另外報道的是新的Cambricon-1M IP，儘管該公司沒有提供細節。 WikiChip公司表示，這款新IP主要針對7nm製造，所以當華為/海思開始發布7nm移動處理器，然後進入下一代面向伺服器的產品時，我們很可能會看到它。與ARM的IP所宣傳的3 TOPS /瓦特相比，這個IP的目標是達到5 TOPS /瓦特。寒武紀今年晚些時候會有一個培訓和推理晶元計劃，並在2019年再次進行更新。

懂快閃記憶體，得未來

快閃記憶體技術革命，奠定未來10年存儲大勢

四年磨一劍，授之以漁，而不是授之以魚

一本銷量和好評快速增長的暢銷書

請長按下面指紋購買紙書

京東、淘寶、亞馬遜、Kindle也同時在售《深入淺出SSD》

快閃記憶體、AI、區塊鏈、物聯網

高端微信群介紹

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 ssdfans 的精彩文章:

※蛋蛋讀UFS之六：UFS設備初始化和啟動

TAG:ssdfans |