當前位置:
首頁 > 最新 > 華為的麒麟NPU IP製造商寒武紀,生產出一個大AI晶元和PCIe卡

華為的麒麟NPU IP製造商寒武紀,生產出一個大AI晶元和PCIe卡

寒武紀科技公司與華為海思合作,為麒麟970智能手機晶元組提供AI IP,並為數據中心創建了自己的系列晶元。

麒麟970內部的IP被稱為Cambricon-1A,是該公司的第一個可授權IP。當時,查找寒武紀的信息非常困難:它的網站是一系列靜態圖像,中文嵌入圖像本身。有趣的是,我們的AI加速翻譯功能應用在華為Mate 10上來翻譯網站內容。快進12-18個月,寒武紀網站現在可以互動並提供即將推出的產品的相關信息,包括一些最近發布的信息。

大晶元:走向數據中心

基於台積電16FF,MLU-100是一款80W晶元,在1.0 GHz,或"標準"模式下,使用機器學習演算法中常用的8位整數度量,具有64 TFLOPS的傳統半精度或128 TOPS功能。寒武紀的首席執行官陳天石博士表示,他們的新晶元具有1.30 GHz的高性能模式,允許83.2 TFLOPS(16位浮點)或166.4 TOPS( 8位整數),但功耗上升到110W。 這在技術上降低了能源效率,但是允許使用更快的晶元。 所有這些數據都依賴於啟用稀疏數據模式。

該晶元背後的技術是寒武紀最新的MLUv01架構,該架構被理解為是用於麒麟晶元組的Cambricon-1A的一種變體,但規模更大更快。顯然,與移動IP相比,必須對數據和電源管理實施額外的優化。 寒武紀也有它的1H架構和最新公布的1M架構,但是沒有公開如何將數據傳遞到晶元。

WikiChip的David Schor(本文的主要來源)指出,如果提供給商業合作夥伴,這可能是NVIDIA的首次機器學習ASIC競賽。為此,寒武紀還在製造PCIe卡。

很明顯,NVIDIA在這方面擁有強大的用戶群和多代產品,以及利用其硬體優勢的軟體。 Cambricon沒有詳細說明他們計劃如何支持新晶元的SDK,但是它的網站上有一系列的SDK,支持TensorFlow,Caffe和MXNet。

進入數據中心:PCIe

在數據中心中即插即用的最佳方式是通過PCIe卡。 Cambricon的MLU100加速器卡就是這樣的:一個PCIe 3.0 x16實現256位16或32 GB DDR4-3200內存,這對於102.4 GB / s的帶寬是有好處的。要在NVIDIA上獲得大量內存,需要高端顯卡,但這些顯卡提供多倍的顯存帶寬。 MLU100卡上的存儲器也啟用了ECC。

迄今為止的報告稱,聯想將其卡作為ThinkSystem SR650雙Intel Xeon伺服器的附加產品; 每台機器最多兩個。 從聯想網站上看,它目前並不能使用。 鑒於華為在企業中的巨大影響力,我們很可能會看到這些系統中的晶元。

下一代:5TOPS/Watt

另外報道的是新的Cambricon-1M IP,儘管該公司沒有提供細節。 WikiChip公司表示,這款新IP主要針對7nm製造,所以當華為/海思開始發布7nm移動處理器,然後進入下一代面向伺服器的產品時,我們很可能會看到它。與ARM的IP所宣傳的3 TOPS /瓦特相比,這個IP的目標是達到5 TOPS /瓦特。 寒武紀今年晚些時候會有一個培訓和推理晶元計劃,並在2019年再次進行更新。

懂快閃記憶體,得未來

快閃記憶體技術革命,奠定未來10年存儲大勢

四年磨一劍,授之以漁,而不是授之以魚

一本銷量和好評快速增長的暢銷書

請長按下面指紋購買紙書

京東、淘寶、亞馬遜、Kindle也同時在售《深入淺出SSD》

快閃記憶體、AI、區塊鏈、物聯網

高端微信群介紹


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 ssdfans 的精彩文章:

蛋蛋讀UFS之六:UFS設備初始化和啟動

TAG:ssdfans |