終於官宣!寒武紀推出雲端AI晶元「思元270」,峰值性能提升4倍
【新智元導讀】寒武紀正式宣布推出雲端AI晶元中文品牌「思元」、第二代雲端AI晶元思元270(MLU270)及板卡產品。寒武紀官宣顯示,產品參數在低精度訓練領域實現重大突破,印證之前知乎網友的爆料。
前段時間,知乎突然出現了一個勁爆提問 「如何看待寒武紀新一代人工智慧晶元(疑似思元/MLU270)規格?」,提問者以匿名方式貼出了疑似寒武紀下一代雲端AI晶元MLU270的相關信息,包括晶元外觀以及某些具體參數,引發熱議,截止到現在已經被瀏覽了近5萬次。
知乎鏈接:
https://www.zhihu.com/question/322886889
知乎用戶曝光的寒武紀下一代雲端AI晶元——思元270(MLU270)
新智元也在第一時間對此新聞進行了報道——《知乎爆料!寒武紀新一代AI晶元「思元270」遭提前泄露》。
而就在昨天(6月20日),寒武紀正式宣布推出雲端AI晶元中文品牌「思元」、第二代雲端AI晶元思元270(MLU270)及板卡產品。從名稱到特徵,都印證之前知乎網友的爆料!
思元270晶元:速度更快、功耗更低、性價比更高
最新發布的思元270晶元集成了寒武紀在處理器架構領域的一系列創新性技術,在低精度訓練領域實現了重大突破,主要包含5大亮點:
- 採用TSMC 16nm工藝製造。
- 架構代號從上一代的MLUv01升級到了MLUv02,理論峰值性能提升4倍。
- 同時兼容INT4和INT16運算,理論峰值分別達到256TOPS和64TOPS。
- 支持視覺、語音、自然語言處理以及傳統機器學習等高度多樣化的AI應用。
- 提供速度更快、功耗更低、性價比更高的AI加速解決方案。
TSMC 16nm工藝:
思元270晶元採用TSMC 16nm工藝製造,其板卡產品可以通過PCIe介面快速部署在伺服器和工作站內。
作為面向人工智慧推斷任務的產品,思元270板卡在ResNet50上推理性能超過10000fps。MLU270-S4 型板卡(半高半長)面向數據中心部署,集成16GB DDR4 內存,支持ECC;MLU270-F4型板卡(全高全長)採用主動散熱設計,面向非數據中心部署場景,集成16GB DDR4 內存,支持ECC。據悉,面向人工智慧訓練任務的思元270訓練版板卡產品將於今年第四季度推出。
理論峰值性能提升4倍:
處理非稀疏深度學習模型的理論峰值性能提升至上一代MLU100的4倍,達到128TOPS(INT8)。
定點訓練領域取得關鍵性突破:
寒武紀在定點訓練領域已實現關鍵性突破,思元270訓練版板卡將可通過8位或16位定點運算提供卓越的人工智慧訓練性能,該技術有望成為AI晶元發展的重要里程碑。
兼容INT4和INT16、浮點運算和混合精度運算:
同時兼容INT4和INT16運算,理論峰值分別達到256TOPS和64TOPS;支持浮點運算和混合精度運算。
多樣化AI應用:
思元270採用寒武紀公司自主研發的MLUv02指令集,可支持視覺、語音、自然語言處理以及傳統機器學習等高度多樣化的人工智慧應用,更為視覺應用集成了充裕的視頻和圖像編解碼硬體單元。
便於開發:
在系統軟體和工具鏈方面,思元270繼續支持寒武紀Neuware軟體工具鏈,支持業內各主流編程框架。此外,為方便開發者更好地挖掘思元270超強的運算能力、開拓更多的應用領域,寒武紀將在近期向社區和開發者開放專用編程語言。
保持每年一代的產品迭代速度
據了解,寒武紀在過去三年一直保持每年一代的產品迭代速度。在終端領域:
- 2016年推出寒武紀1A處理器IP;
- 2017年推出雙核的寒武紀1H;
- 2018年推出寒武紀1M。
迄今已經服務於數千萬台終端設備。
MLU100到今年的MLU270性能對比
寒武紀CEO陳天石曾表示,寒武紀的雲端智能晶元產品,迭代速度會和終端產品一樣快。現實證明寒武紀做到了:從去年5月發布的第一代雲端AI晶元MLU100到今年的MLU270,寒武紀保持了一年一代的研發速度,還同時研發多款高複雜度的晶元,這證明寒武紀已經具備非常完備的晶元研發能力,在國內是數一數二的。
是的,從AI晶元初創企業邁向AI晶元新巨頭的道路上,寒武紀今年又前進了一步。
中文品牌「思元」同步推出
除了晶元和板卡產品外,寒武紀還正式宣布推出雲端AI晶元中文品牌「思元」。這回不僅有中文名思元270,還有專門的商標。
寒武紀曾於去年正式推出雲端AI晶元品牌「MLU」(Machine Learning Unit),此次推出中文品牌「思元」是對MLU品牌的補充,「思元」的含義是「思考的基本單元」。
據悉,思元商標的字體來自於中國元代書法家趙孟頫,他諸體兼擅,這與寒武紀追求人工智慧晶元的通用性不謀而合。今年初,寒武紀已經為旗下晶元註冊兩大中文商標名,分別是「思元」、「玄思」。
※機器人教父:自動駕駛30年內能上路,實現通用人工智慧還要300年
※GitHub趨勢榜第一:超級命令行工具Semantic,比較解析源代碼
TAG:新智元 |