英偉達推出最快的GPU產品Tesla T4,語言推理速度較上代快3.6倍
英偉達周四在日本 GTC 大會上推出了採用圖靈架構的新款 GPU Tesla T4。
目前,幾乎所有主流的雲計算服務提供商都能提供 P4 GPU 。而作為 P4 的升級版,此次推出的 Tesla T4 將用於數據中心內的機器學習和推理。( T代表圖靈構架,P 代表帕斯卡構架)
英偉達同時宣布,谷歌雲將成為首家提供 T4 GPU 的平台。
從參數上看,Tesla T4 晶元的表現明顯優於基於帕斯卡構架的 P4 晶元。T4 晶元擁有320個圖靈 Tensor 核心和2560個 CUDA 核心。它的4位整數運算( INT4 )峰值性能可達260萬億次運算/秒( TOPS ),浮點運算( FP16 )峰值性能可達65萬億次運算/秒。
同時,在速度大幅提升的情況下,功率僅停留在75瓦。對於語言推理應用來說,使用 T4 晶元比使用 CPU 快36倍,比使用 P4 快3.6倍。
圖 | 各應用表現對比(來源:英偉達)
圖 | 各應用表現對比(來源:英偉達)
最重要的是,英偉達 Tesla T4 晶元是專門為了人工智慧推理設計的。「 Tesla T4之所以能如此高效地進行推理任務,圖靈Tensor核心功不可沒,」英偉達 Tesla 數據中心業務副總裁兼總經理 Ian Buck 表示。
對於 Tensor 核心,英偉達 CEO 黃仁勛則表示它不僅可以進行遊戲、渲染和人工智慧任務,還可以進行計算機推理。
除了新晶元之外,英偉達還推出了用於優化深度學習模型的 TensorRT 軟體,包括 TensorRT 推理伺服器。TensorRT 是一個高度集成化的數據中心推理微服務,可以無縫插入現有的 Kubernetes 設施中。
※如果味覺也能被模擬,你還會吃鹽嗎?
※科幻一步步走近:從化學火箭到曲率引擎
TAG:DeepTech深科技 |