Nvidia發布GPU上的Kubernetes以加速深度學習負載
GPU在數據中心越來越受歡迎,它可以加速機器學習和深度學習等數據密集型工作負載。現在,全球最大的GPU製造商Nvidia將推出一個與Kubernetes集群配合使用的用例,以加速深度學習模型的訓練。
Nvidia本周二表示,將發布Kubernetes on Nvidia GPUs的候選版本,可供開發人員免費使用。該版本是針對那些在多雲GPU集群上訓練深度學習模型的企業。
Nvidia 是在Computer Vision and Pattern Recognition大會上宣布推出Kubernetes on Nvidia GPUs的,此外還推出了新版本的推理優化工具和運行時引擎TensorRT,以及名為DALI的GPU數據增強和圖像載入庫,旨在優化深度學習框架的數據管道。
Nvidia表示,推出Kubernetes on Nvidia GPUs背後的想法是為了讓軟體容器編排平台更加「GPU感知」。Kubernetes on Nvidia GPUs針對的是運行人工智慧應用的容器,將幫助開發人員更好地協調散步在多個雲主機的GPU集群。
Moor Insights&Strategy創始人兼首席分析師Patrick Moorhead表示:「這很重要,因為Kubernetes託管的應用現在可以利用GPU的性能了。這在虛擬機上將實現比以前更高的可擴展性。」
就在Nvidia這次發布的幾周之前,谷歌剛剛在其Kubernetes Engine平台上發布了一個測試版的GPU,旨在加速圖像處理和機器學習工作負載。谷歌當時表示,這個雲GPU可用於創建由Nvidia Tesla V100、P100和K80處理器驅動的Kubernetes節點池。
Nvidia的TensorRT推理加速器是針對推理模型的開發者。該工具集成了谷歌開源的TensorFlow機器學習框架,並增加了新的層和功能,以加強針對推薦系統、神經機器翻譯、圖像分類和語音識別等應用的推理。
至於DALI,這是一項為JPEG圖像編碼提供GPU加速庫的服務,旨在解決基於視覺的深度學習應用中的性能瓶頸,目的是為了幫助擴展圖像分類系統如PyTorch、TensorFlow和ResNet-50的訓練。AWS的P3 8-GPU實例以及Nvidia自己的DGX-1深度學習系統上都將提供DALI。
「深度學習研究人員需要他們的管道是便攜的,」Nvidia加速計算軟體和AI產品總監Kari Briski說。
TAG:至頂網 |