助力AI:博雲容器雲平台BeyondContainer支持GPU
2018年3月,NVIDIA宣布支持Kubernetes容器的GPU加速,NVIDIA向 Kubernetes 開源社區貢獻了自家的GPU增強技術。機器學習的工作量往往很大,無論是所需的算力、還是驅動它的數據,而Kubernetes 可幫助編排這些工作負載。
黃仁勛稱:「現在我們已經有了所有這些加速框架和代碼,然後該如何將它們部署到數據中心的世界中呢?比如 Kubernetes!它將為我們帶來相當多的歡樂。」他還提到,「另外在本次更新中,協調器已經獲得了 GPU 感知能力,Docker 容器現已獲得 GPU 加速能力,我講到的所有這些框架、推理的工作負載、所有雲,都可以 GPU 加速。」
GPU晶元算力的提升和加速技術的發布將不斷推動市場的發展,當下AI市場發展的如火如荼,商湯、依圖、全志等公司提供的AI晶元也都採用了GPU架構為智能雲端提供算力。隨著Docker和Kubernetes等容器技術的不斷發展和完善,利用容器技術全面支持GPU和CPU異構集群算力資源的分配、管理和調度的能力也將成為必然的趨勢。
BoCloud博雲容器雲產品BeyondContainer最新發布的1.7.1版,已經實現了支持GPU主機管理,以及應用發布、灰度發布、應用複製、擴容縮容等(應用部署相關功能)支持基於GPU資源配置和調度。
支持異構集群,單一集群即支持CPU又支持GPU
支持單一集群多種GPU共存,將不同應用運行在適合的GPU上
多租戶共享,支持多種應用框架,靈活擴展計算能力,快速滿足業務需求
基礎設施可視化,監控資源使用情況,有效減少GPU碎片化
鏡像可移植,避免因主機GPU驅動更新而導致所有鏡像更新
支持nvidia-docker,nvidia-smi等GPU原生操作
GPU in Kubernetes,在 Kubernetes 裡面我們做了GPU discovery.(kubelet),GPU assignment/release.(kubelet),Kube-apiserver/Kube-scheduler
方便快捷的初始化GPU運行時環境
GPU隔離,避免將同一顆GPU分配給不同容器
BeyondContainer的 GPU容器支撐架構:
BeyondContainer的 GPU容器支撐架構
當前基於GPU的應用程序,正在迅速成為標準工作流程的一部分,特別是在視頻編解碼、自然語言處理、深度學習、圖像識別等領域,這些應用程序在容器化平台中的部署、測試已經迅速成為公認的慣例。
在過去的幾年裡,GPU的計算性能突飛猛進。現代GPU不再只是強有力的圖形引擎,更是通用的可編程並行多處理器。一個GPU擁有數百個並行處理核,可以同時執行數萬甚至數十萬個線程。GPU的這種高度並行化結構,賦予它快速處理大規模問題的能力,NVIDIA於2007年發布了CUDA統一計算架構,隨後開發者開發了一系列的使用GPU計算的應用,包括排序、搜索、生命科學計算、天氣預報等。
現代GPU的算力比同時代CPU的計算能力勝出幾個數量級,同時由於虛擬化技術的風靡一時,業界紛紛致力於GPU虛擬化技術的開發。Docker容器的發布給虛擬化技術帶來了一場全新的變革,基於GPU的應用程序在Docker上實現容器化部署和隔離加速。
產品功能
BeyondContainer是BoCloud博雲容器雲產品,產品基於微服務思想和DevOps理念,利用Docker基礎平台、DevOps組件、微服務PaaS中間件等功能模塊提供對應用的構建、測試、部署、更新、運維管理的應用全生命周期管理功能。實現基於容器的應用持續集成和快速部署、秒級彈性伸縮、業務可用性保障等關鍵特性,以幫助企業應對互聯網時代業務快速發展的需要。
BeyondContainer 1.7.1版技術底層基於OpenShift3.6版本,同時兼容支持Kubernetes 1.8及以上版本、Docker 17之後更新的社區版。新版本在用戶管理方面提供了更友好的操作界面,提供多OpenShift集群管理能力,使用戶能夠基於一個統一管理界面對多集群進行管理,簡化平台日常運維工作,實現容器平台的統一管理。在應用生命周期管理方面,基於openshift的templates模板能力實現了複雜多模塊的應用的可視化編排部署,實現了系統級(而非容器級)的應用管理能力。
作為企業級的容器雲平台,BeyondContainer通過產品業務價值,幫助企業提升其核心業務的商業效率。BeyondContainer具備平台運維、平台運營、應用運維三大方面的能力,可滿足企業應用運維、持續集成、微服務開發運維等多種應用場景需求。產品主要功能包括:
支持區域->租戶->項目->應用的層級管理
基於角色的儀錶盤
基於Jenkins的CI/CD的流水線
資源管理及對存儲、集群、主機、倉庫的全方位可視化管理
集群,主機,容器,應用,審計,操作級日誌
集群,主機,組件,容器監控告警
基於租戶,項目的配額和計量計費
全方位的鏡像,容器,應用管理
支持區塊鏈應用
支持GPU資源管理
博雲容器雲平台BeyondContainer已在金融、電力、能源等行業中落地,幫助企業大幅縮短應用迭代周期,實現應用全生命周期管理,提升資源利率,產品可靠性、穩定性、安全性久經考驗。博雲同時為企業客戶提供DevOps及微服務諮詢服務,從開發、測試、部署、運維,幫助企業實現DevOps開發運維一體化,響應企業客戶對業務需求和IT系統的快速升級的需求。
私有雲 | 混合雲 | 自動化運維
關於BoCloud博雲
BoCloud 博雲,雲計算開源軟體商業化服務商,為企業級客戶提供私有雲、混合雲、智能化運維繫統、大數據基礎設施的諮詢、建設、維護、升級服務,幫助企業在關鍵運營場景中實現數字化轉型,提升企業主業的生產率。
TAG:博雲 |