當前位置:
首頁 > 最新 > 降低工智能在線服務成本50% 詳解阿里雲異構計算GPU實例GN5i

降低工智能在線服務成本50% 詳解阿里雲異構計算GPU實例GN5i

隨著深度學習對人工智慧的巨大推動,深度學習所構建的多層神經網路模型的參數空間已從百萬級上升到百億級,這對計算能力提出了新的挑戰。

9月12日,阿里雲正式推出了最新一代異構計算通用GPU實例GN5i規格族,面向深度學習的在線推理服務,可一鍵部署TensorFlow、Caffe等主流深度學習框架,提供智能調度、自動運維、實時擴容等服務,有效降低人工智慧在線服務成本50%以上。

據悉,GN5i採用了NVIDIA Pascal架構P4圖形處理器,提供最大11TFlops FP32單精度浮點計算能力和44Tops INT8整型計算能力,可在雲端按需構建敏捷彈性的深度學習平台,滿足人工智慧所需要的深度學習推理低延時、高性價比要求。

自建GPU物理伺服器經常會遇上擴容難、適配難的難題,GN5i規格族提供了靈活彈性的系列化配置,可以根據深度學習計算力的要求,按需選擇合適的規格,分鐘級即可完成實例的創建,並可根據運算力需求進行GPU實例的「Scale-out」水平擴容或「Scale-up」垂直變配。

深度學習的制勝法寶:吞吐量與延遲

機器學習是當前互聯網行業發展最快、最令人興奮的領域之一,而應用深度神經網路的深度學習則代表了機器學習中最前沿的部分。

深度學習的應用可以劃分為兩個階段:模型訓練學習和推理在線服務。

一個懵懂未知的學生到學校參加學習——可將其看作是深度神經網路經歷的「學習」階段,而把從學校學到的知識應用到日常解決問題中去,對問題的結論進行判別,我們可以將其看做深度神經網路的「推理」階段。

模型訓練學習和在線推理服務對計算力和規模有著不同的需求,訓練過程需要對數以億計的樣本進行反覆迭代處理,需要上百萬TFLOP(1TFLOP=1萬億次浮點運算)計算能力,而在線推理對計算的需求僅是訓練學習的十億分之一,但對延遲的要求更高,要在毫秒間做出反應。

模型訓練+在線服務:魚和熊掌皆可兼得

對於計算行業而言,性能大幅度進步依賴於從硬體層系統層到計算架構層的的全面升級優化,基於獨享型架構提供穩定GPU計算力和最高25G網路,阿里雲同時將底層網路虛擬化架構進行重構,全面升級到第二代Apsara vSwitch技術。

針對模型訓練學習,阿里雲在今年5月推出了高性能GPU實例GN5,單實例最多可提供8個英偉達P100 GPU、2萬多個並行處理核心,最高75TFLOPS FP32單精度浮點、150 TFLOPS FP16半精度浮點和38 TFLOPS FP64雙精度浮點運算能力,單實例性能比上一代拓展了5倍。

而本次發布的GN5i可以看做是對GN5的補充,針對在線推理服務做了大幅優化,輕鬆保障深度學習推理任務處理效率,大大降低了深度學習的成本,結合阿里雲提供的彈性、完整的生態,客戶可以用最低的使用成本、最大的彈性靈活度在雲端快速搭建完整的AI人工智慧服務。該產品支持包月、包年的預付費支付模式,同時也支持按小時付費的使用模型。

除了產品層面,阿里雲還提供了全方位的人工智慧產業服務,包括智能語音交互、圖像/視頻識別、交通預測、情感分析等技術服務,這些技術正通過阿里雲ET對外輸出。

過去一年,阿里雲推出ET城市大腦、ET工業大腦、ET醫療大腦等行業垂直的人工智慧系統,為工廠或者醫院創造更多利潤或者更高的診斷準確率。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 阿里雲 的精彩文章:

探索可編程硬體的新邊界 詳解阿里雲FPGA計算平台
今天來了一位新同事:量子科學家施堯耘加入阿里雲
阿里云:願用技術助力中小企業成長

TAG:阿里雲 |