谷歌發布Cloud TPU Pod以實現按需的AI超級計算機
谷歌今天宣布對其雲平台進行擴展,發布了一個新的基礎設施選項Cloud TPU Pod,旨在滿足那些需要大量計算能力的大型人工智慧項目。
打開今日頭條,查看更多圖片Cloud TPU Pod本質上是一組運行在谷歌數據中心中的伺服器機架,每個機架都配備了谷歌的Tensor處理器單元(TPU)——完全為AI應用開發的定製晶元。谷歌已經在內部一系列服務中採用了這種晶元,包括谷歌的搜索引擎和谷歌翻譯等。
此前TPU在Google Cloud上僅供單獨租賃使用。與企業通常在AI項目中使用的GPU相比,TPU具有速度更快等諸多優勢。去年12月公布的一項基準測試結果顯示,在執行某些類型的任務時,TPU的性能比Nvidia同類硬體高出19%。
單個Cloud TPU Pod中包含256個或者1024個晶元,具體取決於配置。256個晶元的版本採用了谷歌在2017年推出的第二代TPU,峰值速度為11.5 petaflops。1024個晶元的版本採用了谷歌新推出的第三代TPU,峰值速度可達到107.5 petaflops。
這些性能數據表明該產品主要針對高性能計算機領域。目前全球最強大的超級計算機Summit峰值速度為200 petaflops。
事實上,Cloud TPU Pod在處理複雜性低於Summit等系統的數據時才能達到峰值性能,但總的來說它仍然是很強大的。谷歌通過API向用戶提供Cloud TPU Pod,這樣AI團隊就可以像使用一個邏輯單元那樣使用Cloud TPU Pod了,或者開發人員可以把一個Cloud TPU Pod的計算能力分散到多個應用中。
谷歌Cloud TPU高級產品經理Zak Stone在一篇博客文章中這樣寫道:「用戶還可以使用更小『切片』的Cloud TPU Pod。我們經常會看到ML團隊在單獨的Cloud TPU上開發他們最初的初始模型,然後通過數據並行和模型並行擴展到越來越大的Cloud TPU Pod切片。」
Cloud TPU Pod目前還處於測試階段,早期客戶包括eBay和總部位於猶他州的生物科技公司Recursion Pharmaceutical——該公司使用Cloud TPU Pod在對具有潛在醫療價值的分子進行測試。
※Cloud Next:Google將眾多開源軟體帶入雲端
※專訪影譜科技研發中心吉長江 理解行業讓AI更具「韌性」
TAG:至頂網 |