Google Cloud TPU向公眾開放使用
作者:weakish
來源:論智
谷歌雲平台今天宣布,自2018年2月12日起,Google獨家研製的Cloud TPU向公眾開放使用,幫助機器學習開發者快速訓練模型。
Cloud TPU是Google為TensorFlow專門設計的機器學習硬體加速器,基於4個特製的ASIC,單個Cloud TPU 的計算能力可達180 TFLOPS,同時具備64GB帶寬。
和其他GPU雲一樣,Cloud TPU免去了設計、部署、維護一個機器學習計算集群的麻煩。除此之外,Cloud TPU的主要優勢在於容易和快速。
容易構建模型
TPU雖然基於ASIC構建,但並不像其他基於ASIC的機器學習硬體一樣需要專門編寫程序(其中包括很多和硬體交互的底層代碼)。相反,TPU可以直接使用高層的TensorFlow API。為了進一步幫助機器學習開發者快速上手,Google開源了一系列基於Cloud TPU的參考實現:
以後Google還將陸續開源其他模型實現。
如果你想基於Cloud TPU優化自己的TensorFlow模型,Google也提供了文檔和工具。
另外,PyTorch作者,Facebook AI Research的Soumith Chintala也宣布打算在PyTorch框架中集成Cloud TPU支持。
快速訓練模型
當年AlphaZero訓練了不到24小時就擊敗了圍棋、國際象棋、將棋的最先進模型,而AlphaZero正是基於TPU訓練的。
現在,你也可以體驗TPU的速度了!按照Google提供的教程,不到一天、不到200美元,你就可以在ImageNet數據集上訓練ResNet-50至75%精確度。如果換成普通的GPU雲,比如,配備Nvidia Tesla M40的阿里雲,你需要多花1-2倍的錢,還需要等待兩周!
這還僅僅只是一個開始。Cloud TPU還可以通過專門的極速網路連接,協同工作——Google稱之為TPU pod。等今年晚些時候Google開放TPU pod,訓練時間可以進一步縮減至不到30分鐘,而且無需改動代碼!
價格
Cloud TPU以秒計費,目前的價格為每小時6.50美元,以後可能會降價。目前Cloud TPU還處於Beta測試階段,因此主機位置只限美國中部地區,數量有限,需要先提交表單申請配額,還不能即買即用。
※為何NIKE頂著巨大壓力發布PG2?
※指環王1:別輕易斷定別人的生死
TAG:全球大搜羅 |