當前位置:
首頁 > 新聞 > 谷歌TPU3.0性能提升8倍,但優勢遭微軟、Facebook軟硬「圍攻」

谷歌TPU3.0性能提升8倍,但優勢遭微軟、Facebook軟硬「圍攻」

谷歌無論是在自動駕駛還是AI領域都具備優勢,2018谷歌I/O大會的重點之一也是AI技術的發展。在Goole I/O 2018上,谷歌首席執行官Sundar Pichai宣布推出Tensor Processor Unit 3.0,並表示TPU3.0的計算性能相比去年提升了八倍,可達 100PFlops(每秒 1000 萬億次浮點計算)。

谷歌TPU是專門是為機器學習定製的專用晶元(ASIC),也是為谷歌深度學習框架TensorFlow而設計。據悉相比一般的GPU圖形處理器,TPU可以以8位低精度計算節省晶體管,對精度影響很小同時可以大幅降低功耗、加快速度,同時還有脈動陣列設計,優化矩陣乘法與卷積運算,並使用更大的偏上內存,減少對系統內存的依賴。另外,它還第一次使用了液冷散熱,可以更高效地服務數據中心,便於定製硬體方案。

由於谷歌去年已經發布了第二代產品,所以對於今年TPU3.0的發布我們並不感到意外,不過Sundar Pichai並沒有透露關於TPU3.0的更多細節,但可以看到谷歌希望以TPU為基礎讓Google Cloud像Amazon AWS一樣無處不在。

谷歌TPU3.0性能提升8倍,但優勢遭微軟、Facebook軟硬「圍攻」

微軟Brainwave延遲比TPU低5倍

除了谷歌,其他科技巨頭也在自主研發AI晶元,雖然從公開信息中我們可以了解到Facebook和亞馬遜自主研發晶元還處於早期階段,自主研發定製AI晶元的目的也還不夠清楚,但可以看到的是當數據量越來越大,且擁有最多和最好的數據成為公司重要競爭力的時候,Nvidia的GPU可能不足以處理這些數據,需要超高效的定製晶元。當然,Sundar Pichai還表示,對於通過自主研發定製晶元滿足深度學習需求而言,散熱成為越來越大的難題,這也是谷歌不得不第一次在數據中心使用冷卻液的原因。

所以,不僅科技巨頭的入局,AI晶元的創業公司也開始湧現並獲得資本青睞,像Cerebras Systems、SambaNova Systems和Mythic等初創公司大多數已經籌集了超過3000萬美元,它們希望在具體的應用中通過其研發的AI晶元完成機器學習的任務,並且性價比能超越Nvidia。

當然,有新入局者也有傳統晶元巨頭,英特爾使用FPGA參與AI晶元的競爭,並且隨著機器學習的需求的變化,英特爾設計出更加靈活模塊化的FPGA,但FPGA的成本以及高門檻成為了FPGA應用及推廣中的難度。不過,與谷歌的其他競爭對手也押註定制晶元(ASIC)不同,微軟認為FPGA比ASIC更靈活,並且標準Intel Stratix FPGA的性能至少可以與定製晶元相媲美。因此微軟選擇押寶FPGA,雷鋒網消息,在5月7日開幕的微軟Build2018大會上,微軟CEO Satya Nadella發布了Project Brainwave預覽版,並稱延遲比TPU低5倍。微軟還稱利用Project Brainwave平台的客戶可以使用標準的圖像識別模型處理100萬張圖片,單個圖像在1.8毫秒內就能處理,比現在的任何競爭對手的雲服務都要好。

不過,FPGA在雲計算中並沒有被廣泛使用,而微軟正在將FPGA整合到其整個數據中心網路,成為一種硬體微服務。微軟不可能不了解押寶FPGA面臨的成本以及高門檻高的困難,但由此可見其決心,同時也讓我們看到微軟正在用FPGA參與競爭,這當然是谷歌不可忽略的對手。

PyTorch新版本挑戰TensorFlow

前面已經提到,自主研發晶元只是科技巨頭們為更好處理數據,讓數據產生更大的價值,想要對對開發者產生更大的吸引力還需要配套的工具。因此看到谷歌TPU之上有TensorFlow,Brainwave也支持微軟CNTK和TensorFlow框架。

所以谷歌如果想要把開發人員留住,不僅需要更快的晶元,機器學習的工具也十分重要,讓開發人員進入其GCP(Google Cloud Platform)和其他服務,並使用TensorFlow。這也是谷歌能否從目前核心的廣告業務中逐漸擴展到新的領域並保持領先優勢的關鍵。

但隨著Facebook越來越希望用像PyTorch這樣的框架來挑戰TensorFlow,谷歌想保持領先變得困難。雷鋒網消息,今年F8開發者大會的第二天,Facebook宣布PyTorch 1.0beta版將在今年夏天和用戶見面,並提前展示了這款新框架的特性。據Facebook介紹,PyTorch 1.0結合了Caffe2和ONNX模塊化、面向生產的特性,也結合了PyTorch靈活、面向研究的特性,為廣泛的AI項目提供從科研原型到生產部署的快速、無縫途徑,讓用戶可以快速實驗,通過能在強制執行模式和聲明執行模式之間無縫切花的混合前端優化性能。

需要了解的是,ONNX(開放神經網路交換)是Facebook去年聯合多家軟硬體公司發布的神經網路模型轉換協議,現在新增了對蘋果的Core ML、百度PaddlePaddle、高通SNPE的支持,再加上原本支持的MXNet、Caffe2、PyTorch、TensorFlow、CNTK等框架,實現了神經網路模型在各種主流框架之間的轉換。

因此,TPU3.0隻是谷歌服務其生態保持領其先地位的第一步,硬體之上的TensorFlow同樣重要。微軟基於FPGA的Brainwave平台以及Facebook的PyTorch 1.0軟體和硬體都與谷歌形成了競爭關係,未來谷歌能否保持領先地位還需要看其是否能做出快速的回應。

雷鋒網編譯,via techcrunch

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

鐳神智能敲定B輪融資、並推出自動駕駛解決方案加速落地進程
阿里達摩院宣布研發AI晶元,中興要求員工重學歐美法律,亞馬遜Prime會員超過一億人

TAG:雷鋒網 |