英特爾發布新版AI雲晶元,劍鋒直指英偉達!
策劃編輯 | Natalie
作者 & 編輯|Debra
AI 前線導讀:洛杉磯時間 5 月 23 日,英特爾人工智慧開發者大會(AI DevCon 2018)如期舉行。會議上,英特爾副總裁、AI 事業部(AIPG)負責人 Naveen Rao 宣布推出新一代 AI 雲端晶元 Spring Crest,性能提升 3-4 倍,相當於谷歌前不久發布的 TPU 3.0,據說能 PK 掉英偉達最新的 GPU!這就有意思了,又一個宣稱能替代英偉達的,但是大會上並沒有披露其他細節,我們只能從目前透露出來的蛛絲馬跡來推測,英特爾新一代 AI 晶元是不是徒有虛名。
更多乾貨內容請關注微信公眾號「AI 前線」,(ID:ai-front)
發布升級Nervana NNP-L1000雲芯
(英特爾副總裁、AI 事業部(AIPG)負責人 Naveen Rao)
在這場並沒有受到很多關注的英特爾人工智慧開發者大會上,會議伊始,英特爾副總裁、AI 事業部(AIPG)負責人 Naveen Rao 就在演講台上拋出了最重磅的消息——發布升級版的 Nervana NNP-L1000 雲端晶元,新代號為 Spring Crest。
早在 2017 年 10 月 17 日 WSJ D.Live 大會上,英特爾就正式發布了專為機器學習而設計的神經網路處理器(NNP,Nervana Neural Network Processors)系列晶元,代號名稱為 Lake Crest。
時隔七個月,這個系列晶元全面升級,並且有了新代號——Spring Crest,並在會議上展出。
據 Naveen Rao 介紹,新一版的 NNP 晶元將帶來多項更新,性能比上一代產品提升 3-4 倍,目前已經提供給除 Facebook 之外的合作夥伴試用,但要到 2019 年下半年才會向用戶開放第一批產品。
根據現場展示,AI 前線了解到英特爾似乎更強調 Spring Crest 的存儲帶寬和低延遲性能,而不是 TOPS (trillion operations per second)。
Naveen Rao 首先介紹了上一代產品 Nervana NNP-L1000 (Lake Crest) 的性能。其 GEMM(General Matrix to Matrix Multiplication)操作矩陣為 A(1536, 2048) and B(2048, 1536) ,單晶元計算利用率超過 96.4%,實際性能(非理論)達 38 TOP/s。
支持模型並行訓練的多晶元分散式 GEMM 操作實現了 A(6144,2048)和 B(2048,1536)矩陣大小,接近線性縮放和 96.2%的縮放效率。這使得多個 NNP 可以連接在一起,並忽略其他架構的內存限制。
測量顯示,這款產品的理論帶寬單向 chip-chip 的效率的為 89.4%,延遲時間低於 790ns(納秒),可以將其應用於 2.4Tb / s(每秒太比特)的高帶寬、低延遲互連。
所有這些都可以在單晶元總功率低於 210 瓦的情況下實現。而這只是英特爾從早期合作夥伴那裡收集到的關於 Nervana NNP-L1000(Lake Crest)原型的反饋。
Nervana NNP-L1000 的性能比 Lake Crest 提升 3-4 倍,我們可以據之推測新升級晶元的性能。
另外,Spring Crest 還支持 bfloat16(ML 行業神經網路採用的標準),並且 FPGAs、 Xeons 和其他 ML 產品均支持 bfloat16。
其他亮點:渲染平台、作曲神器、三大軟體開源工具
GIF
(左邊的獅子沒有使用 AI,右邊的獅子使用了 AI,對比比較明顯)
除了這顆重磅魚雷,其他酷炫的產品和平台也得以在大會上展示,包括用於圖像渲染的 Xeon 平台,演講者現場演示 3D 動畫渲染的獅子,效果非常逼真。
在現場,英特爾還 DEMO 了一段用計算棒來供能的 AI 作曲。這款 USB 計算棒是英特爾此前推出的基於 VPU 的神經元計算棒,將所有的功能封裝到了 U 盤大小的設備中,用戶只需要將計算棒插入 USB 2.0 介面里,就可享用機器學習的強大功能。
在軟體工具方面,英特爾介紹了三大軟體開源工具:nGRAPH 平台、BigDL 大數據開源平台、OpenVINO 開源軟體工具。其中 nGRAPH 平台支持主流的 AI 開源框架如 TensorFlow、CNTK、Caffe2 等,還能支持英特爾所有硬體;BigDL 大數據開源平台,讓用戶可以輕鬆、簡單地在大數據集群中進行深度學習應用;OpenVINO 開源軟體工具可以讓開發者更簡單地在邊緣設備上部署視覺計算和深度學習能力。
此外,英特爾還宣布其將成為 2020 年東京奧運會的 AI 平台合作夥伴,繼東京奧運會的 5G、無人機等合作夥伴之後,英特爾又增加了一個新的身份。
Nervana 這張「王炸」,能幹過英偉達?
在此之前,英特爾通過自己的 Xeon Phi 架構與英偉達開始了爭奪機器學習市場的戰爭,這款產品使用數十個 Atom 核加速 ML 任務。然而,英特爾想必是意識到了單靠 Phi 這一款產品無法與每年在產品性能上都有飛躍的英偉達 PK。因此,這家公司開始尋找其他出路。在 FPGA 方面,英特爾收購了 Altera,為發展嵌入式視覺處理器收購了 Movidius,並買下 MobilEye 開發自動駕駛晶元,到拿下 Nervana 攻克專用神經網路處理器,英特爾在英偉達的重壓之下流露出的求生欲可以說是非常強烈了。此外,英特爾還開始自研專用 GPU,並著手研發神經形態和量子計算晶元。
「買買買」成了這家 PC 時代巨無霸布局 AI 的最常用手段之一。
2016 年 8 月,英特爾投入巨資收購了深度學習創業公司 Nervana Systems,成交金額約為 4.08 億美元,這對於當時只有 48 名員工的 Nervana Systems 來說可以說價值不菲。
(從左至右為英特爾數據中心主管 Diane Bryant, Nervana 聯合創始人 Naveen Rao、Arjun Bansal、Amir Khosrowshahi 和英特爾副總裁 Jason Waxman )
Nervana Systems 是一家創立於 2014 年,位於聖地亞哥的創業公司。該公司的三位創始人 Arjun Bansal、Naveen Rao 和 Amir Khosrowshahi 在高通公司工作時認識,其中 Naveen Rao 在被收購之後成為日後英特爾整合的人工智慧產品事業部(AIPG)負責人。
從被收購那一天起,Nervana 就被英特爾當成攥在手裡的一張王牌,想要以此對抗在性能提升方面又如神速的英偉達。2017 年 3 月,Nervana 以及其他英特爾內部的人工智慧相關業務和資源被整合進一個部門,即人工智慧產品事業部(AIPG),包括 Xeon、Xeon Phi、Nervana 和 Altera 四個部分,這個新部門將整合公司的資源,包括工程、實驗室、軟體等等,打造英特爾 Nervana 平台——既有包括 Nervana 雲計算服務、資料庫、又包括 Nervana 專用晶元。該部門 Nervana 的聯合創始人、前 CEO Naveen Rao 來領導,直接向英特爾 CEO 科再奇彙報。
在整合了 Nervana 的技術之後,英特爾 AIPG 於 2017 年推出 Crest 家族系列產品線。首先亮相的是一款叫做 Lake Crest 的晶元,它是專為訓練 DNN 而深度定製的 ASIC 解決方案,2018 年上市量產。據 Naveen Rao 曾經對媒體介紹,相對於當時最快的 GPU, Lake Crest 的加速性能是它的 10 倍。但是至今為止,這款產品除了引起大家無盡的猜測之外,並沒有引起多大的浪花,屬於還處於沉默中的「魚雷」。這個雷會在投入市場之後炸響?還是成了一顆「啞雷」?
大會上沒有給出更多關於 Spring Crest 的其他信息,但據英特爾 AI 產品組硬體副總裁 Carey Kloss 稱,第二代的谷歌 TPU 性能相當於英特爾的 Lake Crest,而最近推出的第三代谷歌 TPU 則與 Spring Crest 頗為相似。
根據他的說法,我們找到了 Carey Kloss 宣稱與之對標的谷歌 TPU 3.0 的性能路線圖:
據介紹,TPU 3.0 的計算能力最高可達 100PFlops(每秒 1000 萬億次浮點計算),是去年第二代的 8 倍還多,作為對比,包含 16 顆英偉達最新 GPU 的晶元群的計算能力為 2 petaflops。因此,有人稱第三代 TPU 有望取代英偉達 GPU 最新 AI 晶元。
對比一下,Spring Crest 與 TPU 3.0 相當,那就是還有機會和英偉達 GPU 一搏了。
但正如 TPU3.0 發布之後遭遇到諸如 Facebook、微軟等入局 AI 晶元的科技巨頭一樣,Spring Crest 的性能有沒有優勢,能不能擰過英偉達的「大腿」還是個未知數。在 5 月 7 日開幕的微軟 Build2018 大會上,微軟 CEO Satya Nadella 發布了 Project Brainwave 預覽版,並稱延遲比 TPU 低 5 倍。看來各個入局的參與者都在憋著招你追我趕,當年 PC 時代的霸主能不能靠新產品扳回一局,真的還很難說...
對於不差錢的英特爾到處買買買的做法,英特爾稱此方法是對人工智慧的「全面進發戰略」。然而,這家公司顯然是想要避免把寶全押在單一框架上,就像之前對 Phi 的過度依賴導致其在機器學習市場上與英偉達的差距越來越遠一樣。但另一方面,這種分散式的戰略不免讓開發者困惑,因為他們不知道長遠來看,英特爾會對哪項技術會投入最多的精力,可能連英特爾自己都搞不清楚吧。
英特爾能不能追上英偉達的腳步呢?現在看來,英特爾似乎要重點將 Nervana 推銷給 ML 研究者,也許是因為這是一款可以直接與英偉達競爭的產品吧(至少在英特爾的專用 GPU 面世之前)。
今日薦文
※Build大會沒有了Windows,微軟祭出哪些AI殺手鐧?
TAG:AI前線 |