網路巨擘們集體迎接「光學與儲存技術」改革之戰……
網路巨擘們在近日於美國矽谷舉行的年度開放運算高峰會(Open Compute Summit 2018)上呼籲在連網、儲存與軟體等技術領域的大幅改革,才能讓他們不被大數據潮流所淹沒。
Facebook表示,該公司在三年內就需要配備光學介面的交換器ASIC,以支持下一次網路大升級;微軟(Microsoft)則宣布為NAND快閃記憶體硬碟開發了一種低階介面,以更妥善利用儲存。此外開放運算計劃(Open Compute Project,OCP)與Linux基金會建立了策略聯盟,目標是解決整合方面的問題,並讓系統與軟體能一起測試。
有趣的是,很少有人談到關於機器學習的採用,這是讓資料量大爆發的最新推力;而安全性則是日益受到關注的話題,去年發表的信任根(root-of-trust)模塊有越來越多支持者,同時有更廣泛的安全技術開發項目剛剛起步。
OCP贊助、在2011年由Facebook發起的Open Compute Summit今年是第九屆,有超過3,000人報名參加;現在OCP擁有175家廠商會員,訂定了375項與數據中心開放性硬體相關的規格。近幾年OCP吸引了Google,還有中國的阿里巴巴、騰訊,以及電信業者如AT&T、Verizon加入,但供貨商們卻表示,那些網路巨擘對技術之需求並不一致。
確實,就算是OCP最具影響力的成員──如Facebook與微軟──在高峰會上也表達了在伺服器與交換器設計方面的不同偏好;而全球最大數據中心營運商亞馬遜(Amazon),則繼續默默地走自己的路。
Facebook呼籲將光學介面導入交換器ASIC
有一位Facebook工程師表示,因為網路流量需求淹沒了來自第三方供貨商的設備,他們去年不得不以纜線把機架等級(rack-scale)交換器綁在一起。
為了跟上流量,Facebook將部份數據中心的範圍從一棟或兩棟建築,擴展到六棟建築物;要把數據中心連結在一起,需要的交換器數量,會是高階產品512個100-Gbit/second埠的三倍。Facebook項目經理Sree Sankar表示:「我們已經採用市面上最大的交換器,但沒有其他我們可以買得到的方案。」
Sankar的團隊將幾十台Wedge 100交換器堆棧在一個機架里,用一個背板的纜線以及配線板(patch panels)把它們綁在一起;最後成果是名為Fabric Aggregator的100 Tbit/s交換器(參考文章上方大圖),在5個月內從概念到實現量產,有四種配置,都執行該公司的FBOSS連網軟體。
而為了要在約兩年後邁進下一代400G介面,Facebook呼籲直接在商用交換器ASIC上導入光學介面;這會是非常大幅度且在技術上有困難的躍進,晶元供貨商認為還需要幾年時間。在最近舉行的年度光纖通訊大會(OFC 2018)上,由Microsoft數據中心專家率領的一個產業團體COBO發表了朝該方向跨出半步的第一版規格,也就是將光學介面導入主板模塊。
但Sankar表示,上述的COBO提案恐怕不適合Facebook所有機頂式交換器對400G連結的需求;她擔心採用400G技術時,工程師們無法為個別ASIC與光學模塊散熱。
在這方面,網通技術專家Andy Bechtolsheim (編按:Sun Microsystems共同創辦人)也呼應了Facebook的看法,認為需要為400G網路開發將ASIC與光學組件以封裝技術整合在一起的方案;他認為這種設計能將功耗降低30%。
Bechtolsheim的提案是利用2.5D晶元堆棧,讓交換器ASIC以及光學模塊在硅中介層上並排;他指出,打造一種介面的技術與商業挑戰,就在於低功耗,以及夠可靠、能在繁重的處理任務中存活。此外這種新設計也會重新定義網通供應鏈的各廠商角色。
Bechtolsheim建議以2.5D晶元堆棧結合交換器ASIC晶元與光學組件,圖為美國業者Luxtera的研發(來源:OCP)
「這會是一個需要多年時間的計劃,別期望很快發生,但讓我們現在就著手進行;」Bechtolsheim也呼籲工程師們在400G的多來源協議(multi-source agreements,MSA)上團結一致,以催生新一代的可插拔光學模塊。
英特爾(Intel)曾表示將於今年稍晚開始提供基於CWDM8 MSA的400G模塊,傳輸距離可達10公里;有數家供貨商預期會推出400G可插拔模塊,估計至2019年會有50萬埠的出貨量。
SSD介面新規格與硬體信任根
微軟在大會上宣布Denali項目(Project Denali),旨在打造一種pBLK介面規格;這種介面讓網路業者能控制固態硬碟(SSD)上的CPU、SoC與FPGA功能,包括垃圾收集(garbage collection)、耗損平均(wear leveling),還有應用程序在何處執行、如何加速等等。
該項目基本上是一種妥協,不那麼極端要求開發無韌體SSD;在Denali項目下,SSD供貨商可以使用控制器來驗證與管理多媒體及電源故障。包括博通(Broadcom)、英特爾、Marvell、美光(Micron)、三星(Samsung)與海力士(SK Hynix)都對這種新介面表達支持,美國矽谷業者Cnex Labs開發的一款TB等級M.2固態硬碟就採用了該種介面。
雖然網路巨擘們採用的快閃記憶體晶元量、僅佔整體出貨的六分之一,這些公司仍在SSD的採購上花費了數十億美元,所以微軟雲端硬體部門總經理Kushagra Vaid表示:「我們要推動效率,不過我們不會透露利用快閃記憶體可達到的性能表現;」他指出該介面也可以用於新興的儲存級內存。
Vaid表示,採用新介面的硬碟將會在今年投入量產,而他也歡迎來自各方對新規格的回饋意見;Facebook、Google與東芝(Toshiba)預期也終會支持該項目。對此擔任OCP董事會成員的Bechtolsheim表示,傳統標準組織可能會需要幾年的時間才能達成共識,但他希望可以在幾個月內讓Denali規格定案。
Denali項目能讓網路營運商透過嵌入加速器的方法來加快固態硬碟的運作速度(來源:OCP)
此外Vaid還提供了Cerberus項目(Project Cerberus)的新進展,即一種以MCU為基礎的信任根;該非關CPU與操作系統的方案,獲得了博通、Cavum、英特爾、恩智浦(NXP)、Mellanox與高通(Qualcomm)的支持。
在大約三個星期前,OCP展開了一項範圍更廣的安全計劃,由Google與微軟共同主導,但相關細節公布不多;該計劃的目標是因應整個供應鏈以及所有數據中心產品在生命周期中面臨的所有安全威脅。
開放軟體重量級結盟
著眼於暴增的開放源碼軟體開發案,Linux基金會與OCP建立了夥伴關係,將在自動化與測試開放性系統載入的軟體,以及探索新項目方面進行合作。
Linux基金會連網部門總經理Arpit Joshipura 表示:「我們必須要提供涵蓋硬體與軟體的測試,像是OPNFV;」該基金會正在開發網路虛擬化的開放源碼,而因為在開放性連網軟體領域有越來越多競爭項目,使得互操作性議題備受關注。舉例來說,AT&T提供的dNOS程序代碼、Google為最近宣布的Stratum項目提供的程序代碼,還有Facebook自家的FBOSS等等。
Linux基金會與OCP將在連網軟體的測試上進行合作(來源:OCP)
在Linux基金會也有超過20個與連網相關的開放源碼開發案正進行中,該基金會最近將觸角伸向物聯網裝置、儲存與區塊鏈(blockchain)應用的軟體領域。與OCP的合作是否能透過認證程序強化軟體互操作性,還有待觀察;此合作的動機目前看來是基於營運商在提供服務之前,對滿載網路系統之測試需求。
Open Compute Summit 2018上的其他重要訊息,還包括Facebook展示了採用8顆Nvidia Volta晶元的Big Basin GPU伺服器,耗電量為2.5kW;該公司的一位工程師表示,他們嘗試在系統相對閑置時,利用龐大的CPU資源來訓練其眾多神經網路模型。
編譯:Judith Cheng
本文授權編譯自EE Times,版權所有,謝絕轉載
※巨型太陽風暴將「襲擊」地球,明天可能大面積停電
※AI視覺成像晶元攪動千億級新市場,毒藥般SoC時代即將過去
TAG:EET電子工程專輯 |