當前位置:
首頁 > 科技 > 從西數收購Tegile聊聊NVMe標準的進展

從西數收購Tegile聊聊NVMe標準的進展

一段時間沒有寫博客了,很多人都以為我退出江湖了,西瓜哥難道真的成了傳說。

其實沒有啦,只是這段時間好像沒有特別想和大家分享的,因此休息了一段時間。

這不,今天有些事情想和大家聊聊,我不是又拿起了筆嗎?

話說我上一篇文章Tegile和Nutanix的NVMe新品一瞥剛剛講了Tegile的NVMe新品,沒想到這兩天就被西數收購了。西瓜哥一宣傳就被收購,O(∩_∩)O哈哈~

西數一直在Tegile有投資,這次收購的價錢未知。但是考慮到Tegile已經融資了170+m吧,按照5倍的投資回報率,估計800+m的收購價格比較靠譜。

其實西數一直在大舉收購,下面是西數歷年的收購情況。

我們看到,西數在2014就收購了一個全快閃記憶體公司Skyera,現在又收購了Tegile,也是一個快閃記憶體優先的公司,但有混合陣列。

對於做存儲介質的公司做存儲陣列,我是比較保守的。因為存儲介質需要賣給存儲系統的公司,你自己又做存儲系統和客戶競爭,關係很難協調。記得希捷收購了Xyratex後業務一直開展得不好,後來又把Xyratex獨立出去,而且Xyratex也做OEM業務多些(HPE 3PAR的中端就用這個硬體平台,如果我沒有記錯)。

西數收購Skyera後(其實是HGST收購),市場上好像也很少聽說這個AFA產品,也沒有進入Gartner的SSA魔力象限。我感覺應該發展一般。因此,我也不看好Tegile的未來,畢竟銷售硬碟和銷售存儲是兩種不同的模式,硬碟一般針對存儲廠商,採用OEM的方式,而銷售存儲針對大企業,需要high-touch。

當然,西數又做存儲又做盤,有自己的優勢。但現在自己做SSD盤/卡的廠商也很多,華為和Pure都是,IBM和HDS也有自己的快閃記憶體模塊。但人家的SSD盤/快閃記憶體模塊都自己用,不對外銷售,因此,沒有戰略衝突。

總之,我不是太看好,當然,很多人不信,因此只能看時間來證明了。

不過,西數收購Tegile,估計是受到了Micron的壓力,因為Micron剛剛宣布推出了NVMeoF的存儲SolidScale。Micron也是做SSD盤的,但是人家Micron只是自己做的硬體,然後OEM Excelero的軟體(架構參考前文硬體定義的NVMf存儲DSSD倒下了,軟體定義的NVMf存儲Excelero來了),網路採用Mellanox的RoCE交換機。也就是Micron的投入還是直接做硬體上,軟體是OEM的。我覺得Micron很聰明,這是為了賣自己的硬體,其他存儲廠商,也可以用他的硬體,只是目前RSF這種形態成功的不多,需要Micron來證明一把而已。因此,從大的戰略來說,我並不認為Micron要大規模進入存儲整機系統,和EMC競爭。

Micro宣傳SolidScale有重刪、快照和複製這些增值特性,據我了解,目前Excelero並沒有這個能力,這個應該是未來的版本。RSF這種形態,如果支持這些增值特性,那可了不得。EMC DSSD為啥死了,除了太貴外,還有就是不支持增值特性,這樣滿足不了企業需求。

這種RSF架構,增值特性必須採用分散式系統來實現,也就是只能在NVMesh Client來實現。也就是說,增值特性需要消耗計算節點的資源,這種架構其實就是很像HCI/SERVER SAN的架構。因此,也有很多人認為,RSF這種NVMesh的架構,不像一個SAN,更像一個DAS。

華為、Pure和Tegile的NVMe陣列實現的方式就不同,把NVMeoF分成前後兩個Fabric,中間用控制器分開,因此,增值特性全部在控制器上實現,不需要主機安裝客戶端。(IDC把Pure這種方式也叫RSF,其實應該是不同的,我個人保留意見)

EMC的未來NVMe的高端存儲,據說是下面這種架構。也是不需要分散式客戶端來實現增值特性的。和Pure和華為的方式類似。

這兩種方式那種成為主流,現在還是未知之數。控制器方式兼容性比較好,演進比較容易,而客戶端方式時延會好,但增值軟體實現比較複雜。我個人比較傾向控制器實現增值特性這種。

不管怎樣,IDC呼籲大家現在就要考慮NVMe了,除了時延,還有吞吐量,密度,特別是SSD的重構時間也會大大加快。

既然寫到這裡,我順路更新一下我從最新的美國快閃記憶體峰會各家演進材料裡面看到關於NVMe的產品和標準進展的一些內容。

前面,我寫過一篇文章談談NVMe 1.3新規範支持的重要三個數據中心特性,裡面講了NVMe 1.3規範的一些新特性。今天,我想聊聊NVMe 1.3以後正在標準化的一些特性。

首先補充一下NVMe 1.3規範裡面關於多流寫這個特性的實現方式。其實就是利用了NVMe命令裡面的沒有用的空間擴展來的。有兩個欄位,DTYPE和DSPEC,這次用了做寫入流的標識,實現冷熱數據分區,從而實現高效的GC。

在下一個NVMe規範,最重要的特性就是I/O確定性。在說這個問題之前,我們先來了解原理。

大家知道,快閃記憶體有讀衝突的問題,即某個die如果是寫的時候,這個時候是不能讀的。現在的寫都是條帶寫,影響到很多die,如果這個時候這些die不能讀,系統的讀IO就需要等待,會大大影響系統的性能。特別是現在盤的容量越來越大,這個相互干擾的問題也越來越嚴重。

因此,把大盤分層很多個小的邏輯盤就是一個QoS隔離的有效手段。比如一個4TB的SSD,分層4個1TB的邏輯SSD,這樣,對邏輯SSD的操作衝突就可以隔離開來。

因此,NVMe的下一個規範就有這個NVM Sets的能力,可以分成不同的空間,這些空間也可以有不同的屬性,如壽命。如果這些能力傳遞給主機,搞個盤內分層好像也是可以的。

還有一個特性,就是把I/O操作分成兩個窗口,確定性窗口只讀,後台操作也禁止,保證最低的讀時延,而不確定窗口就不保證時延,但所有的I/O都可以進行。

把這些I/O窗口的調度能力告訴主機,主機就會利用確定窗口來讀一些關鍵數據,保證系統的的可預測的時延。

這樣就使得主機完全控制一個NVM Set的讀寫干擾,使得可預測的性能成為可能。

未來NVMe還可以實現命名空間的非同步訪問,這個特性我還沒有找到什麼場景需要?我初步判斷在多路徑的場景下,這種非同步訪問會大大提高性能。可能是針對NVMe多路徑的改進。

還有一個正在開發的特性是永久內存區PMR,掉電後數據可以保留。

可以利用PMR做log和元數據的保存等等,會大大提高系統的性能。

這次美國快閃記憶體峰會,vmware也給出了自己支持NVMe的路標。未來也要支持端到端的NVMe,支持NVMeoF。

其實,NVMeoF的應用場景很多。

但是,目前NVMeoF剛剛標準化,即1.0版本才發布不久。功能還是很少的,目前只支持RDMA,下一個版本會支持TCP。

這次FMS上,很多廠商都演示了基於RoCE的NVMeoF的演示,也有很多廠商宣布推出基於RoCE的產品,包括華為和Pure。

其實,RDMA這個機制是從IB裡面拿來的。

那麼,是否可以拋棄RDMA,直接把NVMe承載在TCP上呢?因為TCP無處不在。

大家可能覺得TCP的性能是否會太差?有廠商測試,發現性能可以接受,最少會比iSCSI強,因為沒有SCSI協議的開銷了。因此,我覺得一般場景採用NVMe over TCP應該也是可以的,但性能敏感的,還是建議採用RoCE。

大家看到,NVMe相關的標準一直在演進,估計要再過幾年才會相對成熟穩定。而且,我們看到後面的很多特性其實還是很有吸引力的。還有,很多標準是可選的標準,不是所有的SSD盤都支持。為了更快享受到這些特性,很多存儲廠商自己做SSD的盤或者卡,提前實現多流和IO確定性這些功能,比如華為和Pure正在走在這條路上。

當然,還有另外一種方式,即採用Open-Channel SSD,把FTL層都放到主機來。

可是,目前Open-Channel SSD的標準要在2018年Q1才能發布,而且推動的都是LiteON這些比較小的SSD廠商,沒有看到intel和三星的影子。也就是大廠都不喜歡這個,因為這樣的SSD盤沒有任何增值特性,和賣顆粒差不多,附加值太少了。

因此,總結一下,現在AFA廠商,要領先一步,還是直接做SSD盤最可行。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 高端存儲知識 的精彩文章:

HPE 3PAR推出新的AFA重刪壓縮承諾,極像沖著華為而來
Tegile和Nutanix的NVMe新品一瞥
Cisco收購Springpath,價格只有HPE收購Simplivity的一半,Nutanix只能靠自己了
談談Kaminario的NVMe AFA和Pure Storage的不同
聊聊數據中心備份和恢復解決方案廠商和產品

TAG:高端存儲知識 |