當前位置:
首頁 > 最新 > 破解全快閃記憶體存儲介質壽命難題的六大招數

破解全快閃記憶體存儲介質壽命難題的六大招數

來源:浪潮存儲

SSD(固態硬碟)的壽命問題是用戶使用全閃陣列時關注的焦點。如何能夠讓用戶放心使用全閃陣列,保障在5年內存儲系統不會因為SSD壽命耗盡而出現問題,是全閃陣列廠商面臨的挑戰。浪潮存儲通過優化智能全閃G2-F的軟體棧,實現了SSD介質的磨損均衡,使得智能全閃G2-F可以在長達5-10年的全生命周期內,給快閃記憶體介質上的數據提供安全保障。

HDD和SSD可靠性上存在天然差異

HDD(硬碟驅動器)是通過機械旋轉加磁介質記錄數據的,而SSD則通過硅晶半導體記錄數據。二者記錄數據方式的差異決定了兩種類型的盤在存取速度和可靠性方面具有本質差異。

HDD由磁頭和碟片組成,數據存放在碟片上的某個位置,當對數據進行讀寫,需要將磁頭移動到磁軌上,碟片轉動到指定的位置。所以HDD是一個機械設備,只要加電,磁碟就處於高速旋轉工作狀態。磁介質本身的壽命是非常長的,所以磁碟的壽命並不取決於讀寫的數據量,而取決於磁碟的上電時間。不過,磁碟的壽命跟工作環境有很大的關係,比如震動對磁碟的壽命影響就非常大。

兩種存儲介質

而NAND的存儲單元為三端器件,與場效應管有相同的名稱:源極、漏極和柵極。如下圖所示,浮柵極是用來保存電荷的的,浮柵極與硅襯底之間是隧道氧化層,與控制柵極間也有一層絕緣層,上下兩層絕緣層保護浮柵極中的電荷不會泄漏。採用這種結構,使得存儲單元具有了電荷保持能力,通過讓絕緣浮置柵極捕獲不同數量的電子以實現bit值定義。就像是裝進瓶子里的水,當你倒入水後,水位就一直保持在那裡,直到你再次倒入或倒出,所以快閃記憶體具有記憶能力。

NAND Flash原理示意圖

而對浮柵極的充放電,是利用量子隧道效應實現的。當我們要對FLASH進行寫入操作的時候,在控制柵極上加高電壓,源極和漏極接地,使電子穿越隧道氧化層到達浮柵極,並聚集在浮柵上保持,形成電壓,用來存儲信息。進行擦除時仍利用隧道效應,把電壓反過來加,從而消除浮柵上的電子,達到清除信息的結果。

由於在寫入和擦除的操作過程中,電子反覆來回穿越隧道氧化層會損壞隧道氧化層,當絕緣氧化層破壞到一定程度,浮柵極中的電荷便不能再有效保持,導致存儲單元物理損壞。這就是NAND Flash會有寫入次數限制的原因。

由於在寫入和擦除的操作過程中,電子反覆來回穿越隧道氧化層會損壞隧道氧化層,當絕緣氧化層破壞到一定程度,浮柵極中的電荷便不能再有效保持,導致存儲單元物理損壞。這就是NAND Flash會有寫入次數限制的原因。

HDD的實現原理和Flash完全不一樣,HDD由磁頭和碟片組成,數據存放在碟片上的某個位置,當對數據進行讀寫,需要將磁頭移動到磁軌上,碟片轉動到指定的位置。所以HDD是一個機械設備,只要加電,磁碟就處於高速旋轉工作狀態。磁介質本身的壽命是非常長的,所以磁碟的壽命並不取決於讀寫的數據量,而取決於磁碟的上電時間。不過,磁碟的壽命跟工作環境有很大的關係,比如震動對磁碟的壽命影響就非常大。

通過對比SSD和HDD的工作原理,你會發現二者的故障模式有非常大的差異。傳統的磁碟軟壽命限制,因此需要對SSD的壽命管理進行精細設計,以此實現全快閃記憶體儲介質的生命周期管理。


浪潮智能全閃:六招實現SSD介質全生命周期管理

下面讓我們來看看浪潮智能全閃G2-F都有哪些大招,來實現SSD全生命周期精細管理以應對SSD的壽命挑戰。

招數1:T10 DIF杜絕靜默數據損壞

出了問題,首先要檢測到,防止靜默數據損壞。未被檢測到的靜默數據損壞會導致業務系統的嚴重後果。

T10 DIF(Data Integrity Field,數據完整性域)是用戶數據的一種端到端的保護機制,寫入數據的時候在數據塊末尾加入PI(Protection Information,保護信息)欄位,存放數據的校驗信息。當存儲端接收到帶有PI的數據之後,會將PI信息保存起來,這樣在讀取的時候會重新計算,使得掉電,硬重啟,卷重啟,鏈路丟失等都不會導致PI數據的丟失。浪潮智能全閃G2-F全系列通過支持T10 DIF檢測,杜絕了靜默數據損壞。

招數2:SSD壽命預測提供事先警告

既然SSD壽命有限,SSD什麼時候臨近壽命終點、什麼時候需要更換,就成為用戶和存儲系統管理員最關心的事情。全快閃記憶體儲系統需要在SSD臨近壽命極限時對用戶進行預警,給用戶預留更換乃至採購替代品的時間。同時,如果用戶的業務模型、業務流量和初始設計時發生了巨大變化,存儲系統也需要給出預警信息,讓用戶採取措施調整業務模型或者數據布局,將大流量的數據寫入業務遷移到其他存儲上。這些必要的功能在浪潮智能全閃G2-F系列產品上進行了全面配備,其中包括:

監測壽命衰減速度:浪潮智能全閃G2-F定時檢查SSD使用壽命百分比,壽命衰減速度過快時會上報並告警,提醒用戶SSD盤異常,建議更換或者改變業務模型。

實時監測使用壽命:當SSD盤使用壽命達到97%,系統會建議用戶更換SSD盤;達到99%,會警告用戶及時更換SSD盤

智能剩餘生命周期預測:浪潮智能全閃G2-F會根據用戶業務歷史流量及模型,對SSD可使用時間進行預測,並根據用戶業務模型的變化,實時調整預測周期。當預測到SSD剩餘壽命大概為6個月時,會產生告警,提醒用戶關注SSD壽命。

招數3:RAID壽命預測與自動化功能凸顯神通

當RAID成員盤的壽命臨近極限時,系統會發出告警,使用CLI命令或GUI界面,檢查每個成員盤的「更換日期」欄位,來確定需要更換的成員盤。如果RAID個別成員盤臨近壽命極限,只需更換個別成員盤,利用RAID冗餘數據重建,更換盤後,RAID自動重建該成員盤。

當RAID多個成員盤臨近壽命時,系統自動更換RAID Group。浪潮智能全閃G2-F可以利用數據遷移功能自動將該RAID中的數據在線遷移出來,方法是直接刪除該RAID——數據遷移功能會先將該RAID上的數據遷移到存儲池的其他RAID上,然後再刪除。如果存儲池其他RAID上沒有足夠的空間,刪除會失敗,需要先向存儲池添加新RAID後再刪除。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 芯師爺 的精彩文章:

深度剖析這些年半導體行業瘋狂併購背後的副作用
最新「全球超算500強」今宣布:美國時隔五年重奪榜首,中國位列第二!

TAG:芯師爺 |