全闪存储介质的寿命到底怎样,有没有一个判断标准。好像说有耐磨指数、数据中心级等等不同标准的介质,这块想请教行业内专家。是等报故障再换盘,还是有个预警值,到了就提前换掉,避免隐患。
收起在业界,SSD的寿命一般用三个参数来标注,DWPD,GB/Day,TBW。这三个参数可以相互转换。有些SSD标注多个寿命参数,有些只标注一个参数。 其中:
TBW__:TeraBytes Written ,即生命周期内该 SSD 可以写入的数据总量。
DWPDuser__:Drive Write Per Day ,即每日整盘写入次数。本处的 DWPD 是指客户场景下实际的每日整盘写入次数。
UserCapacity__: 用户可见的 SSD 单盘容量。
365_:_1 年按 365 天计算。
目前主要看的指标是TBW,而在单盘SSD或NVMe-SSD的容量充分的情况下,且写入数据量远达不到单盘容量的情况下,其性能和可靠性是完全没问题的。特别是闪存存储提供的一些压缩、聚合写等功能也能进一步提升闪存盘的可用性。
目前,主流的全闪存存储都具备闪存盘寿命或健康度查询功能,可以通过API或CLI编写监控指标进行提前预警,当然本身闪存存储就对这方面有监控值,对隐患故障盘会有预判,也就是预防性更换来避免隐患。