最近碰到有使用了企业级闪盘(SSD)的EMC客户询问SSD的寿命到底如何。他们有些担心,过了3~4年,SSD会因为闪盘单元的写磨损,导致批量的损坏。

vmax_vnx_logo.png

XtremIO_logo.png

大家都有基本的概念,普通PC使用的闪盘,还有U盘,每单元寿命只能承受1000多次的“写”。企业存储里,动则几万到几十万IOPS的,感觉分分秒秒的就能写坏很多闪盘单元,然后SSD用不了几年就要纷纷报销了?

实际情况如何呢?

EMC是最早开始卖带企业级闪盘的公司,从08年开始卖带SSD的存储,到现在已经进入实打实的7年了。实际看损坏率,基本可以很让人放心。

中国的第一个客户从09年开始使用9SSD,到现在为止7年多,只有一块更换,还不是因为介质问题而是其它问题更换的。其它的客户大致统计上看,更换率也低于普通磁盘。

这从原理上怎么解释呢?

EMC刚推出SSD时,官方的描述是这样的,

Characteristics of Enterprise Flash SSDs

  • Higher performance, reliability and cost technology
    • SLC NAND Flash-based persistent storage
  • Dual-ported Fibre Channel drive interface
  • Optimized for maximum lifecycle and random+sequential read/write performance
    • On-board DDR SDRAM cache for read pre-fetch, write buffering, and block mapping
      • Includes internal backup power to for destage to Flash on power failure
    • Multi-channel parallel I/O to NAND Flash components for maximum performance
  • Integral Error Correction Code (ECC) to detect and correct bit errors
  • Transparent wear-leveling to minimize and delay inherent wearing effect of rewriting
  • Reserved NAND flash capacity, used to remap bad blocks as they wear

 

上述英文说明里,关键的有几点,能说明跟寿命有关,

  1. 1. SLC NAND,这是单层单元闪存,寿命本身比消费级产品使用的多层单元闪存寿命要高很多(具体数量级在下面说明);
  2. 2. 为最长寿命优化设计,闪存盘内内置RAM缓存,有内置电源,不仅提速,还可以优化写操作;
  3. 3. 内置纠错,能修正单比特错误;
  4. 4. 保留的容量,能把损坏的单元做重新定位。

那么跟消费级的闪盘比,我们使用的SSD能经过多少次真实的写呢?答案是10万次以上。这是个100倍的关系。

08EMC发布SSD时,就有Q&A里说:we expect the Flash drives to have a much better MTBF than mechanical drives since they have no moving components. Each flash cell is guaranteed to sustain 100,000 write and typically sustains much more before wearing out.

就是说,理论上SSD(英文中的Flash drives)应该有比机械磁盘好得多的寿命。实际上SSD的寿命确实如此。假设一个73GB的闪盘(这是EMC最早推出闪盘的容量),以较高的IO压力,比如100MB/s的吞吐量,50%是写的话,寿命计算可以达到7年。而且这个假设里,容量越大,寿命越长(写密度低了)。

  还有,现在的磁盘柜是cached array,短时间重复写IO还会被“吸收”掉,SSD上长时间平均的写IO一般都是远低于50MB/s的。所以SSD的寿命问题,用户基本可以放心地使用到磁盘柜的一整个生命周期了。企业级磁盘柜,生命周期在10年左右。


EMC现场支持专家 余建云