EMC Data Domain系统,是具有目标端重复数据消重功能的存储备份产品。在备份和归档过程中,由于备份数据在写入磁盘时已经消重了重复数据,因此只需要原始数据集若干分之一的磁盘空间,实现了经济高效的解决方案。

 

1. 介绍DD数据消重原理SISL

     要了解Data Domain的重复数据消重功能,就要了解Data DomainSISL架构,即Stream-Informed Segment Layout scaling architecture

     SISL工作流程分为5步,如图所示:pic01.png

1步:数据切片(segment),数据流在Data Domain RAM中会被切分成412KB的数据段;

2步:创建指纹(fingerprint),为数据切片创建指纹;

3步:指纹比对(filter),将数据切片对应的指纹与cache中的指纹ID进行比对。如果ID是新的,那么将进行下一步。如果ID是重复的,那么将舍弃这个数据切片;

4步:压缩数据(compression),经过比对的新的数据切片将被压缩成lzgzgzfast等格式;

5步:写入数据(write),将包含指纹、元数据等信息的数据切片写入虚拟容器,待虚拟容器写满后再写入磁盘。

 

2. 介绍global compressionlocal compression的含义

     data domain文件系统属性中,global compression对应于SISL的第123步的数据消重,即对重复数据切片的消重。如图所示:

pic02.png

 

     local compression对应于SISL的第45步的数据消重,即对数据切片、指纹、元数据进行数据压缩。

pic03.png

          total compression是综合了global compressionlocal compression两个效果之后的总体压缩比,也是我们最终得到的数据消重效果。

 

3. 日常监控示例

     在日常使用中,既可以通过CLI命令来查看global compressionlocal compression的数值。使用命令filesys show compression,输出结果如下图:

pic04.png

   

    从最近7天看,备份原始数据(pre-comp34260.2GiB,重复数据消重Global-Compglobal compression)的比例为2.2,消重后数据压缩Local-Complocal compression)的比例为3.2,最终写入磁盘的数据Post-Comp4899.2GiB,而总的备份数据消重压缩比为2.2x3.27.0

  从最近24小时看,备份原始数据(pre-comp4845.0GiB,重复数据消重Global-Compglobal compression)的比例为2.1,消重后数据压缩Local-Complocal compression)的比例为3.0,最终写入磁盘的数据Post-Comp784.3GiB,而总的备份数据消重压缩比为2.1x3.06.2

 

     了解以上Data Domain数据消重与压缩的属性,可以帮助用户在日常使用中更加有效的监控Data Domain空间使用情况,对调整备份策略也有一定参考意义。