Find Communities by: Category | Product

在EMC存储连接IBM Mainframe客户的设备环境中,经常会遇到使用EMC VMAX或者DMX存储,同时使用IBM软件flashcopy来实现device本地复制, 或者文件备份的功能。在实施使用过程中,经常会遇到Flashcopy与EMC 存储的兼容性问题。这里总结几个需要注意的问题供参考。

首先,EMC软件TimeFinder Clone与IBM软件Flashcopy功能类似,在DMX存储上运行的Enginuity code 5773 上,Flashcopy和TimeFinder Clone 不能共存。在VMAX存储上两者可以共存。

目前解决的办法只有升级为VMAX。

其次,在DMX上运行多个Flashcopy作业时,可能会出现错误信息

ADR987I   UNABLE TO PERFORM FAST REPLICATION FOR DATA SET SGE.MV.X01.DS024 ON VOLUME SGE012 DIAGNOSTIC INFORMATION: 00001E19-08040FAF

这个是由于copy/move的文件数量越多,在存储DMX上需要创建的Flashcopy session数量越多,当存储处理不了这么多sessions的时候就不能保证每个dataset都能够用到Fast Replication, 这时ADR987I message就出现了。出现这个message不会造成flashcopy作业的中断,只是会作业耗时会延长。

解决的方法是减少单个作业里的copy datasets数量来减少ADR987I出现的频率,或者是升级存储到VMAX,在VMAX环境里由于VMAX本身处理能力较DMX强,单个FLASHCOPY SESSION时间短,出现这个错误信息的概率要低很多。

再有,Flashcopy的target device不可以和source device同时在一个SRDF group。当R1端有Flashcopy作业运行时,source和target devices之间生成Flashcopy session,  SRDF的link状态由R/W变为SyncInProg,意味着R2devices发现有些devices(Flashcopy的Target devices) 对R1端有Invalid tracks,  这时R2的数据不是consistent的。

解决方法是将Flashcopy的target devices从R1中分离出来,单独建立一个group。

        VPLEXEMC近年主推的虚拟化产品之一。在实际应用中,时常有客户抱怨,实施VPLEX后没有硬件故障情况下性能下降严重。遇到这种问题,往往需要我们详细询问客户并收集很多信息来分析。

     要收集并检查的信息名目种类繁多:后端 VNX性能数据、后端Symmetrix STP性能数据、后端SAN交换机日志、前端SAN 交换机日志、主机日志及性能参数(IO响应时间,IOsize大小、文件系统类型、数据类型及读写比例、主机CPU内存利用率是否偏高、主机多路径软件设置是否符合VPLEX要求、metro环境用户两地间链路情况……

        看到如此多的问题,想必各位看着都头大一圈,其实大多数情况下性能问题没有那么复杂,这里我们介绍vplex中性能问题的简单检查处理步骤及VPLEX简单性能监控功能。

首先运行普通检查程序VplexPlatformHealthCheck确保vplex没有故障,运行后检查Vplex各部件是否正常。

举例输出如下

service@ManagementServer:~> VPlexPlatformHealthCheck

System Information

------------------

     single engine(small config)system detected

 

Management Server IP Connectivity Check

---------------------------------------

Port Plugged : OK

IP interfaces : OK

IP Connectivity to Directors Check : OK

 

Local-com FC Connectivity Check

-------------------------------

Director to Director Connectivity Check : OK

 

Management Server System Check

------------------------------

Process Check : OK

Check Partitions : OK

CPU Check : OK

BMC Check : OK

 

Director (engine-1-1 director 1A 128.221.252.35) Health Check

-------------------------------------------------------------

    Process Check: OK

    CPU Check: OK

    SSD Check: OK

    Partition Check: OK

    RPM Check: OK

    flashDir Check: OK

    WWN Seed Check: OK

    Health Check: OK

    Hardware Module Check: OK

 

Director (engine-1-1 director 1B 128.221.252.36) Health Check

-------------------------------------------------------------

    Process Check: OK

    CPU Check: OK

    SSD Check: OK

    Partition Check: OK

    RPM Check: OK

    flashDir Check: OK

    WWN Seed Check: OK

    Health Check: OK

    Hardware Module Check: OK

 

第二步在vplex无故障情况下,查看Vplex提供的GUI界面monitor页,此页面可以查看CPU利用率


CPU.png

FE 前端口延迟时间

MWSnap005 2014-09-17, 16_56_42.jpg

前端口IO流量

MWSnap003 2014-09-17, 16_56_23.jpg

BE后端口延迟时间

MWSnap006 2014-09-17, 16_56_48.jpg

BE后端口IO流量

MWSnap004 2014-09-17, 16_56_36.jpg


前后端口IO延迟是否一致,前端口延迟过长还是后端口延迟过长,快速定位问题

dvbi.jpg


检查所有前端口延迟是否一致,是否有个别链路超时。检查所有后端口延迟是否一致,是否有个别端口超时。如果是Metro架构,需要观察WAN端口流量和WAN端口延迟时间是否超时


MWSnap008 2014-09-17, 16_57_35.jpgMWSnap009 2014-09-17, 16_57_49.jpg

   笔者曾遇到某医院案例,客户反映客户端处理每笔业务需要3分钟,正常情况应该在3秒内完成,检查前后端,前端口正常,后端口中有一个端口严重超时并丢包率很高,检查交换机log。对应端口显示同样是CRC错误和C3discards高,建议客户更换高质量OM3光纤线,更换后故障立即消失。通过运用同样方法解决了两家银行客户的同样问题,综合近期案例,vplex遇到问题最简单直接的方法就是利用vplex提供的monitor页面,观察和监控各个端口的流量及响应时间,快速判断定位类似“性能”故障。

        EMC Data Domain系统,是具有目标端重复数据消重功能的存储备份产品。在备份和归档过程中,由于备份数据在写入磁盘时已经消重了重复数据,因此只需要原始数据集若干分之一的磁盘空间,实现了经济高效的解决方案。

 

1. 介绍DD数据消重原理SISL

     要了解Data Domain的重复数据消重功能,就要了解Data DomainSISL架构,即Stream-Informed Segment Layout scaling architecture

     SISL工作流程分为5步,如图所示:pic01.png

1步:数据切片(segment),数据流在Data Domain RAM中会被切分成412KB的数据段;

2步:创建指纹(fingerprint),为数据切片创建指纹;

3步:指纹比对(filter),将数据切片对应的指纹与cache中的指纹ID进行比对。如果ID是新的,那么将进行下一步。如果ID是重复的,那么将舍弃这个数据切片;

4步:压缩数据(compression),经过比对的新的数据切片将被压缩成lzgzgzfast等格式;

5步:写入数据(write),将包含指纹、元数据等信息的数据切片写入虚拟容器,待虚拟容器写满后再写入磁盘。

 

2. 介绍global compressionlocal compression的含义

     data domain文件系统属性中,global compression对应于SISL的第123步的数据消重,即对重复数据切片的消重。如图所示:

pic02.png

 

     local compression对应于SISL的第45步的数据消重,即对数据切片、指纹、元数据进行数据压缩。

pic03.png

          total compression是综合了global compressionlocal compression两个效果之后的总体压缩比,也是我们最终得到的数据消重效果。

 

3. 日常监控示例

     在日常使用中,既可以通过CLI命令来查看global compressionlocal compression的数值。使用命令filesys show compression,输出结果如下图:

pic04.png

   

    从最近7天看,备份原始数据(pre-comp34260.2GiB,重复数据消重Global-Compglobal compression)的比例为2.2,消重后数据压缩Local-Complocal compression)的比例为3.2,最终写入磁盘的数据Post-Comp4899.2GiB,而总的备份数据消重压缩比为2.2x3.27.0

  从最近24小时看,备份原始数据(pre-comp4845.0GiB,重复数据消重Global-Compglobal compression)的比例为2.1,消重后数据压缩Local-Complocal compression)的比例为3.0,最终写入磁盘的数据Post-Comp784.3GiB,而总的备份数据消重压缩比为2.1x3.06.2

 

     了解以上Data Domain数据消重与压缩的属性,可以帮助用户在日常使用中更加有效的监控Data Domain空间使用情况,对调整备份策略也有一定参考意义。

 

 

 

 

 

 

一.什么是zone

ZoneFC-SAN交换机上的一种独有的逻辑配置,通过配置特定的设备加入zone,从而允许设备之间互相通信。当交换机上配置了zone时,同在一个zone里的设备之间可以互相通信,没有加入任何zone的设备不能与其他设备通信。

早期交换机厂商根据zone的实现方式,把zone分为hard zonesoft zone,区别在于前者通过硬件芯片来实现,后者通过软件来实现。后来大家把基于domain ID/端口号的zone叫做hard zone,基于wwnzonesoft zone。现在这两种类型的zone都是基于硬件芯片实现。

Zone的类型:

1.  基于Domain ID/端口号(D,P)的普通zone模式

这种zone允许接在某几个端口上的设备互相通信,即使端口上的设备改变也不会影响zone的使用,在更换主机HBA卡时不需要进行任何zone配置的更改。

 

2.  基于wwpn/wwnn的普通zone模式

这种zone允许拥有特定wwn的设备之间互相通信,不关心设备接在交换机的哪个口上。当某个设备从一个端口移到另一个端口时,不需要进行任何zone配置的更改。但更换主机HBA卡时,需要根据新HBA卡的wwn更改zone配置。注意如果交换机上接有NPIV模式的刀片交换机或主机集群时,必须使用基于wwnzone

 

3.  混合zone(session based hard zoning)

当一台设备在两个或多个zone里分别使用D,Pwwn模式的zone,这台设备会进入混合zone模式。在混合zone模式里的设备在跟其他设备通信时需要通过交换机CPU进行软件验证。

 

4.  LSAN zone

LSAN zone只有在启用了FCR时才会被应用到,它能允许在不同的fabric中的设备通过fc router进行通信。需要在交换机上安装integrated routing license后才能打开FCR功能。

 

5.  TI zone(Traffic Isolation zone)

TI zone可以把一根或者多根ISL设置成某个zone的专用ISL,不需要license

 

6.  QOS zone

QOS zone在网络中出现拥堵时可以允许高QOSzone成员优先通信,需要在交换机上安装adaptive networking license

 

Zonesetzone的集合。一台交换机同时只能启用一个zoneset,同一个SAN网络中交换机的active zoneset必须保持一致,不然会造成网络分裂(fabric segment)

Alias,或叫做别名,是使配置zone更简便的一个功能。对于每台设备,可以预先设置好alias,之后在配置zone时使用alias来代替D,Pwwn

Default zone:思科与博科交换机都有default zone,它的功能是在没有任何zone配置时允许所有连接在交换机上的设备互相通信。

 

二.如何做zone

  1. 1. 博科交换机CLI命令行:

首先对每个需要做zone的设备创建alias,然后创建zone并把alias加入,创建cfg(zoneset)并把需要的zone加入,最后启用cfg

帮助命令: zonehelp

显示现有配置:cfgshow

创建/增加成员/移除成员/删除alias

     alicreate "aliName","member[; member...]"

     aliadd "aliName","member[; member...]"

     aliremove "aliName","member[; member...]"

     alidelete "aliName"

创建/增加成员/移除成员/删除zone:

     zonecreate "zonename", "member[;member...]"

     zoneadd "zoneName", "member[;member...]"

     zoneremove "zoneName", "member[;member...]"

     zonedelete "zoneName"

注意:根据zone的最佳实践,EMC推荐每个zone里只放一个initiator(主机,VplexBE口等)。多个initiator互相zone在一起会导致很多反常现象。

创建/增加成员/移除成员/删除cfg

     cfgcreate "cfgName", "member[;member...]"

     cfgadd "cfgName", "member[;member...]"

     cfgremove "cfgName", "member[;member...]"

     cfgdelete "cfgName", "member[;member...]"

保存/启用cfg

     cfgsave

     cfgenable "cfgName"

注意:激活某个cfg会使其他正被使用cfg停止工作,一个fabric里同时只能有一个cfg处于工作状态。

更改default zone配置:

     defzone [--noaccess | --allaccess | --show]

 

  1. 2. 博科交换机GUI界面:

进入webtools后点击Zone Admin,进入zone配置界面。

V6.x.x界面:

1.jpg

V7.x.x界面:

2.jpg

进入Zone Adminv6.x.xv7.x.x版本的界面基本一致。

3.jpg

创建alias

4.jpg

点击New键或右边的new alias键,输入alias名字,注意只能输入数字字母或下划线。

5.jpg

点击OK后注意6.jpg 栏内已经显示刚才输入的alias名字,然后从左边的列表里选中相应的wwn或交换机端口,点击add member键加入右边的alias members里。

创建zone并添加成员:

选中标签页中的zone标签,点击New按键,输入zone名字并点击OK

7.jpg

然后从左边列表里选中相应的wwn,交换机端口或之前设置好的alias,点击add member键加入右边的zone members里。

注意:根据zone的最佳实践,EMC推荐每个zone里只放一个initiator(主机,VplexBE口等)。多个initiator互相zone在一起会导致很多反常现象。

 

创建cfg并添加成员:

选中标签页中的zone config标签,点击New键,输入cfg的名字并点击OK

9.jpg

然后从左边列表里选中相应的zone,点击add member键加入到右边的zone config members里。

 

保存并激活cfg

选中标签页中的zone config标签,查看name右边下拉菜单,确认当前的cfg是需要激活的cfg

9.jpg

点击save config按钮,保存之前更改好的cfg

点击enable config按钮,激活当前选中的cfg

注意:激活某个cfg会使其他正被使用cfg停止工作,一个fabric里同时只能有一个cfg处于工作状态。

 

更改default zone配置:

点选zoning actions菜单,选中set default mode里的no accessall access

10.jpg

 

3. 思科交换机CLI命令行:

思科交换机与博科交换机最大的不同就是vsan,每个vsan都拥有自己独立的zonezoneset

其次还有enhanced zoningbasic zoning的区别。

enhanced zoning会在用户试图更改zone配置时创建一个session,防止其他用户同时更改配置造成配置丢失。开启了enhanced zoning功能的交换机在做完zone配置更改之后需要commit以使配置生效并关闭session

另外需要注意的是enhanced zoning会自动开启广播zone,而MDS9500系列在升级到第四代端口板的时候需要禁用广播zone才能是第四代端口板生效。

显示命令:

     # show fcalias vsan x

     # show zoneset vsan x

     # show active zoneset vsan x

     # show zone status vsan x

启用enhanced zoning

     # configure terminal

     (config)# zone mode enhanced vsan x

更改alias

     (config)# fcalias name A123 vsan x

     (config-fcalias)# member pwwn 10:00:00:00:00:00:00:00

     (config-fcalias)# exit

     (config)# zone commit vsan x

更改zone

     (config)# zone name zone123 vsan x

     (config-zone)# member interface fc1/1

     (config-zone)# member pwwn 20:00:00:00:00:00:00:00

     (config-zone)# member fcalias A123

     (config-zone)# exit

     (config)# zone commit vsan x

更改zoneset

     (config)# zoneset name zoneset123 vsan x

     (config-zoneset)# member zone123

     (config-zoneset)# exit

     (config)# zone commit vsan x

激活zoneset(只在basic zone模式下有效)

     (config)# zoneset activate name zoneset123 vsan 1

禁用广播zone

     (config)# no zone broadcast enable vsan x

 

4. 思科交换机GUI界面(DCNMDCFM基本一致)

点击DCNM界面zone菜单中的edit local full zone database…

11.jpg

编辑zone的界面如下:

13.jpg

编辑fcalias

首先在左下角找到fc-alias,右键点击insert并输入alias名和wwn

14.jpg15.jpg

点击OK后创建alias的窗口并不会立刻关闭,可以更改alias名和wwn,再点击OK来连续创建其他alias

 

编辑zone

点击左下角的zones,右击并选中insert,可以创建zone

16.jpg17.jpg

点击OK后会看到新创的zone显示在列表里,在左下角点开zones前的加号,选中新增的zone来编辑其成员。

18.jpg19.jpg

在右下角的列表里找到相应的wwndevice alias,点击add to zone加入到zone里,或在左下角把fcalias拖进相应的zone里。

20.jpg

编辑zoneset

把之前编辑好的zone从左下角拖进左上角的zoneset即可。

 

确认编辑/激活zoneset

点击右下角的commit changes按钮,会把对该vsan做的更改发布到整个SAN网络里。

21.jpg

选中某个zoneset,点击右下角的activate按钮,会显示之前对这个zoneset做过的更改。

22.jpg

23.jpg

点击close之后显示保存running-configstartup-config的对话框,如果确实要执行该操作,打上选项前的勾并点击continue activation

24.jpg

25.jpg

显示success了就说明激活zoneset并保存配置成功了。

 

 

三.如何做好zone

做一个zone很简单,但是如何做好zone,却要考虑到方方面面的问题。

1.  推荐使用wwn zone(客户有特殊要求或FICON环境除外),原因如下:

1)  port zone只能通过物理隔离来保证zone安全,而wwn zone能限制只有指定设备才能访问zone

2)  NPIVAG环境中,只能使用wwn zone来划分zonecluster上的主机或虚机。

3)  IVR/FCR和磁带加速技术只能使用wwn zone

 

2.  LUN maskingzone同时使用

ZoneLUN masking都可以隔离主机和存储之间的通信,但是这两者作用在不同的层面。Zone在交换机上面生效,LUN masking在存储端口生效,两者无法做相互取代。

 

3.  alias命名应该清晰易懂,确保不会混淆。

 

4.  博科交换机尽量避免使用混合zone模式。博科交换机在6.4.3之前有一个bug,会导致在混合zone里的主机自动登出存储。

 

5.  思科交换机使用enhanced zoning,防止多个用户同时更改zone配置导致配置丢失。

 

6.  关闭default zone,避免未经验证的设备登入网络。

 

 

附录:

相关命令可参考EMC论坛专题:https://community.emc.com/docs/DOC-32182

SAN网络学习资料可参考EMC论坛专题:https://community.emc.com/thread/147284

EMCSAN网络专家认证考试为E20-532,详细内容可参考以下链接:https://education.emc.com/content/_common/docs/exam_descriptions/e20_532_SA_Networked_Storage_SAN_Specialist_exam.pdf

 

Filter Blog

By date:
By tag: