Find Communities by: Category | Product

对于广大的拿到EMC Proven Professional的群众来说,有的时候并不知道自己有哪些福利可以拿到。

 

我最近碰巧得知,EMC Proven Professional的团队每年都会组织大家编写一批很好的介绍技术,或者产品的文章。这些文章基本都是一些知识总结了,非常的实用。大家可以到这个网址去下载,历年的文章都有。

https://edu.corp.emc.com/gs/certification/benefits/ks.aspx

 

这些文章现在都只有英文版,在英文的一个Proven Professional的私密论坛里面应该也有提供。大家可以在这个文档里面看如何申请权限:

https://community.emc.com/docs/DOC-28615

 

这个福利现在仅提供给有EMC Proven Professional证书的同学哦。

                最近马航事件扑朔迷离,好好的一架飞机说没就没了,是驾驶员恶意破坏,还是被人Hijack,亦或是机械故障导致失踪?在没有找到证据之前,一切都只是猜测。但是法航447事件,却可以知道事故的责任是机器故障+人为处理不当。由于皮托管测速仪在高空结霜,飞机除冰失败,造成数据不准,以致于两位副机长各自采取了不正确的方式,最后导致飞机是机头朝上爬升姿势掉入深深的大西洋中。人祸自然是主要因素,但是机械故障也是诱发事故的主要因素。通过空难的思考,在我们的备份系统中,也要未雨绸缪,在机器没有出现重大问题的时候,要预先给机器做个健康检查。

                虽说航空总体来说还是比较安全可靠的,但也会出现故障,更不要说我们平时使用的机器和系统。如今都进入了大数据时代,什么云计算,云数据等,数据都在天上飞,云中翔,那我们的Avamar航班如何带领您遨游云数据的天空?如何在遨游云天空的时候,保护您的飞机(即您的Avamar航班,简称A航)?今天敝人不才,暂且把自己比作A航的乘务人员,教大家如何体验A航的安全之旅。

飞机会遇到各种故障,我们的A航也会遇到故障+人祸的现象。举个简单的例子,如果某天Avamar一下子遇到许多不重复的新数据,Avamar的空间使用率就会邹然上升,而系统管理员发现空间,就自己删除了一些旧数据,而在界面上随意启动Garbage Collection(俗称旧数据回收),虽然会帮助我们系统清除旧数据,但是他却没有意识此时的Avamar操作系统的Checkpoint空间占用率会上升,从而渐渐占满整个操作系统,然后导致Garbage Collection因为操作系统空间不够而失败,也会让整个系统没有可用空间的悲剧。

以上只是一个案例,平时使用中会有各种截然不同的案例。因此在问题出现之前,何不给我们的Avamar系统做个安全检查呢?这样就可以让我们预知A航存在哪些隐患问题,在这些问题诱发别的大问题之前,我们把诱因扼杀在摇篮之中。

总而言之,让Avamar的航班号在给您的重要数据护航保驾时候,做些必要而又简单的飞行安全体检是非常有必要的。否则遇到数据解体,硬盘损坏就后悔莫及。

 

体检项目一:总体故障检查

必用工具:Proactive Check工具

体检报告:hr_results文件

体检实施步骤:

 

准备步骤:提前创建Proactive Check的目录并导入您的Admin账号key

                Putty或者任何可用的SSH工具登录到Avamar系统,建议您使用admin账号登录,密码是您设置的,或者默认密码。如果您习惯用root账号登录(这将被视为一种不安全的登录方式),请切换到admin账号,方法:su - admin

                Admin账号登录完毕之后,这就意味着您进入了A航的机舱,然后要启动密钥机制。

                如下图:

              ScreenHunter_01 Jun. 27 09.57.gif

                不但输出了节点的在线时间,也可以看到一共有几个节点。如本次航班中,有3个节点。然后接下来我们要创建一个文件夹,专门用来存放我们的体检工具。

                如:mkdir Proactive_Check (当然是位于/home/admin目录里)下面我们就可以正式做体检了。

 

步骤一、获取和下载Proactive Check工具

ftp://avamar_ftp:anonymous@ftp.avamar.com/software/scripts/proactive_check.pl

可以通过以上链接得到最新的Proactive Check工具。

 

Option A

                如果您的A航可以连通到Internet网络的话,就直接在您的班机中下载上面链接。

                命令:

                cd /home/admin/Proactive_Check (该目录之前已经创建)

curl -o ftp://avamar_ftp:anonymous@ftp.avamar.com/software/scripts/proactive_check.pl

 

Option B

                用您自己的桌面机去下载工具,然后用winscp之类的工具上传到Avamar/home/admin/Proactive_Check

 

步骤二、设置正确的权限

因为A航的系统默认是不允许运行perl脚本,所以我们要更改其权限,如下:

admin@gen4-util:~/Proactive_Check/>: chmod u+x proactive_check.pl

然后我们就可以运行这个脚本了:

admin@gen4-util:~/Proactive_Check/>: perl proactive_check.pl

一般如果您得到的输出结果都是Passed,表示各项指标都正常了。如果有Failed的话,那么需要关注。

 

                我们来举个样本例子:以下是本次A航的样本结果。

[样本]

admin@gen3-single:~/jason/>: perl check.pl

 

proactive_check.pl 3.092 (Fri Apr  4 12:13:45 2014)

 

Latest script version           DISABLED

Avamar Hostname                 gen3-single.sh.lab.emc.com

Avamar Server Version           6.1.0-402

GSAN Version                    6.1.0-402

MCS Version                     6.1.0-402 (8ad82f96dce58b8b9be30e098af974c4)

System ID                       1328224578@00:24:E8:56:32:5A

Hardware Manufacturer           dell

Operating System                redhat

Node Type                       Single Node 1.0TB Gen3

Datadomain                      SH-DD690.dd.com  Vers:5.1.0.9-282511

Data Domain Patches            *FAILED*

Registered Media Access Nodes   DETECTED

Replication Partner             Target for 10.76.179.27

Replication Partner             Target for single.avamar.lab

Version Supported               PASSED

MC flush in past 24 hours       PASSED

EM flush in past 24 hours       PASSED

HFSCheck in past 36 hours       PASSED

Checkpoint Status               PASSED

Ethernet Settings               PASSED

GSAN status                    *FAILED*

MCS status                      PASSED

EMS status                      PASSED

Backup Scheduler running       *FAILED*

Desktop/Laptop running          PASSED

Maintenance scheduler running   PASSED

Cron jobs enabled              *FAILED*

Unattended startup             *FAILED*

  1. Status.dpn                     *FAILED*

Duplicate IP                    PASSED

License                         PASSED

Mandatory Client Upgrades      *FAILED*

ATO Check                      *FAILED*

Data Domain Version             PASSED

/etc/profile                    PASSED

IPMI Check                      PASSED

Bonding Configuration           WARNING

Data Domain gcoob.pl           *FAILED*

ascd status                     PASSED

Cron Running                    PASSED

Checkpoint Retention            PASSED

Config Settings                 WARNING

HFSCheck overtime allowed       PASSED

Swap space                      PASSED

File Permissions                PASSED

  1. Checkpoint.xml Perms            PASSED

Bug 13252 O/S reserved space    PASSED

HFSCheck run time               PASSED

Replication Cron Setup          PASSED

Operating System Updates        PASSED

perftriallimit setting          PASSED

Mandatory Upgrades              PASSED

GSAN Patches                   *FAILED*

MCS Patches                    *FAILED*

Dell Open Manage Tools          PASSED

Dell Virtual Media Disabled     PASSED

Dell log rotate                 PASSED

Hitachi Disk NCQ                PASSED

Disk Controller Driver Version  INFO

Disk Controller Status          PASSED

Disk Cache Disabled             PASSED

Disk Firmware                   PASSED

Dell Patrol Read Disabled       PASSED

Dell Block Update              *FAILED*

Dell Hardware Status            PASSED

 

See detailed ERROR information in hc_results.txt

 

FINISHED

 

[分析]

喔!这个航班的机器故障隐患真是多啊!

下面是对各项输出的解释:

名称

分析

重要性

Avamar Hostname

本次航班的机器名

☆☆☆☆☆

Avamar Server Version

Avmar Server的型号

★☆☆☆☆

GSAN Version

GSAN的版本号,GSAN是用来做备份的进程。

★☆☆☆☆

MCS Version

MCS的版本,可以理解为您的Avamar的控制台版本。

★☆☆☆☆

System ID

系统的ID号

★★☆☆☆

Hardware Manufacturer

制造提供商

☆☆☆☆☆

Operating System

操作系统类型

★☆☆☆☆

Node Type

节点类型,一般分为多节点和单节点。

★☆☆☆☆

Datadomain

如果含有DataDomain的话,显示DataDomain的信息

★☆☆☆☆

Data Domain Patches

DataDomain的Patch缺少。

★★☆☆☆

Registered Media Access Nodes

Media Access节点

★☆☆☆☆

Replication Partner

如果配置了复制,复制的信息

★★☆☆☆

MC flush in past 24 hours

MC的数据库是否在24小时内备份否

★★★☆☆

EM flush in past 24 hours 

EM的数据库是否在24小时内备份

★★★☆☆

HFSCheck in past 36 hours

HFScheck的数据库是否在24小时内备份

★★★☆☆

Checkpoint Status

CP是否制作

★★★★☆

Ethernet Settings

网络设置是否正确

★★★☆☆

GSAN status

GSAN的程序是否正确,如果是Failed,是个危险的警告

★★★★★

MCS status

MCS的状态

★★★★☆

EMS status

EMS的状态

★★★★☆

Backup Scheduler running

Backup的服务是否启动

★★★★☆

Desktop/Laptop running  

DTLT的服务

★★★☆☆

Maintenance scheduler running

Maintenance的服务是否启动

★★★★☆

Cron jobs enabled

Crontab的计划任务是否启动

★★★☆☆

Unattended startup 

单节点会用到的gsan开机启动服务

★☆☆☆☆

  1. Status.dpn

总体状态

★★★★☆

Duplicate IP

是否IP冲突

★★★☆☆

License

序列号是否正确

★★★★★

Mandatory Client Upgrades 

客户端是否升级

★★★☆☆

ATO Check

如果有磁带库的话,状态是否正确

★★★☆☆

Data Domain Version

DD的版本

★☆☆☆☆

/etc/profile

环境变量是否正确

★★☆☆☆

Bonding Configuration

端口绑定是否正确

★★☆☆☆

Data Domain gcoob.pl

GCOOB,运用于DD的数据清理

★★☆☆☆

ascd status   

ASCD状态,用于节点通信

★★★★☆

Cron Running

Cron的服务

★★★☆☆

Checkpoint Retention

CP的数量是否正确

★★★★☆

Config Settings 

Avamar设置是否正确

★★★☆☆

HFSCheck overtime allowed

HFScheck是否允许超时

★★☆☆☆

Swap space 

内存SWAP是否正常

★★☆☆☆

File Permissions

文件系统权限是否正确

★★☆☆☆

  1. Checkpoint.xml Perms 

CP配置文件的权限

★★☆☆☆

HFSCheck run time 

HFScheck的运行状态

★★★☆☆

Replication Cron Setup

Replication是否配置正确

★★★☆☆

Operating System Updates

OS是否需要升级

★★☆☆☆

Mandatory Upgrades

avamar是否需要升级

★★☆☆☆

GSAN Patches

GSAN是否需要安装补丁

★★☆☆☆

MCS Patches

MCS是否需要补丁

★★☆☆☆

Dell Open Manage Tools

Dell管理工具是否安装

★☆☆☆☆

Dell Virtual Media Disabled

Dell的VM是否使用

★☆☆☆☆

Dell log rotate

Dell的日志是否满

★☆☆☆☆

Hitachi Disk NCQ 

磁盘是否正确

★★☆☆☆

Disk Controller Driver Version

存储Controller的版本

★☆☆☆☆

Disk Controller Status 

存储Controller的状态

★★★☆☆

Disk Cache Disabled

Cache状态

★★☆☆☆

Disk Firmware

磁盘固件版本是需要升级

★★☆☆☆

Dell Block Update  

Dell Block Update是否需要升级

★★☆☆☆

Dell Hardware Status 

硬件是否有问题,如磁盘,电源等。

★★★★☆

 

GSANstatus.dpn是航班的引擎,负责最主要的任务,因此算是Avamar的核心。

像本例中的GSAN状态不正确,说明GSAN的程序有问题,是一个比较严重的问题,我们在体检项目四中会分析。同时Backup Scheduler running  这个failed,表示备份的服务可能遇到问题,也是不容忽视的问题。因此三个以上的问题,需要联系航班的维修工程师(Avamar的技术工程师)来维修。

 

体检项目二:系统容量检查

这个项目主要是检查操作系统的空间是否安全,我们可以用一个简单的命令来检查:

admin@gen4-util:~/>: avmaint nodelist|grep fs-per

        fs-percent-full="18.6"

        fs-percent-full="17.6"

        fs-percent-full="17.5"

        fs-percent-full="17.8"

        fs-percent-full="17.8"

        fs-percent-full="17.4"

        fs-percent-full="18.3"

        fs-percent-full="17.5"

        fs-percent-full="17.5"

上面列出了各个分区的占用比例,单位自然为百分比,如果只要有任何一项超过85%,那么就是一个危险的警告。因为如果有一个分区超过85%,那么平时日常的预定的Garbage Collection就会报失败,而失败的理由就是Disk Full。这个时候就要检查A航的CheckpointHfscheck是否每天正常工作,当然这是检查的一个主要方面,也有可能其他因素导致OS的占用率过高。敝人之前遇到过某个分区中含有一些测试的日志文件或者别的什么大量文件,然后需要删除这些数据,并重新制作Checkpoint和运行HFScheck

 

 

体检项目三:检查日常的CheckpoingHFScheck

如果遇到体检项目二中的故障,那么就要检查这个体检项目。我们通常使用如下的两个命令:

admin@gen4-util:~/>: cplist –lscp

  1. cp.20140403040034 Thu Apr  3 12:00:34 2014   valid hfs ---  nodes   3/3 stripes  12581
  2. cp.20140403052139 Thu Apr  3 13:21:39 2014   valid --- ---  nodes   3/3 stripes  12581

默认正常的情况,每天应该有两个CheckpointCP)和一个经过验证的CheckpointCheckpoint的作用主要是用来“复制”(其实和真实的复制是有差别的,为了便于您的理解,我们暂用复制来理解)一份正确的先前数据,当数据出现错误的时候,就可以用之前的Checkpoint来回滚和还原。

下表分析了上面输出的结果。

名称

作用

  1. cp.20140403040034

Checkpoint的名字,一般以制作CP的时间命名

Thu Apr  3 12:00:34 2014

生成CP的时间

valid

Valid说明CP是制作成功。Invalid说明CP是无法获取或者有问题,通常情况下如果您的DataDomain上的CP有问题,那么这里会显示Invalid

hfs/rol/-

HFS/rol:说明这个CP是经过HFSCHECK校验。-表示这个CP没有经过HFSCHECK验证。

nodes   3/3

表示总共对三个节点做CP。如果有一个节点down掉,那么数字会显示2/3。

stripes  12581

表示总共有的stripe的数量。

如果每天的CP不正确,需要联系航班的维修工程师,即Avamar的技术工程师来维修。

 

体检项目四:检查Avamar的服务状态

必用命令:status.dpn

admin@gen3-single:~/jason/>: status.dpn

Fri Apr  4 13:13:29 CST 2014  [gen3-single] Fri Apr  4 05:13:29 2014 UTC (Initialized Thu Feb  2 23:16:18 2012 UTC)

Node   IP Address     Version   State   Runlevel  Srvr+Root+User Dis Suspend Load UsedMB Errlen  %Full   Percent Full and Stripe Status by Disk

  1. 0.0    10.32.167.88  6.1.0-402  ONLINE fullaccess mhpu+0hpu+0000   2 false   4.03 5798 18653680  61.8%  65%(onl:755) 60%(onl:764) 60%(onl:762) 60%(onl:770)

Srvr+Root+User Modes = migrate + hfswriteable + persistwriteable + useraccntwriteable

 

All reported states=(ONLINE), runlevels=(fullaccess), modes=(mhpu+0hpu+0000)

System-Status: ok

Access-Status: admin

 

Last checkpoint: cp.20140404051128 finished Fri Apr  4 13:11:58 2014 after 00m 30s (OK)

Last GC: finished Fri Apr  4 08:18:31 2014 after 03m 24s >> recovered 230.93 MB (OK)

Last hfscheck: finished Fri Apr  4 13:10:51 2014 after 06m 47s >> checked 642 of 642 stripes (OK)

 

Maintenance windows scheduler capacity profile is active.

  The maintenance window is currently running.

  Next backup window start time: Fri Apr  4 21:00:00 2014 CST

  Next blackout window start time: Sat Apr  5 08:00:00 2014 CST

Next maintenance window start time: Sat Apr  5 13:00:00 2014 CST

                从上面可以看到Access-Status的状态为admin状态,如果是在做CP或者启动HFScheck的时候会这样,那就是正常的,如果在backup的时候,显示这个状态,说明可能备份空间不足或者节点有问题。正常的状态应该是FULL

                而且我们可以看到下次备份和做维护的时间。关于更多的这个命令的分析和解释,我们会在以后的文章中给大家做解释。

 

体检项目五:检查所有的服务

必用命令:dpnctl status

输出结果:

admin@gen3-single:~/jason/>: dpnctl status

dpnctl: INFO: gsan status: degraded

dpnctl: INFO: MCS status: up.

dpnctl: INFO: EMS status: up.

dpnctl: INFO: Backup scheduler status: down.

dpnctl: INFO: dtlt status: up.

dpnctl: INFO: axionfs status: up.

dpnctl: INFO: Maintenance windows scheduler status: enabled.

dpnctl: INFO: Unattended startup status: disabled.

分析:

列出了所有的服务:GSAN状态,MCS服务,EMS服务,备份服务,dtlt的服务,和maint服务等。一般正常状态是UP,表示服务正常启动,down/disabled/suspended表示服务没启动或者挂起,甚至服务损坏。

 

检查妙招:

                上面介绍了我们常用对飞机体检的项目,现在我来教大家一招看破系统状态。

                第一步、运用“体检项目四”,查看Avamar的总体状态,查看最高的百分比是否达到65%,如果达到65%,那么GUI上会报100%,说明备份空间满。关于status.dpn的详细介绍,我们会在以后的文章中着重描述。我们需要确保Access-Statusfull和百分比没有查过65%

                第二步、确认“体检项目五”中的所有服务是否UP

                第三步、确认“体检项目二”中的百分比是否超过85%,应该要低于85%

                第四步、确认“体检项目三”中,确认每天是否有两个CP和一个校验的CP

                第五步、在以上都确认正常的情况下,可以运行“体检项目一”中的工具,做个整体检查。

 

           以上是快速简单排查航班是否有故障的简洁方法,如果上述检查有问题的话,需要联系Avamar航班的维修工程师,我们将竭诚为您提供最优质的服务。感谢各位阅读这次敝人给您做的A航的安全科普知识介绍。我们准备启航了:

                “女士们,先生们,欢迎你乘坐EMC Avamar航空公司航班888号,本次航班将前往数据安全备份港……

一. VPlex系统的系统组成

一套VPlex 完整的配置共包括以下几种硬件构成,(但并不是每种VPlex模型都包含全部设备类型),具体的系统组件如下:

  1. 引擎 Engine – VPlex的核心,提供数据的I/O及路径的冗余,每个引擎均有director-A director-B组成);
  2. 管理服务器 MS – Management Server,管理/维护/日志收取);
  3. Fibre Channel COM 交换机(只作为内部director间通讯,不做前后端I/O相关连接);
  4. UPS (为VPlex 内部FC 交换机及管理服务器进行供电);
  5. SPS (为VPlex directors进行供电);

VPlex根据客户选择引擎的数量有三种默认出厂配置可供选择,以满足不同客户对的性能和拓扑的需求(单引擎/

双引擎/4引擎),如(图一)所示:

1.jpg

1.  VPlex共有单引擎/双引擎/4引擎三种默认配置可供选择

 

二. 引擎 Engine

Vplex 第二代引擎我们这里简称为 VPLEX VS2 引擎。每个Vplex VS2 引擎由两个directorA B)组成,每一个director均提供了前端和后端的I/O连接。这里就是Vplex的一个最简单的模型,既Vplex Local 单引擎模型,更复杂的多引擎环境及MetroGeo的高级架构都是基于该模型做出的硬件扩展。

在满足网络拓扑冗余符合最佳实施方案的大前提下,通常这样一个单引擎模型已经可以为客户的一个简单本地环境提供高效的前端及后端的冗余架构了,如:部分前端主机/交换机/Vplex director,又或者是部分后端存储发生或者同时发生故障的情况下,均可提供无缝I/O的切换,以确保客户生产系统不会有I/O中断(DU- data unreachable)又或数据丢失(DL – data lost)的情况发生。

2.jpg

2.  VPlex前后端布局图


(图3)提供的是Vplex VS2引擎的后部物理结构。通过与(图2)中物理实际照片的对比,我们可以看到VS2 引擎的director A在我们的右手边,而director B在左手边。

3.jpg


3. VPlex 后端模块顺序图


对于每个单一director自左到右的模块分别为:

  1. 管理模块;
  2. 前端模块;
  3. 后端模块;
  4. 广域网(WAN)模块;
  5. 本地(Local)模块;

  6. 保留模块插槽;

每个VS2 director包含的物理结构是固定的,每个I/O 模块的位置都是设计好的,并且具有特定的功能。通过(图3)我们可以看到有三种类型的模块可以供不同架构的VPlex选择

  1. 1. 8Gb/s Fibre Channel (4 8Gb/s 的端口,可以用于前端,后端及广域网WAN的连接);
  2. 2. 10 Gb/s Ethernet (Geo);
  3. 3. Filler Module  (Vplex Local Only).

Vplex VS2引擎每个模块上的SFP也是特定的厂家生产的,不能通过交换机或者其他部件上的SFP自行更换。

相对与上一代Vplex 引擎的一些差异如下:

  1. 首先就是新一代的Vplex VS22U)引擎对于第一代的引擎(VS1 - 4U)来说体积上更小;
  2. 新一代VS2引擎SLIC 插槽简化了架构 ,现在只有5个插槽了;
  3. CPUPCI-E的总线架构更快了(Westmere 2.4 GHZ – 4 Core and PCI-E V2;

关于序列号的查找:

通常,从设备的背面位置看过去,VPlex设备的序列号-TLA Top Level Assembly #)位于盖体的右下角位置如(图4 所示:

4.jpg

4. VPlex 序列号位置

 

关于director的命名规则如下:

Director-1-1-A

第一个1 表示的是Cluster-1 site A)中的一个Director

第二个1表示的是Engine-1 site A Engine)中的一个director

合起来表示的是Cluster-1 中引擎1director A

例子: director-2-4-B

表示的是Cluster-2 Site B)中引擎4 engine-4)的director B 通过对(图1)中4引擎的机架位置我们可以知道,该引擎位于 机架最上端左边的一个引擎。

 

  关于SFP 位置的命名规则如下,如(图5)所示:

5.jpg

5. SFP 的顺序及命名规则

 

三. 管理服务器 MS – Management Server

管理服务器是管理和认识VPlex的一个接口,通常我们都是是通过管理服务器来实现(CLI界面或者是网页的GUI界面)管理配置及日志收取的。管理服务器与director之间的IP网段也是私有的,并与客户的IP网段相互隔离互不影响,如(图6)所示。

VPlex 管理服务器只是作为一个管理维护的窗口,在MetroGeo的环境中两个Site各配置了一个管理服务器(MS),两个管理服务器均可以通过管理服务器之间建立的VPN对另外一个Site进行管理。管理服务器故障不会影响主机到存储之间 I/O的相关操作。


管理服务器也可以配置EMCESRS网关及激活Call Home的服务。

6.jpg

6. 管理服务器连接示意图


下图(图7)显示了一个高阶架构中管理服务器和director之间的连接方式。通过演示我们可以看到,VPlex 管理服务器和director之间的连接时是不用通过IP交换机的。Director是通过菊花链的方式通过两个冗余的以太口与其他两个director相互连接。管理服务器也连接到了两组Director A B组) 来实现冗余。

管理服务器也是VPlex架构中唯一配置了“Public IP”(客户提供的数据中心管理网段地址)的设备。通过这个地址, 客户就能够通过 SSH PUTTY接入)命令行(CLI)或者 HTTPs的网页(GUI)形式来配置或者维护VPlex设备了。

VPlex日志的收取目前只能通过SSH的方式来进行,并且通常只要在一边收取日志即可。在极个别特殊情况下, Metro Geo环境中 VPN/FC-WAN/IP-WAN都中断后,需要在两边的管理服务器上收取VPlex日志。

7.jpg

7.管理服务器拓扑结构图


四. Fibre Channel COM 交换机

VPlex双引擎及4引擎的配置中使用了光纤交换机。 其中双引擎系统每个交换机使用了4个端口。4引擎系统每个交换机使用了8个端口。 Local-com 网络是完全独立于生产系统的光纤交换机的。并且不允许其他的设备使用VPlex内部交换机。VPlex

的内部交换机通过UPS 来供电。

8.jpg

8. Inter FC Switch


五. 关于SPSUPS设备

SPS负责给VPlex引擎的director供电,UPS则为Inter-FC交换机及管理服务器提供电源。

 

 

希望通过对以上VPlex基础架构的简要介绍能够帮助大家对VPlex有个直观的了解,并能够在工程师间进行进行快速高效的沟通。如果对VPlex硬件架构需要进一步了解的朋友可以参考以下技术文档:

  1. VPlex Product Guide》;
  2. VPlex Architecture Details》;
  3. VPlex Configuration Guide – Part B. Reference》;

  4. SolVe Desktop – VPlex Replacement

磁盘阵列在安装之后,通常都会有配置方面的变更,例如空间的调整,主机的增删,连接的变动等等,对于EMC的Symmetrix盘阵来说,除了原厂工程师来做这些动作以外,也可以通过一些工具软件来实现,例如SMC,Unisphere for VMAX,ECC/prosphere等。此外,还可以通过Solutions Enabler的命令symconfigure以命令行的方式实现,下面就介绍一下symconfigure这个命令如何做配置变更。

 

Symconfigure这个命令就是用于对Symmetrix盘阵(如DMX,VMAX)进行控制的,例如盘阵的属性、LUN设备、Tier、板卡、端口等等,随着Virtual Provisioning的应用越来越多,symconfigure的使用也越来越多。

 

Symconfigure的使用方法常见的是以下两种:

1. 将配置变更语句用分号隔开,保存在一个文件中,执行symconfigure命令时指定该文件,如:

     Symconfigure commit –sid 3160 –file unmap_dev.cmd

     其中unmap_dev.cmd这个文件中的内容为:

     unmap dev 020:024 from dir ALL:ALL;

2. 当配置变更语句不多的时候,可以直接将其写在一条命令中,如:

     symconfigure -sid 256 -cmd "create dev count=3, size = 3200 cyl, emulation=FBA, config=2-Way-Mir;create dev count=1, size = 3200 cyl, emulation=FBA, config=unprotected;" -v -nop preview

 

在上面的两个例子中除了变更语句和盘阵相关语句可以看到两个关键字:commit和preview,这是symconfigure的会话控制参数。Symconfigure发送给盘阵的配置改变命令以会话的形式来处理,一个会话可以包含多个改变,这多个改变合在一起是一个完整的操作。

 

常用的会话控制参数有:

1. preview:检查每一个改变的语法和正确性,不执行动作;

2. prepare:除了preview包含的检查外,针对盘阵的当前状态检查改变语句的有效性,不执行改变动作;

3. commit:进行语法和有效性的检查,然后尝试执行设定的改变;

4. query:当commit一组改变动作后,执行时间可能为若干分钟,可以用query命令来查询执行的状态,例如:

     symconfigure –sid 345 query –i 10 –c 12 (每10秒检查一次状态,检查2分钟)

     注:也可以用query参数查询当前是否有正在运行的会话。

5. abort:用来中止配置改变会话,例如:

     symconfigure –sid 12345 abort

注:在配置改变过程中,有一个叫做point of no return的标记,如果执行到某一步达到了这个标记,那么abort动作就会失败。

 

关于symconfigure能实现的配置变更内容,篇幅有限,这里列举几个对5876版本的VMAX能实现的内容:

LUN的创建和删除以及RDF等属性的改变,前端口的类型和属性改变,VP配置下跟Pool相关的很多操作,LUN到端口的映射改变,meta的创建和成员变动,盘阵级的参数变动,甚至还可以进行换盘操作。

 

至于其他功能,以及symconfigure最新最全的内容请参考官方网站的文档EMC Solutions Enabler Symmetrix Array Controls CLI Product Guide

在日常Tdev设备的管理中,存储管理员常常会遇到存储空间回收的问题,如何有效且完美的做到Tdev设备的回收呢?下面的葵花宝典将为你一一解读:

 

 

1.根据需要修改AutoProvisioning Group中的内容。

1)如果删除个别LUN,可以直接从Storage Group中删除

symaccess -sid 57 remove -name vmware_cluster1 -type storage devs 425:429

2)如果删除一个Cluster中所有主机访问的所有LUN,可以直接删除相应View、Storage Group、Initiator Group、Port Group

symaccess -sid 57 delete view -name UCS1_1_view –nop

symaccess -sid 57 -name UCS1_1_ig -type init delete -nop –force

symaccess -sid 57 -name UCS1_1_pg -type port delete -nop –force

symaccess -sid 57 -name vmware_cluster1 -type storage delete -nop –force

3)如果删除一个主机访问的所有LUN,可以直接删除相应View、Initiator Group、Port Group

symaccess -sid 57 delete view -name UCS1_1_view –nop

symaccess -sid 57 -name UCS1_1_ig -type init delete -nop –force

symaccess -sid 57 -name UCS1_1_pg -type port delete -nop –force

 

 

2.Unbind从Pool

symconfigure -sid 57 -cmd "unbind tdev 425:429 from pool FCPool;"   preview -nop

symconfigure -sid 57 -cmd "unbind tdev 425:429 from pool FCPool;"   commit -nop

 

 

3.删除Meta

symconfigure -sid 57 -cmd "dissolve meta dev 425:429;" preview –nop

symconfigure -sid 57 -cmd "dissolve meta dev 425:429;" commit –nop

 

 

4.删除Thin Device

symconfigure -sid 57 -cmd "delete dev 425:42c;" preview -nop

symconfigure -sid 57 -cmd "delete dev 425:42c;" commit -nop

Filter Blog

By date:
By tag: