Find Communities by: Category | Product

1 2 Previous Next

工程师手记

18 Posts authored by: EMC统一存储远程支持部

什么是Uncorrectable Error?

 

当阵列在读取某块磁盘时发现某扇区/数据块发生问题(通常是media error即盘片介质原因)导致无法读取时,系统会试图从RAID Group的其它磁盘对应位置上进行数据重建(RAID1、RAID1/0会通过镜像盘读取数据,RAID3/RAID5会利用奇偶校验 )。当尝试重建数据失败的时候,就会发生Uncorrectable Error。

 

如下图,举例为4+1的RAID-5 RG(RaidGroup)。当DATA 5无法读取时,会通过同一个条带上的DATA 6~8和XOR2进行数据重建;如果此时其他数据中DATA 6~8或者校验位XOR2无法读取,就无法通过RAID保护进行数据重建。所以Uncorrectable Error只有在阵列读操作的时候发生,并且会报在同一个RG上的两块磁盘上。

 

Uncorrectable.jpg

 

从以上我们可以了解到,当Uncorrectable Error发生时已经是在条带层面上DL(Data Loss)的状态了。

如果此时主机需要读取该部分数据,就会提示文件损坏或数据不完整无法读取。

 

相关功能:

 

FAST VP

FAST VP即Auto Tiering可能会把坏数据迁移到其它磁盘上扩大受影响的范围,所以当我们遇到Uncorrectable Error的时候都需要把此功能暂时停掉。

 

FAST Cache

FAST Cache缓存中发生Uncorrectable Error时,需要把FAST Cache停用并把所有缓存刷到磁盘上,然后在所有启用过FAST Cache的LUN上执行BV去检查Uncorrectable Error。

 

BV(Background Verify)

BV会尝试去读取和修复数据坏块,BV结束以后会得到一个报表列出所有无法修复/已修复Uncorrectable Error。

注明一点,如果报Uncorrectable Error的同时,还有Cohearency Error的话,绝对不允许执行BV,这样会导致更糟糕的结果。如果发现此类问题,请及时联系技术支持,我会在下一讲介绍Coherency Error。

 

作者简介

Nate Ju

EMC资深技术支持工程师。

精通VNX/MCx架构,熟练问题排查及提供解决方案。

随着计算机和网络的不断发展,网络环境危机四伏,人们开始逐渐意识到备份的重要性。所以今天我们就来简单讨论一下与NAS相关的NDMP备份吧。

 

首先让我们从回答两个问题开始今天的讨论。到底什么是NDMP? 以及为什么要用NDMP协议做备份呢?

NDMP是一个控制备份和恢复操作的协议。在备份和恢复时,NDMP协议会控制带库的机械手来进行一些SCSI的操作。

对于本地带库的备份,NDMP是不走网络的;而对于三向备份,数据流网络和控制信息网络也是分开的,这样在传输数据就防止了网络拥塞。

 

NDMP备份可以分为两类,2-way(直连备份也叫本地备份)和 3-way(三向备份)的备份。

 

2-way

备份数据从存储系统流向我们的DM 然后从DM直接备份到备份设备带库中,而不会通过网络,整个过程中只有备份软件的控制数据是会通过网络传输的。

1.png

3-way

备份数据从存储系统流向我们的DM,再从DM连接并传输到远程的NDMP磁带服务器,最后磁带服务器会连接到指定的带库设备。(NDMP磁带服务器可以是一个DM或者是其他的文件服务器)

在三向备份配置中,备份数据和控制数据都通过网络传数据,此链接可以采用专用网络,这样避免网络拥塞等问题。

2.png


在我们了解了两种NDMP备份的模型之后,下面我们介绍一下备份的基本过程。在描述基本过程之前呢,我觉得有一些术语得先说说:

Data Service:

  • 在数据备份过程中,从硬盘上读取数据,并拷贝一份传输到NDMP的磁带服务器上。
  • 在数据恢复过程中,从NDMP磁带服务器上读取数据,并把数据写到磁盘上。

Tape Service

  • 在数据备份过程中,从NDMP数据服务器上接收数据并写到磁带上。
  • 在数据恢复过程中,从磁带上读取数据并返回给Data Service

Mover

  • 一个用来做备份或者恢复操作的Tape Service

SCSI Service

  • 用来执行低级别的SCSI命令。
  • SCSI service一般会连着带库的机器手。

知道了以上术语,我们来看看数据备份的基本流程:1. 首先DMA会与SCSI、带库以及Data Service建立连接。2. 然后在DM上会见一个NDMP的专用用户,这样我们就可以在DMA上用这个用户去和我们DM进行通信。3. 验证成功后,DMA会打开带库,并设置Mover的记录长度和窗口大小。4. MOVER_LISTENDATA_CONNECT5. DATA_START_BACKUP开始备份数据。 有人看到这里不禁会想,这些都是理论的东西,完全没有代入感。下面我截取了一组NDMP数据备份的日志信息,接下来我们通过这个日志来了解一下NDMP的具体步骤:

  • 首先DMA会去建立TCP/IP连接,会连接到NDMP服务器的10000号端口。
  • 然后DMA会验证NDMP专用账户,如果通过,我们就会看到日志中显示的如下NDMP配置信息。(包括备份类型,备份文件系统名字等等)

3.png

  • 接下来,NDMP开始自动创建快照记录文件系统当前状态,当快照创建好之后,日志中会返回CreateCallback信息。

4.png

  • 以上操作都完成之后,NDMP就开始进行数据的传输了。
  • 当所有数据传输完成,NDMP会在日志中出现一个summary,我们可以从summary中看到此次备份用时多少,平均写速度多少等。

5.png

  • 最后,NDMP会自动删掉之前创建的快照,并返回SnapsureDeleteCallback:来表示快照删除成功。

6.png


数据备份的目的是为了在原生产系统被破坏时能及时的把数据恢复出来,所以,最后我们来了解一下数据恢复的过程:

     1. 数据恢复过程前三步和数据备份过程相同,先是建立必要的连接,然后在DMA上用NDMP专用账户进行验证,待验证成功后DMA会打开带库,并对Mover进行设置。

     2. MOVER_LISTENDATA_CONNECT

     3. DATA_START_RECOVER开始恢复数据。

     4. 在三向备份过程中,还会进行NOTIFY_DATA_READ MOVER_READ

 

NDMP的具体实现过程还是比较复杂的,本文只是简单介绍了工作过程,如果有兴趣了解更多关于NDMP在工作原理及NAS配置过程,可以参考一下文档。

  https://support.emc.com/docu41473_Configuring-NDMP-Backups-on-VNX.pdf?language=en_US

       VNXe3200EMC统一存储部门2014年新推出的一款功能强大、经济实用、面向中小企业的一款存储产品。 这款产品自从上市以来,一直受到用户的好评,产品销量一直上升。 作为EMC该产品一线的技术支持工程师,我很荣幸能够有机会在这里和大家一起探讨使用VNXe3200过程中遇到的一些常见的问题。 今天,我会从最开始的第一步开始介绍, 如何上手,如何配置一款新的VNXe3200设备。 也许很多用户会第一时间想到VNXe3200 Connection Utility 对的,但是在初始化配置的过程中,会不会遇到一些难缠的问题呢? 有没有一些更巧妙的小招呢? 答案是肯定的。 这篇博客就是在这样的需求下,结合本人第一线产品技术支持的经验,向大家介绍如何快速上手初始化配置一台新的VNXe3200存储。

 

1. 使用VNXe 3200 Connection Utiliy


1.1 Connection Utility 介绍

       VNXe Connection Utility是一款简单的,能够帮助客户在初始化时为VNXe设备配置主机名称和管理IP的工具。


1.2 Connection Utility下载和安装

       如果您想为 VNXe 系统管理端口手动分配静态 IP 地址,则必须安装并运行 VNXe Connection Utility VNXe Connection Utility 可为 VNXe 系统分配网络地址。

        如下图1-1,我们可以从support.emc.com 下载VNXe Connection Utility安装程序。

1-1.jpg 1-1 下载VNXe Connection Utility

       说明: 虽然在软件上标注了Windows 32-bit,但是该VNXe Connection Utility支持各种常见的Windows版本。 不过需要特别注意的是该软件只兼容 JAVA 7及其之前的版本。


1.3 Connection Utility 使用

        当在Windows工作机上成功安装好Connection Utility软件。 在选择好软件语言,并进入主界面后,我们会发现Connection Utility有两种方式去配置系统(如下图1-2): 自动发现并配置设备IP和手动通过U盘来配置设备IP 第二方法在我们由于特殊原因不能自动扫描发现设备的情况下特别有用。

1-2.jpg1-2  VNXe Connection Utility 主界面


1.3.1 自动发现

  “自动发现”是我们最常选择的方式。 选择“自动发现”,配置十分方便,Connection Utility会自动扫描出未配置的设备(如图1-3)。 通常,我们会建议客户把Windows工作机上防网墙、杀毒软件全部关掉,否则设备可能会不能正常被扫描出。

1-3.jpg1-3  VNXe Connection Utility 自动扫描设备

   当设备被发现后,我们就可以点击“下一步”,设置主机名称和配置管理IP。 可以选择配置IPv4或者IPv6,如图1-4。 在配置IP之前,我们必须把Windows 工作机上的本地IP设置成和将要设置的管理IP在同一网段。

1-4.jpg 1-4  VNXe Connection Utility 配置主机名和管理IP

   当主机名称和管理IP配置好后,继续点击“下一步”,等待大约10分钟左右,管理IP配置就会成功。 可以在主机上通过ping管理IP来测试。


1.3.2 手动配置

   正常情况下,通过上一节介绍的“自动发现”,我们已经就可以完成主机名称和管理IP配置。 但是,很多时候会由于主机硬件,安全配置,以及网络故障等原因,我们会碰到自动发现不了设备的情况。 这时,我们下面将要介绍的“手动配置”就会起到作用。

1-5.jpg1-5  VNXe Connection Utility手动配置

   “手动配置”和“自动发现”的方式不同,我们不需要扫描出设备,而直接跳到配置主机名称和管理IP的界面(如图1-4)。 设置好相应的信息后,点击“下一步”, 就会到达确认配置信息和保存配置到U盘的步骤(如图1-7)。

1-6.jpg1-6  确认配置信息

1-7.jpg

1-7  保存配置信息到U盘

   接下来,如图1-8,把U盘插到主存储控制器上。 大约过十分钟,尝试访问https://<ip_address> (ip_address就是上一步设的管理IP地址)。

1-8.jpg 1-8  接入U盘


2. 使用VNXe3200 IPMI tool


   通常情况下,使用VNXe Connection Utility 已经足够完成VNXe 3200的初始化IP配置。 但是也会遇到一些特殊情况, 如设备在出厂测试后没有完全恢复初始设置,控制器处于服务模式,或者用户已经配置了管理IP但是始终不能ping通等等。 这些情况下, VNXe Connection Utility 就爱莫能助了,我们就需要选择更强大的 IPMI tool (类似于之前VNXe 第一代的串口连接)。

   本文下面的内容会介绍如何在Windows电脑上使用 IPMI tool 去访问 VNXe3200控制台。 和之前的VNX, 以及VNXe一代产品有所不同的是, VNXe3200使用以太网(Service LAN port)代替以往的串口。


2.1 IPMI tool 介绍

   IPMItool 是一种使用BMC芯片通过以太网连接类似于SSH登录的网络工具。 它支持各种常见的Windows版本。


2.2 IPMI下载和安装

   IPMItool 可以从support.emc.com 上下载到,在产品“VNXe3200”下搜索“IPMI”,如图2-1。

2-1.jpg2-1   下载IPMI tool

    双击安装包,安装软件,建议把软件安装到C:\ipmitool下,如图2-2。

2-2.jpg2-2   下载IPMI tool

   安装好软件后,请到安装路径下,确认下面四个文件被成功安装。

    • Cugcrypto-1.0.0.dll
    • Cyggcc_s_1.dll
    • Cygwin1.dll
    • Cygz.dll

2-3.png2-3   确认IPMI tool 文件2.3 客户端网络配置   接下来需要准备IPMI 连接的网络环境。 首先需要在存储控制后面找到带有“小扳手”图标的Service LAN Port(如图2-4), 并连上网线。2-4.jpg2-4 VNXe3200  Service LAN Port   然后,将装有IPMI tool 的Windows工作机和SPA、SPB的Service LAN Port连到网一个交换机上, 如图2-5。2-5.jpg 2-5  IPMI tool 和 Service LAN Port的连接   VNXe3200存储控制器的BMC接口上默认配有内部私有IP地址: SPA是128.221.1.252, SPB是128.221.1.253。 所以,我们按上图2-5连接好网线后,需要在Windows工作机上配上和128.221.1.*在同一网段的静态IP, 例如: 128.221.1.250 (如图2-6)。  然后就可以在Windows机器分别ping  SPA和SPB的内部IP地址。 如果能ping通, 我们就可以进行IPMI连接登录。2-6.jpg 2-6  配置装有IPMI tool的Windows工作机的静态IP地址2.4 通过IPMItool 访问VNXe控制台   运行Windows CMD并cd 到安装IPMI tool的路径下。 运行如下的连接命令:     ipmitool.exe -I lanplus -C 3 -U console -P <password> -H <host> sol activate   说明:<password>是设备的产品序列号 (Serial Number, SN/Product ID), 在存储控制后的黑色小吊牌上可以查询到。<host>就是BMC上设置的 内部私有IP地址:SPA是128.221.1.252, SPB是128.221.1.253。        输入命令后等几秒钟,我们就可以像以前通过串口一样登录到VNXe 3200, 如图2-7。2-7.jpg   2-7   通过IPMI tool 登录到VNXe32002.5 检查 控制器状态及设置管理IP   通过IPMI tool登录VNXe3200后,我们就可以像串口登录一样来控制这台设备。 运行svc_hep 可以查看用户权限内的所以命令。 下面我们来介绍两条常用的命令: svc_diag 和svc_initial_config这两个命令。2.5.1 svc_diag   通过svc_diag 命令可以查看控制器的状态是在正常模式或服务模式,还有检查是否被设置管理IP以及IP是多少。2-8.jpg 2-8   svc_diag2.5.2 svc_initial_config   当Connection Utility无法使用时,通过svc_initial_config 命令可以设置管理IP及主机名称。svc_initial_config -a -f <name> -n "<IP> <netmask> <gateway>"   例如:svc_initial_config -a -f NewVNXe -n "1.1.1.2 255.255.255.0 1.1.1.1"2-9.jpg2-9 svc_initial_config3.总结   以上就是关于 VNXe3200初始化配置、初步troubleshooting的一些讨论总结。 如果在执行的过程中遇到疑问,请及时联系EMC 800技术支持。 参考资料:

 

 

关于作者:

王彩兴   Ansin Wang   (mailto:  Ansin.Wang@emc.com)

141692_Wang_Ansin_Caixing.jpg

EMC技术支持工程师,2013年初加入EMC VNXe远程支持团队。熟悉VNXe 1 Series和VNXe 2 Series产品架构及功能,对VNXe运维及排错有丰富的经验

想必大家都知道,在IE地址栏里输入阵列SPIP地址即可打开管理界面Unisphere,对VNX阵列进行管理操作。那么管理每一台VNX阵列需要单独打开管理界面吗?不同站点的VNX阵列是不是需要各地的管理员单独管理呢?Legacy的产品ClariionCelerraVNX是不是无法统一管理呢?答案是否定的!我们通过Unisphere Storage DomainMulti-Domains的功能,可以将不同站点、不同型号的众多存储阵列在同一个用户界面中集中管理。今天就来谈谈Unisphere Domain


Domain的概念在2001EMC Navisphere 6.0中引入,它是指用户自定义的一组EMC存储系统。由ClariionCelerra组成的Domain称为Legacy Domain,由VNX阵列组成的Domain称为VNX Domain。由于两种Domain的数据库结构不一样,因此Legacy阵列不能加入VNX Domain,反之亦然。想要同时管理Legacy阵列和VNX阵列,需要使用Multi-Domains


Single Domain

初次为VNX设置security的时候,此VNX阵列自成一个Domain,称为Domain-of-one,该阵列的两个SPPrimary Constrol Station称之为Node,当我们将NodeIP输入至IE的地址栏中时,Node上的UI Java应用程序会被下载到本地,通过这个UI,客户可以管理这个Domain中的阵列,并设置这个Domain的参数和Global-user 权限。Global user可以访问整个Domain,而Local user只可以访问单个存储系统。用户可以使用Domain中任意NodeIP进入管理界面。在一个Domain中,我们还需要选取一个Node作为Domain Master,在Master Node上存储了Domain管理数据的master copyDomain Master处理来自Domain中其他NodeDomain更新信息,并分发给Domain中的其余Node。如果Domain Master不可用了,并不会影响其他阵列的管理,但是直到Domain Master重新可用或者新的Domain Master被选出才能更新Domain database


如何配置Domain?对用户来说,操作非常简单。我们可以用Unisphere GUI或者CLI命令行为一台存储阵列配置domain-of-one,并继而向该Domain中添加阵列。

  • 使用Unisphere GUI配置Domain
  1. IE地址栏中输入一个Node IP
  2. 当“Do you want to configure global security now?”对话框弹出时,选择“Yes”;
  3. 创建至少一个Global 管理员帐户或security管理员帐户;
  4. 创建其他global或者local用户;
  5. 如果需要的话,配置NTP服务、LDAP服务;

Domain-of-one即创建完成,可以继续添加其他阵列进此Domain,只需要在以下界面中提供被添加阵列的一个Node即可:


如果您要添加的阵列已经在另一个Domain当中(因为大部分阵列最初都是Domain-of-one),您需要提供login credential来将该阵列pull到当前Domain中。这个新加入的阵列会应用Domain的所有属性,上述步骤中创建的所有Global user都可以访问这个Domain中的所有阵列。


  • 用命令行配置Domain
  1. secure CLI
  2. domain -setmaster来指定domain master
  3. domain –add向当前Domain中添加存储阵列(被添加的Node如果已在Domain中,必须先removesetmaster.png

 

 

 

Multi-Domains

如果环境中有Legacy产品ClariionCelerra,也有VNX,则需要配置Multi-Domains。配置完成后,在Unisphere-System ListAll System下拉框中可以看到所有Domain里的阵列都可以在一个界面中管理。由于Clariion的版本比VNX低,因此用Clariion Domain中的Node登录Unisphere,无法看到VNX Domain的阵列。我们建议用户用VNX Domain中的Node登录Unisphere管理所有阵列:

 

具体配置步骤如下:

  1. 登录VNX Local Domain,选择“Manage Multi-Domain Configuration
  2. 输入需要连接的Domain中的一个Node IP(此Node所在阵列称为Gateway system);
  3. 为这个连接取一个名字即可;

gatway.png

Gateway允许用户访问被连接的 Domain,使得管理Multi-Domain中所有阵列得以实现。Multi-Domains的应用场景不仅仅限于Legacy DomainVNX Domain的连接。当客户有多个不同站点数据中心时,也是非常好的选择。如果把所有站点的阵列放在一个Domain里,获取管理数据响应时间会受到影响。我们可以为各个数据中心单独创建Domain,并通过Multi-Domains来统一管理。

 

注意事项:Domain识别的是NodeIP地址,当客户需要更改Domain内阵列的IP地址时,需要额外的操作:

  • 如果需要更改IP的阵列是DomainDomain Master,则需要重新配置新的Domain Master,并将此阵列从Domain中删除;
  • 如果需要更改IP的阵列是Domain中的普通Node,则只需将此阵列从Domain中移除即可;

如果用户忘记考虑Domain的问题,直接更改SP IP,管理Domain发现任何异常,可拨打EMC售后热线,联系我们的工程师。

随着VNXe第二代新产品VNXe 3200装机量的提升和客户需求的增加,VNXe的技术支持工程师常常接到客户的咨询,希望能在系统配置上得到推荐和指导,为性能调优。本文主要介绍EMC推荐的VNXe3200系统配置,希望能对这款产品的使用和管理人员带来帮助。


一、优化性能的几大原则

在进行具体的配置推荐之前,我们先来看看以下几条关于性能优化的基本原则:

1、闪存优先。众所周知,闪存盘(Flash Drives)在硬件性能上要优于其它类型的硬盘。因此,我们应当合理利用闪存盘,将性能最优的存储资源配置给最频繁使用的数据,以提升整体性能。

2、注意负载均衡,将负载合理分配到所有可用的硬件资源。

3、在规划存储时,应当注意硬件资源(如CPU、内存、硬盘)的利用率在70%及以下时性能更优。

4、在使用硬盘时,要避免同时处理不同类型的读写。

5、对VNXe的软件(操作系统)版本要及时升级。升级的相关操作可以在Unisphere中进行。


【在Unisphere进行版本升级】Settings --> More Configuration... --> Update Software

update software.png


二、对硬盘的利用

1、我们推荐将性能高的闪存盘分置在不同的总线。这种配置适用于至少有一个DAE的客户,因为DPE使用总线0Bus 0),第一个DAE使用总线1Bus 1),如果还有更多的DAE,则交替连接总线0和总线1

 

2、关于热备盘的规划

VNXe3200的系统中,任何未使用的非系统盘*都可以被用作热备盘。关于热备盘的规划,我们有以下推荐:

1)对某一种类型的硬盘,至少每30块硬盘必须配备一块热备盘。

*注:系统盘(DPE Disk 0 - DPE Disk 3)即DPE的前4块盘,不论是否已经使用,都不能用作热备盘。

 

【如何查看热备盘】在Unisphere中,可以从Storage --> Storage Configuration --> Spare Disks Hot Spare Policy页面)查看热备盘的情况。


hs.png


2)确保每种类型的硬盘都有相应的热备盘。

 

3)热备盘的大小需要等于或大于需要顶替的硬盘。


三、对可用性和连接性的配置

VNXe3200支持多种连接协议,包括FC, iSCSI, NFSCIFS。针对不同的协议,EMC支持网站http://support.emc.com 提供了相应的配置文档。

 

1FC连接

FC协议的连接要求VNXe3200上配有FC光纤I/O模块。针对FC协议的使用,我们有以下推荐:

1)建议每个存储控制器(SP)上使用多个光纤口,以平衡主机端口连接的负载。这是因为主机端口的连接会影响CPU内核的资源分配。


2)如果客户不使用光纤模块上全部的光纤口,请优先使用偶数号的端口(FC port 0/FC port 2),再使用奇数号的端口(FC port 1/ FC port 3)。

 

【查看端口状态】在Unisphere中,可以在Settings --> More Configuration… --> Port Settings中查看端口的状态

port.png

 

2iSCSI连接

iSCSI协议的连接需要用到板载的I/O模块,连接速度为100 Mb/, 1Gb/ 10 Gb/秒。

110Gb/秒的I/O模块性能最优。


2)在所有iSCSI端口上配置巨型帧(Jumbo Frames),即把MTU设置为9000

注:这种配置需要整个网络环境都支持巨型帧。

 

3)如果可以,应尽量为iSCSI的数据流量提供专有的存储网络。

 

3NAS连接

NAS的连接包括使用NFSCIFS协议进行连接,在硬件需求上与iSCSI连接一致,需要用到板载的I/O模块。同样,连接速度为100 Mb/, 1Gb/ 10 Gb/秒。

1)与上述的iSCSI连接相同,10Gb/秒的I/O模块性能最优。在所有NAS端口上也应配置巨型帧(Jumbo Frames),即把MTU设置为9000

 

2)对NAS的连接我们还推荐使用链路聚合和多路径,既能在故障出现时提供端口切换,又能为单边存储控制器的NAS服务器提供更高的带宽。


     A. 在某一边存储控制器上,可以为2个及其以上端口配置链路聚合(LACP)。

   【配置链路聚合】链路聚合可以在UnisphereSettings --> More configuration… --> Port Settings中配置。

lacp.png

 

   请注意,用作iSCSI协议连接的端口不支持链路聚合。如下图:

no lacp for iscsi.png


B.我们推荐在两边存储控制器的对应端口(比如:SP A Ethernet Port 2SP B Ethernet Port 2)使用完全相同的网络配置,这样可以保证跨存储控制器的网络冗余。

 

以上是关于VNXe3200系统配置的一些推荐,主要说明了提升性能的基本原则、存储硬盘的利用和使用不同协议连接的配置。针对具体的问题,请访问http://support.emc.com 进行搜索。


【作者简介】

 

Ying Huang

 

EMC技术支持工程师,目前就职于EMC VNXe远程支持团队。熟悉VNXe 1 Series和VNXe 2 Series产品架构及功能,对VNXe运维及排错有丰富的经验。

  大家好!最近,我们收到了很多客户们发来的问题,我们对几个常见问题进行了总结,希望对各位存储达人有所帮助!


  1. 如何重启SP的管理服务器?

方法一:使用管理界面来重启管理服务器

      1. 打开浏览器,在地址栏输入SPA的管理IP地址:http://<IP_Address_of_SPA>/setup
      2. 使用您登录Unisphere的账户进行登录1.jpg
      3. 点击“Restart Management Server”,选择“Yes”并点击“Submit”来重启SP的管理服务器。2.jpg
      4. 在地址栏中输入SPB的管理IP地址:http://<IP_Address_of_SPB>/setup,并重复步骤bc


方法二:也可以使用命令行界面(CLI)来重启:

      1. Navicli命令:
        > navicli -h  <SPA_IPaddress> networkadmin -restartcimom
        This operation will cause a management server restart!
        Do you wish to continue? (y/n) y


        > navicli -h  <SPB_IPaddress> networkadmin -restartcimom
        This operation will cause a management server restart!
        Do you wish to continue? (y/n) y

         
      2. Naviseccli命令:

> naviseccli -h <SPA_IPaddress> -user <user_name>-password <password> -scope 0 networkadmin -restartcimom
This operation will cause a management server restart!
Do you wish to continue? (y/n) y


> naviseccli -h <SPB_IPaddress> -user <user_name> -password <password> -scope 0 networkadmin -restartcimom
This operation will cause a management server restart!
Do you wish to continue? (y/n) y

注:重启管理服务器不会影响存储的业务以及访问。

 

 

  2. 在使用双控制站(Control Station)的环境中:

    1. 怎么判断哪台是主控制站(Primary Control Station)、哪台是备用控制站(Standby Control Station)?
      • 通过SSH登录到任意一台控制站中,并运行一下命令就能知道谁是主控制站了:

# /nasmcd/getreason

      • 在下面例子中,Control Station 0 Slot_0 是主控制站,Control  Station 1Slot_1)是备用控制站3.png

 

 

    b. 为什么可以通过主控制站的IP地址来访问Unisphere,而备用控制站的IP地址不行呢?

      • 在双控制站环境中,Unisphere以及其它的管理服务只会运行在主控制站上,所以只能通过主控制站的IP地址来访问Unisphere以及进行管理操作。

 

    c. 为什么之前都是通过Control Station 0IP地址来访问Unisphere,而现在突然需要通过Control Station 1IP地址来访问?

      • 如果主控制站因为任何原因离线,备用控制站(如果配置适当)将自动接管所有的控制站功能,并转变为主控制站。
      • 备用控制站不会使用出现故障的控制站的IP地址。每个控制站都配置了其自己的IP地址。*
      • 在这个问题中,由于一些原因Control Station 1 接管了主控制站的职责,而Control Station 0变为了备用控制站,所以Unisphere以及管理服务切换到了Control Station 1上。此时,我们就需要用Control Station 1IP地址来访问Unisphere。同时,需要排查一下Control Station 0是否有软硬件故障,并进行解决。

*备注:如果您配置了IP别名,便可以使用单个IP地址与主控制站进行通信,而不用考虑主控制站是Control Station 0还是Control Station 1。这个功能会在以后的文章中给大家介绍。


    d. 如果控制站出现故障,是否会影响数据访问?

      • 各个Data Mover会继续响应用户请求,不会受到影响
      • 用户对数据的访问不会中断

 

    e. 我们已经将Control Station 0上的故障排除了,怎么样才能将主控制站的职责从Control Station 1切换回Control Station 0

      • 有两种方法可以进行主控制器职责的切换:
        • 方法一:从备用控制站运行命令来接管主控制站职责。
          • 使用nasadmin身份,通过SSH登录到备用控制站
          • 使用su命令切换为root
          • 切换到从/nasmcd/sbin 目录:

                            # cd /nasmcd/sbin

          • 运行命令来接管主控制站职责:

                            # ./cs_standby -takeover

                                                       Taking over as Primary Control Station

                                                             Done

          • 具体请参考下面例子4.jpg


        • 方法二:从主控制站运行命令来切换为备用控制站,并激活原备用控制站为主控制站。
          • 使用nasadmin身份,通过SSH登录到主控制站
          • 使用su命令切换为root
          • 切换到从/nasmcd/sbin 目录:

                         # cd /nasmcd/sbin

          • 运行命令进行主备切换:

                         # ./cs_standby -failover

                                                       The system will reboot, do you wish to continue [yes or no]: y

                                                       Failing over from Primary Control Station

                                                       Broadcast message from root (pts/0)...

                                                       The system is going down for reboot NOW!!

          • 具体请参考下面例子:

                                        5.jpg

 

  好了,这次的常见问题就先分享到这里,希望大家能够有所收获。若你有其他希望了解的问题或者疑问,可以通过跟帖的方式提出,并请继续关注本博客,我们会在下次的文章中为你解答。


【作者简介】


Jason Zhang


EMC资深技术支持,目前就职于EMC VNX远程支持团队。拥有多年数据中心实施以及维护经验,熟悉数据中心标准与架构。对于VNX运维与排错有丰富经验。

    VNX2相比较VNX1有一些硬件与软件上的区别,比如两者的热备盘机制就有很大的不同。熟悉VNX1代的存储管理员或许会对VNX2代的热备盘管理大吃一惊——“热备盘都去哪儿啦!”嘿嘿不要紧张,本文就将针对两代VNX产品热备盘的机制做一个比较与梳理,相信你很快就能掌握啦。

 

1.热备盘的创建

 

    VNX1代需要手动创建热备盘,创建的方法是创建一个类型为”Hot Spare”Raid Group:

blog1.JPG.jpg

 

    VNX2代不需要手动创建热备盘,但是需要指定一个热备盘的策略:

blog2.JPG.jpg
 
  可选三种Hot Spare 策略:

 

    Recommended——系统默认的Hot Spare策略;

 

    Custom——客户指定的Hot Spare策略;

 

    No Hot Spares——不配置Hot Spare策略;

 

      需要注意的是,这三种策略都不会强制预留任何磁盘作为Hot Spare。如果用户在创建Raid Group/Pool的时候因为选择了过多的磁盘而违反了Hot Spare策略,系统仅仅会弹出告警窗口来做提示,用户可以选择放弃创建或者确认创建:

blog3.JPG.jpg

 

  另外“No Hot Spares”这种策略并不是说坏盘后不会有热备盘顶上,只是说即使当客户选择所有Unbound磁盘来创建Raid Group/Pool,系统也不会发出上述警告。

 

2.热备盘的时效性

  在VNX1中,热备盘是暂时性的,即当新的磁盘被更换上去后,热备盘会将数据拷回新磁盘(Equalization),原始的Raid Group结构不会发生变化。

 

    VNX2引入了永久热备盘的概念,即省略了Equalization的步骤,热备盘会永久参与Raid Group的结构,新换上的磁盘会处于Unbound的状态。

blog4.JPG.jpg

  上面两张图里面,原来的RG 00.0.0 0.0.1 0.0.2 0.0.3四块磁盘组成。之后磁盘0.0.1因为故障被移除,磁盘0.1.23被选作热备盘参与了数据重构并永久参与了RG 0的结构。

 

  永久热备盘虽然省略了Equalization的步骤,但还是可以通过naviseccli命令行的方式将永久热备上的数据拷回原来的磁盘,以此达到方便管理的目的。例如当前需要将上述0.1.23的数据拷回到0.0.1上,就可以使用以下的命令行:

naviseccli  copytodisk  0_1_23  0_0_1

 

3.热备盘被触发的时间

 

  在VNX1里面,当一块处于RG中的磁盘被拔出,热备盘会被立即触发做数据重构。

    VNX2引入了“5分钟等待”的概念。即当一块处于RG中的磁盘被拔出(无论是人为移除或者系统移除),系统会等待5分钟时间才会去找热备盘顶替这块磁盘。例如一块磁盘被误拔,只需要在5分钟内能插回,系统一不会触发热备盘,二只会对这5分钟内变化的数据做重构,这样很快就能恢复到之前的使用状态。

    VNX2通过磁盘的SN号来确定这块磁盘是否属于某个Raid Group, 结合“5分钟等待”的概念,给磁盘的位置移动带来了可能。之前提到永久热备盘的概念,如果想要保持之前的RG结构,可以通过naviseccli copytodisk的命令来调整。其实,我们还可以通过把两块磁盘分别拔出然后交换位置来实现这个目的,但是整个操作必须在5分钟之内完成。

  另外需要注意的是,千万不要交换和移动0.0.0 0.0.1 0.0.2 0.0.3四块系统盘的位置!VNX1VNX2之间的磁盘交换也不被支持。

4.有效热备盘的容量和类型

  只要RG里面数据量较小,VNX1允许用容量较小的磁盘替换同一种类型容量更大的磁盘。但是VNX2只允许容量相同、或者容量更大的磁盘去替换同一种类型的磁盘(不考虑磁盘的尺寸或者转速)。

  另外,VNX2采用了两种不同的SAS SSD盘。SAS Flash盘可以用来配置FAST CACHE或者FAST VP, SAS Flash VP盘只能用来配置FAST VP。然而SAS Flash SAS Flash VP的热备策略需要分别制定,互相不能做对方的热备:

blog5.JPG.jpg

  好啦,关于VNX1VNX2热备盘机制对比就说到这里,是不是很清晰明了呢?更加深入的一些内容大家可以参考EMC KB 170383,这里一并附上供大家参考。

【作者简介】

Andy Yi

EMC VNX/CLARiiON产品技术支持,从事远程技术支持3年,对VNX Block以及CLARiiON产品的故障排查与维修有丰富的经验,熟悉相关产品的硬件构架与功能特性。

  作为一名“存储设备”的大总管,你是否常年穿梭于五花八门的各种管理界面呢?要是只用一个界面就可以掌握所有,小编想想也是醉了。Unisphere Central正是基于这样理念开发的平台。由于不同设备的功能各有特色,Central还不能完全取代其本身Web界面,但是已经是方便太多了。

1.png

 

Unisphere Central运行在ESX或者ESXi服务器上,目前支持VNXe, VNX/VNX2, ClARiiON CX4 ,还有Xtreme SW Cache

2.png


通过Unisphere Central GUI界面除了可以查看告警、查看存储容量等信息,还融合了性能监控。IO是否过载,存储是否满档一目了然。

3.png


对习惯于命令行的“大总管”们,小编将介绍两种方式登录命令行。

  1. 通过Vsphere Client

右击Unisphere Central,点击打开Console, 然会我们将看到CLI命令行界面

4.png

登录信息:

Username = service

Password = the password of GUI account.

 

  1. 通过Putty

首先正常登录网页界面GUI, 点击”help”

5.png


选择Service EMC Unisphere Central

6.png


输入登录GUI的密码(并非“service” or “Password123#”)

7.png


如果SSH尚未启用,界面会出现Enable SSHSSH会出现“disable SSH”

8.png

 

然后就可以登录Putty

9.png

 

顺便附上Unisphere Central的白皮书和安装文档,供大家操作时参考。

Unisphere Central 白皮书

Unisphere Central 4.0 安装指南

  转眼又是新的一年,小伙伴们是不是摩拳擦掌准备在技术上更进一层楼呢?快有半年没更新这个博客了,小编真没闲着,在无数的VNX技术案例中小编整理了几个疑难杂症,想要和大伙一同来探讨。

 

问题一. 为何将Java6升级到78 原本可以管理VNX阵列的Unisphere突然无法使用了呢?(EMC KB 176712)

原因: Java7 更新版本51以后,安全级别默认被调成了高级(High), 没有通过证书认证的应用都会被屏蔽。

解决办法:将VNX管理IP添加到Java可信任列表

  1. 打开控制面板
  2. 选择Program
  3. 选择Java (32-bit)
  4. 选择安全选项
  5. 选择Edit Site List
  6. 加入VNX SPCS的管理IP
  7. 选择应用

1.png

 

问题二. 为何有时候无法使用 vSphere VSI Unified Storage Manager管理VNX Block呢?(EMC KB 188286)

现象:安装VSI后会看到告警 "Could not find valid software header for entry line.  Unable to validate the identity of the server. There are issues with the certificate presented"

原因: NaviCLI 管理VNX时,可以通过证书认证。但是VSI管理VNX时,无法对证书请求进行响应。

解决办法:重新安装

NaviCLI并勾选某些特殊选项。


目录Start > All Programs > EMC > NavisphereCLI > Uninstall Navisphere CLI


选择"Repair / Reinstall"


"Set Verification Level", 选择Low

"Create Security File", 选择 Do not create security credentials file

选择 Next 然后 Install
2.png


问题三. 为何有时选择copy to hot spare操作会失败?(EMC KB 9174)

原因: 热备盘的使用规则是,如果阵列配置了多块热备,最后一块热备将被系统自动预留。没有坏盘的情况下手动操作copy to hotspare这类预防操作Proactive Copy将失败。只有当某块磁盘彻底损坏变成faulted状态时系统才会自动使用最后一块热备盘。可以理解为最后一块盘是用于“救治”而非“预防”

如阵列仅配置了一块热备,copy to hotspare这类预防操作Proactive Copy是可行的。

 

问题四. VNX上配置dial home模板时出现告警 EMC KB56270

现象: "Logging event to system log by agent on SP is not supported."  when use dial home template on SPA or SPB

解决办法: 右击模板. 取消勾选 "Log to System log"

 

问题五. 请问用哪些方法改变VNX 控制器SPIP地址呢?

请参考此表格

设备型号

登录方式

可修改参数

备注

VNX unified

Setup page

IP address, subnet mask, gateway

Grayed out

VNX unified

Proxy ARP

IP address, subnet mask, gateway

No reboot

VNX block | CLARiiON

Setup page

IP address, subnet mask, gateway, Network name

SP reboot

VNX block | CLARiiON

NaviCLI

IP address, subnet mask, gateway

No reboot

VNX block | CLARiiON

NaviCLI

Network name

SP reboot


问题六. 在使用Unisphere Central管理阵列时, 系统为何将大于10GB的存储一分为二?

3.png


4.jpg

Unisphere Central界面说明中,我们可以得知 Unisphere Central 会将大于10GB的存储分成两个部分。

5.png


问题七. 为何VNX 在扩容完成后Unisphere界面仍旧一直显示正在均衡 (rebalancing)状态呢? (EMC KB 174088)

6.jpg


原因: 这是VNX设计使然。Rebalancing后面的百分百会显示本次扩容是否完成,但是rebalancing会一直保留,来提醒用户这个Pool有扩容历史。


【作者姓名】

Nancy Qian

EMC资深技术支持,从事远程技术支持6年。目前就职于EMC VNX支持团队,主要负责VNX 系列产品的系统维护升级。熟悉数据中心的运行维护,熟悉Linux环境。熟悉数据中心存储基础架构,对VNX运维有丰富经验。


【照片】

pic.png

     大家都知道对于NASCIFS 来说,NTLMKerberos是两个比较重要的验证方式。今天我们来讨论一下作为CIFS安全认证之一的Kerberos协议。

         Kerberos 是一种依赖于验证技术共享密钥的协议,其基本概念很简单,如果一个秘密只有两个人知道,任何一个人都可以通过他们之间共享的秘密来确定对方的身份。用技术的语言来讲,就是对称加密,互相确认。

     说到这里,可能有人会问,NTLM也是CIFS的安全认证啊,为什么Kerberos会用的更广泛呢?他的优点又在哪呢?相信大家了解了Kerberos的工作原理之后就会清楚了。

 

Kerberos认证和我们看电影的过程差不多,主要分三个步骤:

第一步咨询:用户登陆domain

第二步买票:用户获得service票据

第三步来访:使用服务票据访问某服务

kerberos.png

 

 

  • 用户登陆domain (Logging into the Domain)

1. Authentication Server request

    AS_REQ,即上图步骤(1)

 

           一个用户在一台Client机上第一次登陆时,会有弾框提示输入用户名和密码。这时用户密码信息会通过Hash算法产生一个用户的Long Term Key(LTK),再和用户登陆Client端时的时间戳一起进行加密,然后这个用户验证请求被发送给Kerberos Data Center(KDC),并要求KDC返回一个相应的Ticket Granting
Ticket(TGT)

 

2. Authentication Server response

     AS_REP,即上图步骤(2)

 

 

        KDC在数据库中先找到该用户的密码,并用同样的Hash算法生成一个LTK 然后KDC通过LTK从预认证信息PreauthKRB_AR_REQ中解密出用户信息和时间戳, 如果用户信息无误,并且时间戳和目前信息相差在5分钟之内,KDC会认为该用户验证通过。KDC将生成一个TGT,并准备把TGT返回给Client

 

 

     在生成TGT的同时,KDC生成一组随机数作为Logon Session Key,并让他和客户端传来的LTK再次进行加密,产生一个名叫enc-part的信息放在该KRB_AS_REP包中,KDC还会用生成的TGT与能被所有KDC识别的LTK进行加密,再次产生一个enc-part放在TGT的头中,这样就得到了一个只有KDC能解开的TGT,最后把这个TGT加入KRB_AS_REP包中并发送至Client端。

 

3. Ticket cache

           Client端收到KRB_AS_REP后会用自己的LTK来解密KRB_AS_REP中的enc-part,这里我们默认会得到KDC选用的随机数Logon Session Key。这时候Client端将会把得到的Logon Session KeyKRB_AS_REP中带有原始时间戳的TGT一起存入票据内存中准备给下面过程使用。

PS:这时候KDC为了减少自身负担,并没有吧Logon Session Key保存在自己这边,所有只有这个用户在Client端的票据内存里面才有该记录了。

 

 

  • 用户获得service票据(Getting a Service Ticket)

 

1. Ticket Granting Server request

     TGS_REQ,即上图步骤(3)

 

 

Client端接下来会拿着TGT去告诉KDC我要访问某服务,并让KDC给他访问该服务的票据(service ticket),以后他就可以拿着这张票据直接访问该服务了. Client端用现在的时间戳和之前存在票据内存中的Logon Session Key进行加密生成Authenticator,然后再把带有原始时间戳的TGT一起打包发送给KDC等待验证。

 

2.  Ticket Granting Server response

     TGS_REP,即上图步骤(4)

 

KDC收到KRB_TGS_REQ后会用自己的LTK解密出TGT,然后看看TGT中的原始时间戳,如果来确定TGT现在还是处于有效的状态,KDC就会从TGT中读取Logon Session Key,并用这个Logon Session Key解密Authenticator来获得第二次记录的时间戳,如果该时间差在5分钟之内,KDC认为验证成功,并将生成一个service ticket

PSKerberos为了防止重演攻击,特别加入了对时间戳的验证。

接下来KDC又会生成一组叫做Service Session Key的随机数,并把这组随机数和service ticket中记录的Logon Session Key进行加密,产生一个名叫enc-part的信息放在该KRB_TGS_REP包中,KDC还会用生成的service ticket与能被所有KDC识别的LTK进行加密,再次产生一个enc-part放在TGS的头中,这样就得到了一个只有KDC能解开的service ticket,最后把这个service ticket加入KRB_AS_REP包中并发送至Client端。

 

3. Ticket Cache

 

     Client收到KRB_TGS_REP后,通过票据内存中的Logon Session Key解密enc-part,然后得到KDC生成的Service Session Key。最后把Service Session Keyservice ticket一起作为访问目标服务器的Credential存入票据内存中。

 

 

  • 使用服务票据访问某服务(Using the Service Ticket)

 

1. Application Server request

    AP_REQ,即上图步骤(5)

   

     经过上面的两次验证,Client现在就能拿着服务票据去访问该服务了。Client记录下时间戳,并读取内存中的Service Session Key与他进行加密生成新的Authenticator,同时用户还要标记好自己是否需要双向认证 (Mutual
Authentication)
,最后再加上之前的服务票据一起发送给该服务的server(NAS系统中相对应的服务就是CIFSserver就是我们加入domainCIFS server)

 

2. Application Server response

     AP_REP,即上图步骤(6)

 

NAS收到这个加密的KBR_AP_REQ之后,用自己的LTK进行解密。接着serverservice ticket里面读出service session Key来解密Authenticator中的时间戳。如果时间差小于5分钟,NAS就允许该用户对他进行访问了,并且为这个Client上的这个用户创建一个security token

 

Kerberos优点:

 

虽然上面Kerberos的工作原理稍微有点复杂,不过我们还是能从中看出Kerberos的高效性,相互身份验证以及互操作性的优点。

 

  1. 高效性:客户端不用每次访问NAS时都去DC验证,而通过查询client credentials就可以验证了。
  2. 相互身份验证:clientserver可以互相验证。
  3. 互操作性:微软的Kerberos V5实现是基于IETF的推荐标准规范。这样,Windows Server 2003Kerberos V5实现就为其他使用Kerberos V5协议的网络的互操作打下了基。

有很多客户经常会遇到这样一个问题,并致电寻求EMC技术支持服务热线的帮助。在咱们EMC的存储上建了一个LUN并且也挂载了业务给主机服务器在用了,用了一段时间后,我发现建的LUN太大了,想缩减LUN的大小,如何才能实现呢?大家知道,对于 EMC的存储本身来讲,在创建了LUN之后是不能直接通过存储上的操作来缩减LUN的大小的,只可以扩容LUN的大小,这就无疑给客户增添了少许烦恼,让客户稍有遗憾。虽然在EMC存储本身没有直接的操作来缩减LUN的大小,但从服务器层面上倒是有些妙招可以借鉴,在服务器层面做了缩减之后存储上再稍加操作,就可以达到客户的要求。今天在这里给大家介绍一下如何在Windows 2008服务器上缩减LUN大小的操作,再加之存储上的一些操作,就完美的满足了客户们的需求~

 

Windows 2008服务器是支持VNX/Clariion存储在线缩减LUN的大小的,一共分成7个步骤。

  1. 需要在服务器上安装Host AgentNaviseccli命令行管理软件,这些软件在EMCpowerlink网站上均可下载。
  2. 需要安装EMC VDS Provider and Solutions Enabler. 这两款软件大家可能并不熟知,可以从EMC Powerlink 网站:Home > Support > Software Downloads and Licensing > Downloads T-Z > VDS Provider处下载获得。

         1.png

         2.png

         3.png

         4.png

         5.png

        6.png

  3.  需要安装支持Windows 2008服务器版本的软件DiskRAID.exe, 这款软件是微软提供的,可在微软官网获得。

 

  4.  需要设置一下之前安装的Solution Enabler软件以便它能够扫到后端的VNX/Clariion存储。

   a. 为Solution EnablerLicense,命令如下:

       C:\program files\EMC\SYMCLI\bin\symlmf
       register License Key (y/[n])?  y
       Enter License Key:  xxxx-xxxx-xxxx-xxxx

   b. Solution Enabler中为每个控制器链接到服务器进行授权操作:   

       C:\program files\EMC\SYMCLI\bin > symcfg authorization add –host IP_Address_Of_SPA –username xxx –password

       xxx                      
       C:\program files\EMC\SYMCLI\bin > symcfg authorization add –host IP_Address_Of_SPB –username xxx –password xxx
       C:\program files\EMC\SYMCLI\bin > symcfg authorization add –host IP_Address_Of_The_Server –username xxx –

       password xxx 

   c. Solution Enabler发现存储阵列:

       C:\program files\EMC\SYMCLI\bin > symcfg discover –clariion
       C:\program files\EMC\SYMCLI\bin > symcfg list –clarion

 

  5.  在磁盘管理中右键磁盘进行Shrink操作。

 

  6.  DiskRAID.exe软件从Windows服务器层面上释放磁盘空间。 

       a. DISKRAID>  list provider   #iVDS provider iSCSI, VDS provider FC光纤的
       b. DISKRAID>  list subsystems
       c. DISKRAID>  detail provider   #用这条命令是确保你使用的是正确的子系统
       d. DISKRAID>  list lun             
       e. DISKRAID>  select lun x     #选择你想要缩减的LUN
       f. DISKRAID>  detail lun        #确保LUN的名字和UUID相同并且正确。
       g. DISKRAID> shrink lun size=xxGB #只有敲了这条命令以后,才会在存储端释放空间。UnisphereLUN
的大小发生

       变化。

     01.png

     02.png

     03.png

     04.png

     05.png

    06.png

7.  刷新一下确保LUN的容量被缩减成功。如果用这些命令行缩减LUN成功,会出现如下显示结果:

      DiskPart successfully shrunk the volume by: xxx MB

 

以上所说的就是在Windows 2008服务器上缩减LUN的大小的步骤,广大客户朋友们,这里尤其需要注意的是若想在EMC VNX/Clariion存储上缩减LUN的大小DISKRAID方法操作来缩减LUN的大小是我们EMC所推荐的方法。有些客户朋友们在致电EMC 800时想知道如何用DISKPART方法在文件层面上缩减LUN的大小,这不是EMC推荐的方法,需要客户朋友们致电操作系统厂商寻求帮助。

 

我们以上所提及到的缩减LUN的大小都是针对EMC VNX存储的Storage Pool来说的,其中Thick LUNThin LUN这两种LUN的性质都能够实现LUN的压缩。但是对于传统的Raid Group中的Traditional LUN是无法进行LUN的压缩的,这种Raid Group LUN是在创建的时候大小就定好的,无法缩减。如果你不小心在Raid Group LUN中用了以上命令,则会出现如下错误报错:

Error: chglun command failed

LUN cannot shrink.

Shrink not supported on this LUN type

 

今天就和大家先聊到这里了,如果 EMC 存储知识感兴趣可以继续关注本博客,我们会在后续为大家带来更多精彩的内容。敬请期待!另外给大家附上一张关于VNX / Clariion存储所用到的TCP/UDP端口汇总图!希望对广大客户朋友们有所帮助!

Untitled.png

最近EMC的技术支持工程师们经常接到客户来电询问如何使用Host AgentHP-UX主机连接到存储的问题。对于Windows主机用iscsi initiator连接存储的方法,本论坛已有相关文档,鉴于HP-UX主机的操作方法有所不同,今天在这里给大家详细介绍一下如何使用Host Agent方法连接HP-UX主机到存储阵列的操作方法,希望对我们EMC的广大客户有所帮助

 

首先我在这里大概总结一下HP-UX主机手工注册HBA的过程:(共有10个步骤需要特别注意,我在这里逐一展开给大家阐述介绍)

 

1. 首先要确认主机到交换机,交换机到存储阵列之间的物理连线。确定交换机上面的zoning配置正确。

 

2. 确认主机HBA和存储阵列前端端口的WWN信息,在之后手工注册时候要用到。

HP-UX主机上确认方法如下:
# ioscan -funC fc            => 先确认有几个FC HBA的设备名,比如/dev/fcd0, /dev/fcd1
# fcmsutil /dev/fcd0         => 确认HBA端口对应的WWN信息,注意需要记录下面两行的0x后面的信息,然后组成阵列注册时候需要的WWN

 

      N_Port Node World Wide Name = 0x500143800422de57

        N_Port Port World Wide Name = 0x500143800422de56

 

=> 上面的两行组成Node WWN:Port WWN的格式,上面的例子组合后就是50:01:43:80:04:22:de:57:50:01:43:80:04:22:de:56(每两个字符之间要有冒号),这个格式的新WWN就是阵列注册时候要用到的,需要记录下来。

 

存储阵列前端端口WWN确认方法:进入VNX管理界面Unisphere Unisphere -> System菜单-> Storage Hardware -> 找到SPs,展开SPs前面的“+”号,先找到SP A下面端口,记录下阵列对应的逻辑口WWN。下图例子是A0对应的WWN,这个格式的WWN后一半(50:06:01:60:46:E0:4E:9E)就是交换机上面看到的阵列端口WWN

1.bmp

 

3. 根据上面的WWN信息,对照交换机上面的zoning配置信息,核对出哪个HBA连到哪个阵列的前端端口。例如在交换机上查到的fcd0连到A1\B1fcd1连到A0\B0

 

 

4. 根据第3步得出的映射关系,我们可以手工注册主机HBA到存储阵列。接下来给大家介绍一下Initiator注册方法:进入VNX管理界面Unisphere Unisphere -> Hosts菜单-> Initiators -> 点击Create按钮,在WWN/IQN那一行填入第2步拿到的主机HBAWWN(注意格式匹配),SP - port就选zoning里面对应的前端端口(比如A0B0),Initiator TypeFailover Mode就按照emc99467对应主机找到的配置参数(例如机器对应的Initiator TypeHP No Auto TrespassFailover Mode1<Active/Passive>)。主机方面的信息就根据实际的主机名和IP地址填好就行,如果已经有注册过一次,剩下的Initiator使用Existing Host选到已有的主机名即可,无需重建。其他选项保持默认值,然后点击OK

2.bmp

 

5. 这里特别要注意的是,也是很多客户经常遇到的问题: HP-UX主机到存储阵列之间如果有多条链路的话(举例来说:如果客户主机是有4条链路),那么这4条链路都需要要按照第4步的方法每个都注册一遍。

 

6. 现在HP-UX主机已经注册好,接下来我们要做的就是创建要分给主机的LUN,把它加到Storage Group中。Storage Group里面把LUN选好,把主机加进去确认即可。(同时指定对应的HLU,注意第一个LUNHLU 0,如下图所示,在加LUN的时候点击Host LUN ID一栏,建第一个LUN时选择HLU0,这样做是为了避免之后再加LUN和删除LUN时造成冲突),把主机加进去确认即可。现在存储阵列方面的工作基本上就完成了。

3.bmp

 

7. HP-UX主机进行扫描LUNdd一下每个LUNHP-UX的主机一定要dd一下对应LUN的设备文件,否则UnisphereInitiator的状态看到是没有Logged In的)。

# ioscan               => 扫描阵列的LUN

# insf -e                => 创建LUN对应的设备文件# ioscan -funC disk   => 检查阵列LUN对应的设备文件,比如/dev/dsk/c15t0d0之类。

# dd if=/dev/dsk/c15t0d0 of=/dev/null bs=1024k count=1024                     => dd读取一下LUN,发起I/O到阵列。

 

8. 在主机dd完所有新创建的LUN之后,到Unisphere检查一下InitiatorLogged In状态是否都是Yes,如果是的话存储阵列这边工作就正常了。

 

9. 如果安装有Powerpath环境并需要使用相应的命令检查一下Powerpath是否正常识别到阵列的新LUN。如果都正常接下来就可以配置LVM、应用。

# powermt check

# powermt display dev=all

 

10.这里给大家列举一个图示来说明在将VNX存储链接到光纤交换机过程中所涉及的端口:

4.bmp

 

以上所阐述的知识点就是这一期博客的相关内容,供大家参考,希望对广大用户有所帮助,也非常欢迎大家能够给予宝贵意见和反馈。敬请期待下一期VNX存储博客,大家下期再见~

作为一名Clariion/VNX 技术支持工程师,每天都会接到来自全国五湖四海的客户报修电话。在这里对大多数Clariion/VNX存储系列的用户所遇到的一些常见问题进行了归纳总结。希望能够对我们的客户有所帮助,解决你们的困惑,使你们能够在管理Clariion/VNX存储上更加得心应手

 

1.很多客户经常会问这样一个问题,对于Active/Passive架构的存储系统,如果non-owning SP(非目标LUN的所有者)收到针对某个LUNI/O请求时,它会如何反应?答案取决于Failover Mode的设置。Failover Mode决定了non-owning SP此时该拒绝还是接受此I/O,并回应目标LUN的状态是可用还是不可用等其他信息。在这里对于广大客户想知道的如何修改Failover mode做了详细的解释,请参考:

 

https://community.emc.com/docs/DOC-16214

 

这里特别要注意的也是客户所经常问到的是:更改完相应Failover模式后,需要重启对应的主机才能使之生效。

 

 

2. 现在绝大多数客户群对于如何收集存储日志SPcollects,如何收集主机日志EMC Grab以及如何收集存储性能日志Nar file已经了如指掌,这些在我们的论坛中也都能搜到。但是在存储管理口无法使用时,对于如何通过串口建立PPP链接也是困惑客户们的问题之一,在这里我手写了一份详细的通过串口建立PPP链接到存储上的操作步骤,供广大客户参考:

 

首先打开一台电脑,按如下步骤进行操作:

1.       1.   开始菜单 —— 设置 —— 网络连接 —— 新建网络连接向导。

2.       2.   点击下一步,选择“建立高级网络连接”,然后下一步。

3.       3.   选择“直接连接到另一台电脑”,下一步。

4.       4.   选择“客户机”,下一步。

5.       5.   名字随便写,下一步。

6.       6.   选择串口线所连接的COM口,一般来说只会有一个COM口。然后下一步。

7.       7.   下一步。

8.       8.   勾选在桌面创建快捷方式,然后完成。

9.       9.   接着会弹出刚刚创建连接的窗口,点击“属性”。

10.   10.   在“综合”页面里点击“配置”按钮。

11.   11.   调制解调器的速度调成115200,点OK

12.   12.   点击上方的“网络”,选中“Internet Protocol (TCP/IP)”然后点属性。

13.   13.   点“高级”按钮,在第一个页面里去掉“在远程网络上使用默认网关”前的勾。

14.   14.   连续点OK,直到回到这个创建的网络连接输入用户名密码的页面。

15.   15.   用户名和密码都是clariion1992

16.   16.   勾上“为如下用户保存用户名密码”。至此PPP连接创建完毕,连上串口线点击连接就能连上存储。

17.   17.   显示连接成功后打开一个IE窗口,在地址栏输入http:// 192.168.1.1/setup

18.   18.   在这里能看到这个SP(控制器)的IP地址。如果这台AX有两个控制器那么在Peer IP Address里能看到另一个控制器的IP地址。之后就可以通过这些地址访问控制器了。

19.   19.   如果不记得用户名密码了,请点击”Create a New Account”,在其中输入要新建的用户名和密码,点击Apply Settings保存。

 

3. 如上介绍了如何通过COM串口建立PPP的链接,这里比较容易与之混淆的是Serial串口链接。Serial串口链接和PPP链接都是通过Serial cable(串口线)连接到控制器上的COM口。但他们在不同环境中的用途是不一样的。 PPP链接是在Management Port(管理口)和Service LAN Port(固定IP)不能访问的情况下用的,以便能够访问Unisphere管理界面和Remote Anywhere(技术支持工程师用)。 Serial串口链接是用于收Bootlog(启动日志)用的,在控制器无法启动时以便能够收到启动日志给工程师分析原因。鉴于有很多客户和现场工程师对于如何收集Bootlog启动日志还不是很了解,在这里做个图文的步骤分享给大家:

按照如下步骤进行操作:

  1. Connect a null modem micro-DB9 to DB9/F serial cable from the laptop Com1 to MGMTA (management board A) serial port. Highlighted below for Black Widow.(用专门型号的串口线将笔记本的COM1口和存储MGMTA口相连)
  2. 打开一个超级终端窗口(Start/ Programs/ Accessories/ Communications/ HyperTerminal.)
  3. Enter Connection name: SPA1(输入链接的名字)
  4. Connect (for example, using Com1) Identify the com port for your laptop.(链接识别的COM口)
  5. Use the following port settings:(按照如下参数进行配置)

    a. Bits per second: 9600
    b. Data Bits: 8
    c. Parity: None
    d. Stop Bits: 1
    e. Flow Control: Hardware
  6. Select OK.
  7. Apply AC power to the SPE enclosure.
  8. Monitor serial communications through HyperTerminal window.(看一下超级终端窗口的输出)

  如下是PuTTY相关的截图:

  1.JPG

  2.JPG

  3.JPG

 

4.  身为一名技术支持工程师在平时接电话与接Online Chat与客户打交道的过程中,发现我们的Clariion/VNX存储用户们对于存储机器上的一些端口还有些困惑,对于LCC后端的一些插孔也不是特别熟悉,在此我给大家列举两张图示介绍一下各个口的名称,以便大家在阅读本文时能够更加形象

 

4.JPG

 

5.JPG

6.JPG

 

5.  根据以往的经验接下来为大家列举一下客户们的常见问题:

     如何在不登入Unisphere管理界面的情况下用命令号获取磁盘的TLA part number呢?

     用下列命令行:

     输入:naviseccli -h 10.32.106.174 getdisk 1_0_0 -tla

     输出:Bus 1 Enclosure 0  Disk 0

     Clariion TLA Part Number: 005049274

 

 

6.  如何通过命令行重启SP以及重启对端SP控制器

     假设在操作的这台控制器IP是ss1_spa; 对端的控制器是ss1_spb.

     输入如下命令:

     naviseccli -h ss1_spa rebootpeerSP

     会出现如下提示:选择y

     This operation will cause a system reboot!

     DO YOU WISH TO CONTINUE? (y/n)?

 

 

7. Trespass mine和trespass all这两个命令有什么区别吗?

    naviseccli –h spa trespass all   

    //这条命令表示所有的用户LUN都会被trespass到SPA上

 

    naviseccli  -h spa trespass mine

    //这条命令表示默认SP Owner属于SPA的用户LUN才会被trespass到SPA上

 

 

8. 更换磁盘时,如何查看LUN的Rebuilding进度?

    右键点击LUN,选择属性

9.    9.    7.JPG

 

9.如何     9.  如何通过命令行来查看磁盘的rebuilding速率和equalizing速率

       用如下命令:

    /nas/sbin/navicli -h 10.30.238.44 getlun 25 –prb

 

    naviseccli -h 10.64.123.456 –user emc -password emc -scope 0 getdisk 0_0_5 -state –rb

 

    对于有兴趣了解其内部机制的可以参考:

    http: support.emc.com/kb/8721

    http: support.emc.com/kb/16897

 

 

10. 为什么在某些LUN上无法创建镜像或者添加Secondary镜像呢?

      如果LUN上运行有其他的复制软件时,我们无法在删除LUN,或者在上创建镜像。

 

1) 我们可以用如下命令行查看LUN上配置是否配置有复制软件:

navicli -h <IP_address> getlun -messner <LUN_number> -stack

 

2) 我们可以用如下列命令行删除LUN上的软件:

naviseccli  -h <SP_IP_address> mirror -async -setfeature -off -lun <LUN_number> 或者 naviseccli  -h <SP_IP_address> mirror -sync -setfeature -off -lun <LUN_number>

 

想要了解其内部机制可以参考EMC知识库文章emc287481/emc120515

 

 

11. 大家知道运行BV是为了测试数据的完整性。但为什么有的时候在运行BV的时候会突然停掉呢?这是因为我们为了检查在一个Raid Group中有没有uncorrectable error来运行BV,但有时因为一个Raid Group中的一块盘正好突然坏了,这会触发将该盘数据拷贝到热备盘的操作。这会导致BV的突然中断。我们只能等到提前预拷贝PACO结束时才能继续继续进行BV。

 

12. 随着客户的用法越来越高端,有很多客户问过这样一个问题,如何将Thick LUN转变成Thin LUN呢?这里给大家简单讲解一下:

首先,对于客户的问题,目前还不支持将Thick LUN直接转变成Thin LUN,但是我们有另外一种方法可以满足客户的需求。我们可以将从Thick LUN上的数据迁移至Thin LUN

下面是不同类别的LUN互相转换的表格。

Feature

Source LUN  类别

Dest LUN类别

注明

克隆Clone

Traditional/Thick/Thin/Meta

Traditional/Thick/Thin/Meta

没有限制

克隆Private LUN

Traditional LUN Only

n/a

>=1GB

压缩Compression

Traditional/Thick/Thin/Meta

Thin

 

迁移Migration

 

Traditional/Thick/Thin/Meta

Traditional/Thick/Thin/Meta

没有限制

镜像 MirrorView

Traditional(>=R29)/Thick/Thin/Meta

Traditional(>=R29)/Thick/Thin/Meta

如果SecondaryThin LUn的话,需要保证Pool有足够的容量

镜像Mirrorview WIL

Traditional LUN Only

n/a

>=128MB

预留空间 Reserved LUN Pool

Traditional/Thick LUN Only

n/a

推荐RAID类别为RAID1/0, RAID5

 

今天就和大家先聊到这,请大家继续关注本博客,之后我们还会和大家一起分享存储经验,敬请期待。

22

2

5.

新的一年开始啦,USD部落格要和小伙伴们分享些什么呢?当然还是继续我们探索VNX的旅程吧。

本期我们将分享如何更专业的配置VNX,如何玩转存储。

 

一、 如何在VNX上用本地文件配置NFSv4

 

测试环境说明

  • VNX5500 file OE 7.1.65-8
  • Linux Client: RHEL 6.0(2.6.32-220.el6.x86_64)
  • Naming service: Local files


步骤:

1) On VNX Control Station 命令行窗口

1. 用纯文本文件打开/nas/server/slot_<x>/config,这里<x>是Data Mover的槽位。

 

2. 在NFS配置行,加上hivers=4这一项,如果这项已经有了,确保这个值为4。 保存并关掉这个文件。

比如: nfs config hivers=4

 

 

3. 用这个命令重启Data Mover

$ server_cpu <movername> -reboot -monitor now

where: <movername> = name of the DataMover

 

4. 用下列命令定义NFSv4的域名

server_param <movername> -facility nfsv4 -modify domain -value nfsv4.domain

 

5. 将nsswitch.conf.tmpl拷贝至Data Mover。 因为Naming service是掉用本地文件,所以默认没有必要编辑此文件。

# cp /nas/sys/nsswitch.conf.tmpl /nas/site/nsswitch.conf.<movername>

# server_file <movername> -put /nas/site/nsswitch.conf.<movername> nsswitch.conf

 

6. 创建一个文件系统,并挂在为“MIXED”。同时更改文件系统的权限(默认为755)

 

7.将文件系统加到Linux Client

 

2) On Linux Client

1. 在/etc/idmapd.conf里重新编辑域名

Domain = nfsv4.domain                  => 域名要和 VNX file 相同

 

2. 重启服务rpcidmapd

# service rpcidmapd restart

 

3. Linux Client上从/etc/passwd拷贝用户信息到/nas/quota/slot_2/.etc/passwd。

 

4. 在/nas/quota/slot_2/.etc/.创建名为“group”的文件。在Linux client上从/etc/group 拷贝Group组信息到/nas/quota/slot_2/.etc/group.

 

5.用NFSv4挂载至Export

# mount -t nfs4 <DM_interface_IP>:/NFS /bobtest

 

6.运行II加以确认

[root@bobtest]# ll

total 2

-rw-r--r--  1 nobody nobody   0 Aug 28  2010 hi

-rw-rw-r--  1 bob  bob    0 Aug 28 15:56 bob.txt

 

文件“hi”是在用户信息添加到/nas/quota/slot_2/.etc/passwd之前创建的,而“bob.txt”是在上述操作执行后创建到,我们可以看到“hi”和“bob.txt”的不同。

 

更多参考资料

Configuring NFS on VNX

Configuring VNX Naming Services

Configuring VNX User Mapping

 

 

 

二、如何在Windows 2008上压缩Pool LUN

 

步骤:

1.首先在Windows 2008上用命令行Diskpart压缩LUN的大小。

DISKPART> list volume

DISKPART> select volume ###               <The ### is the volume number from above step, which you want to shrink>

DISKPART> shrink desired=xxx              <The xxx is the size you want to shrink, the size unit is MB, this step need take time to finish>

 

请参考 http://technet.microsoft.com/en-us/library/cc731894.aspx

如果压缩命令执行成功,我们会看到输出 DiskPart successfully shrunk the volume by: xxx MB

 

2. 用NaviSECCLI命令行压缩后端LUN的大小,请注意命令执行成功后没有输出。

naviseccli -h <SP_IP> -user <admin account> -password <password> -scope 0 chglun -l <lun_number> -sq gb -shrinkto xxx    (这里 xxx 是压缩后的大小)

 

限制:

选项shinkto 只支持Pool LUN,不能支持RAID Group LUN。如果此选项用于RAID Group LUN,会出现以下报错:

Error: chglun command failed

LUN cannot shrink.

Shrink not supported on this LUN type.

 

更多参考资料:

EMC知识库文章 emc230411\emc301259

LUN Shrinkage

很久没有发布有关中端存储阵列的分享了,不知大伙有没有期待新一期的部落格呀。这回咱们来聊聊用户准备报修中端存储CLARiiON故障时常有的三大困惑。当报修流程清晰、易懂,报修的效率一定会大大提高啊。

 

一、要打EMC售后热线维修故障,但是找不到存储的序列号,该怎么办呢?

EMC售后每一笔报修都必须有相应的服务单号(Service Request)生成,这样既方便用户查询进度,又可以让远程和现场人员协作更高效。

 

1. CX4-120/CX4-240/CX4-480

打开存储的前面板后,可以看到四个电源模块,在右上角竖立的蓝色标签上写着FCN或者CKM开头的数字即是阵列的序列号(TLA S/N number)。

1.png

 

2.CX4-960

打开存储的前面板后,可以看到四个电源模块,在左下角竖立的蓝色标签上写着FCN或者CKM开头的数字即是阵列的序列号(TLA S/N number)。

2.png

 

3. CX3-20/CX3-40

打开存储的前面板后,可以看到四个电源模块,在左边竖立的蓝色标签上写着FCN或者CKM开头的数字即是阵列的序列号(TLA S/N number)。

3.png

 

4. CX3-80

打开存储的前面板后,可以看到四个电源模块,在左下角横着的蓝色标签上写着FCN或者CKM开头的数字即是阵列的序列号(TLA S/N number)。

4.png

 

 

二、从来没有登陆过存储,最近要配置或报修,该怎么办呢?

如果不知道存储的管理IP和管理口令,我们需要通过串口找到存储的管理IP地址,然后改掉登陆口令。

步骤如下:

1. PC和存储控制器串口建立PPP连接。

电脑和Clariion的SP之间只有串口线连接,通过在电脑上做PPP拨号配置,电脑可以从Clariion获得一个私有IP 192.168.1.2,从而登陆Clariion内部的管理界面。

5.png

建立PPP连接的详细步骤:

a) 开始选择菜单->配置->控制面板->网络连接->新建一个连接

b) 选择“创建高级连接”,点击下一步

c) 选择“直接连接到另一条计算机” ,点击下一步

d) 输入连接的名称,点击下一步

e) 选择角色作为“客户端”,点击下一步

f) 选择连接模式为“串口通信",点击下一步

g) 依照向导完成“新建连接” ,双击打开新建的连接,点击“属性"

h) 选择一般配置(General),点击配置,将串口工作速率设置为“115200”,其余保持默认即可

i) 然后在拨号窗口中,输入用户名\密码:clariion1992\clariion1992,点击连接,即可拨号到串口所连接的控制器。连接建立成功后电脑作为客户端会从存储那里获得IP 192.168.1.2

 

2.  查询当前的IP地址。

PPP连接建立好之后在浏览器地址栏输入:http://192.168.1.1/setup,可以看到当前两个控制器的管理IP地址。

7.png

 

3. 更改管理口令。

a) 点击"Create a New Account." 创建一个新的账号。

b) 输入新的用户名和密码。

c) 点击"Restart Management Server." 重启SP的管理服务器,让以上配置生效。注: 两个SP必须都有这个操作。此操作不影响存储业务。

d) 断开串口线连接,将电脑网线连接到SP的管理端口。将电脑的IP设置成和Clariion的管理IP配置一个同网段,打开浏览器,输入http:// <IP_address_ of _SP>,用新的账号即可登陆Clariion。

 

4.通过管理口登陆存储,输入管理IP地址http:// <IP_address_ of _SP>。 管理端口为下图中的C口。D口有小扳手标签特别注明,为服务端口(Service LAN port)主要给EMC工程师维护使用,有固定的IP。

8.png

此时即可登陆存储更改配置、查看故障,或者收集存储日志SPcollects。

 

 

三. 某个部件损坏了但是机器过保了,该怎么办呢?

过保用户可以选择续保或者购买单次服务,进行维修。

1. 整台机器续保

可联系EMC售前热线咨询报价,或者直接联系熟悉的EMC销售。如果没有销售电话,可拨打EMC 800售后热线,技术支持工程师会根据您提供阵列的序列号SN,通知驻当地的客户代表。

2. 单次服务

可拨打EMC 800售后热线,并提供存储的序列号SN,和阵列的日志SPCollects,根据损坏备件评估单次服务的费用,其中包括远程诊断和现场维修两部分。

收集阵列日志SPcollects的详细步骤请参考如何使用SP Collect收集CLARiiON的SP日志以提高问题诊断的效率

Filter Blog

By date:
By tag: