Find Communities by: Category | Product

今天看到了一组很有趣的调查数字。

 

80% of companies say they deliver superior customer service. Only 8% of customers agree.

大概有80%的公司都宣称自己为客户提供了无与伦比的服务,但是只有8%的客户同意这个观点。

 

那么,到底是为什么让92%的客户都抱持“呵呵哒” 的态度哪?

因为我们经常自欺欺人,以为自己给的就是最好的,自己给的就是客户想要。

 

RPS作为服务客户的一线部门,一直以来致力于为客户提供专业的服务,以客户的满意度为依归。除了客户满意度调查外,在部门内还有定期更新的名人墙,更加直观地反映了客户对服务中点点滴滴的看法和感受。




下面为大家节选两段来看看客户是怎么评价RPS的服务的:

 

Summer & Ten - 今天他们所表现出的服务水平相当出色,每个人都很熟悉他们的分工,处理意料之外状况的流程非常迅速。

 

Mika - 即使是同样的升级工作,也让我们意识到了EMC的技术支持相比较这个世界上其他IT供应商而言是多么的专业。

 

大家就不要尝试寻找小编了,大多客户对小编的评价都是“腿很长”,“长得像宋仲基”,这样的评价扶不上墙啊。(宝宝心里苦,但宝宝不说〒_〒)

老司机又来了, 今天要讲的是VAAI。

 

 

Ensure all ESXi hosts attached to your array are VStorage API for Array Integration (VAAI) enabled

在EMC 最佳实践文档中要求启用VAAI以确保升级的顺利进行。

 

那么,VAAI是到底什么什么功能哪。

 

VAAI自ESXI/ESX4.1引入,提供硬件加速的功能。并不是所有存储都支持这项功能,但是XtremIO对这项功能进行了整合。如果想要XtremIO达到最优性能,就必须要启用VAAI。

 

下面我们就来看看如何启用VAAI。

 

第一步:选择“配置”

 

第二步:选择“软件”中的“高级设置”

 

第三步:选择“DataMover”,查看

DataMover.HardwareAcceleratedMove
DataMover.HardwareAcceleratedInit

1代表启用,0代表未启用

 

 

第四步:选择“VMFS3”,查看

VMFS3.HardwareAcceleratedLocking

1代表启用,0代表未启用

 

必须确保以上三项检查全都启用,即设置为“1”。

另外我们还可以通过命令行对其进行检查。

 

第一步:通过putty或者SecureCRT登录

 

第二步:分别运行以下三条命令

esxcli system settings advanced list -o /DataMover/HardwareAcceleratedMove
esxcli system settings advanced list -o /DataMover/HardwareAcceleratedInit
esxcli system settings advanced list -o /VMFS3/HardwareAcceleratedLocking

如果“Int Value" 为"1", 则表示启用

好了,关于VAAI的分享就到这里。

 

昨天有人@老司机,问老司机说自己腿长咋不上天哪。

今天老司机告诉你,学会了VAAI,上天都不算是事儿。

VAAI可以快的让你飞起来。

 

本文分享自XtremIO微信公众号

有一些人,你可能与他朝夕相对,但是你却从未真正了解他。

 

喜欢EMC是因为这里有着形形色色的人,来自于不同的国家,不同的行业,有着不同的背景,每个人都有自己的特点。如果你善于发现,每天都会有新鲜的故事。

 

今天又有和CE的故事可以讲,而且要比上期精彩多了。时间约在了晚上12点,地点是在锦江酒店,此情此景能做的事情实在不多啊,小编再清纯也要wu一次啦。

 

在故事开始之前,我们先来简单了解一下今天的主人公冰冰,他短短的却并未结束的传奇的一生足足可以写成两本大部头。

 

冰冰2006年大学毕业,拒绝了国内某知名互联网公司的offer。毅然决然地去了马来西亚留学,攻读MBA。在校期间,服务于马来西亚旅游局。而后进入马来西亚蓝海战略区域研究所担任研究员。学成归来之后,将自己的兴趣变为现实,下海经商,从事赛车配件贸易。再后来,为追寻真爱放弃事业,来到上海。如今加入EMC已将近两年,期间作为资深工程师被挑选参加XtremIO未对外公开的项目,成绩斐然。

 

好了,说回正题,今天看到冰冰明显憔悴了很多,下面就让他来亲述一下和CE的那一晚。

 

 


终于等到第二次去现场为客户升XtremIO的机会了,和蜥蜴(CE-现场工程师)约的时间提前到了晚上10点钟。心情有点小紧张。白天在办公室处理升级的同时,我也着手忙着准备各种资料。毕竟RPS日常的升级,都是通过远程完成,我们身边有大把资料可以利用,遇到问题还可以询问Senior的同事。但是到客户现场,就增加了许多不确定因素,要是遇到了问题,更多的就只能靠自己了。为此我把能想到的文档资料都整理好,并打印出来,以防万一。说来也巧,我叫徐鑫,同去的 CE叫金鑫,所以我们给这次的升级任务起了个名字—“鑫鑫相印”。


到了客户现场后,和客户稍微寒暄了一下,就着手开始升级了。客户当前的版本是4.0.1,1个X-Brick,要升到的版本是target code 4.0.2-80。在和客户确认了相关信息,回答了客户的问题后,我们就按着流程开始了升级。借着等待升级运行的时间,我和金工开始聊天,从而知道EMC的现场工程师原来也是要同时支持多个产品的,而且有时候他们一天最多要跑3-4个不同的客户,而且都位于上海的不同方位。金工在聊天中透露,他已经连续6个晚上都没回家吃过饭了,这让我深刻体会到做为现场工程师不容易。在升级过程中,客户会不时地询问我们升级到哪个步骤,是否有什么影响,我们都会一一给客户解答。

 

第一个SC(X1-SC2) 开始重启的时候,客户办公室立马就接到其他部门的电话,报告应用的性能下降了。在现场你能第一时间感受到,升级中的每一个变化对客户环境的影响,这是远程升级体会不到的。所以作为工程师的我们,肩上的责任是重大的!对于每一个细节,工程师都应当仔细查看,认真对待!因为升级中任何一个微小的变化,都有可能对客户的环境起到很大的变化。

 

升级终于在23点40分左右结束了,整体来说还算顺利。出了大楼,和金工依依不舍的挥手告别。分手了之后,走在空旷的马路上,感受着上海夜晚的丝丝凉意,心里却是暖暖的,或许这就是“鑫鑫相印”。

 

 

本篇文章是由XtremIO微信公众号特别提供。

RPS作为服务客户的一线团队,一直致力于为客户提供最佳的服务体验,也获得了国内外客户和协同部门的多方好评。在取得一些成绩的同时,我们也在努力对流程不断地进行优化。

 

基于大量的历史数据和分析,经过反复的讨论和验证,新的E2E 流程即将正式发布,今天我们就来看一看新的流程有哪些好处,又会给我们带来哪些改变。

 

 

 

新的E2E流程旨在对流程进行精简,对服务请求减少不必要的资源浪费,有效减少升级计划落地的时间。预计,采用新的流程之后,会减少80%因部门间协同所产生的问题,会降低50%与客户的反复沟通所产生的效率低下,同时对系统和资源的使用率会瘦身60%。

 

经过严格的调研和大量的数据,大约80%的请求均可遵循标准化升级计划。传统升级计划按照 “预约时间-健康检查-商讨计划-预约时间-实施升级”。现在,RPS通过预设升级计划,遵循”预设升级计划-健康检查-实施升级“,从而快速帮助客户推进升级计划,避免了因部门间协同不足所产生的计划迟滞,从而影响客户的体验。


 

 

在对流程进行变更时,对于客户需求的考量无疑是RPS放在首位的,一切的优化都是为了使客户能得到更好的服务,创立行业新的标杆。在新的流程下,会有来自于Upgrade Consultant Team的资深专家全程跟踪处理客户的升级计划。

 

客户将会有更多的机会与资深专家对升级计划来进行沟通,对日常使用中的问题进行释疑,而不仅仅局限于待升级的产品本身,诸如应用环境,工作负载等等也会纳入考量。针对特殊情况,专家将采取为客户量身定制的解决方案以满足升级计划的顺利实施,通过更好地来满足客户的需求,真正的做到End to End。

 

 

 

 

 

 

值得一提的是,RPS这次会从资深工程师中抽调精锐,组成Upgrade Consultant Team,全程负责升级计划的实施,包括但不限于完成预检,与客户讨论升级计划,以及升级计划的推进。这些工程师资历颇深, 同时支持多个产品,而且十分熟悉产品特性,能够在制定升级计划时充分考虑客户的要求及实际情况,从而做出最完善的规划。这些工程师都是RPS的宝贵财富,可谓是 Best of the Best,相信他们绝对会力争把RPS最好的一面展现给客户。

 

本篇文章摘自EMC XtremIO社区

我, 是XtremIO & Isilon GEO Lead -- Charles,同事们也会亲切的称呼我“袁老湿”。

 

(以下为本人亲述,小编代笔。)

 

如果说RPS是防患于未然的堤坝,那么Reactive Team就是堤坝出现漏洞之后的快速反应部队,总是能出现在最需要他们的地方。

 

这次很荣幸有机会在我们XtremIO Reactive Team轮岗,与Support Engineer共同经历难忘的一周里,学习到了很多知识,也看到了这些远程工程师最真实的一面。

 

XtremIO Reactive Team成立至今已经超过三年,成立之初从各个team抽调精英,由最初的4个人渐渐壮大,如今已经有20多位技术工程师,为XtremIO保驾护航。

 

第一天来到Reactive Team, Manager就贴心的为我安排了一位mentor,带我熟悉整的流程和日常工作。亚太区Reactive Team的服务时间为早上6点至下午2点,团队男女比例基本控制在1:1,正所谓男女搭配,干活不累。

 

按照计划,这几天我将主要负责响应一些来自兄弟部门包括RPS的服务请求,这样既能更好的融入Reactive Team的生活,也能更好的提高自己的技术。

 

 

其实,我们RPS平时也经常与Reactive Team打交道,向他们咨询一些专业的技术问题和解决方案。然而,只有当真正体验到了他们的工作,才知道他们他们另外的一面。一些兄弟部门的服务请求来得很突然,又需要在非常短的时间内作出响应以及进行初步的故障排查。这就要求我们的工程师有很强的multi-task的能力,往往要同时处理几个case。与此同时,可能还要承受来自各方的压力,客户总是希望问题能在最短的时间内得到最圆满的解决,而不经过缜密的排查就无法做出精确的判断,有少部分客户的不理解和催促也是可以想见的。这些能力只有在长期的工作中慢慢地积累,除此之外,别无他法。

 

在遇到一些疑难问题的时候,往往需要几位专家一起会诊,从而发现根源,解决问题。在这次轮值期间,也遇到了一些比较棘手的问题,在得到提高的同时,也深深得为Reactive Team同事们的专业知识所折服。

 

 

由于工作性质的原因,技术支持工程师都是跟着case走,很少能准时吃饭。午饭的时候经常分成两波,分别cover对方的case,吃饭也是速战速决。如果实在忙的支不开身,就把外卖拿到工位上解决,边工作边吃,一个午饭吃到下班也是经常有的事。

 

经过一个礼拜的轮岗,确实学习到了很多专业的知识,也有了自己的一些想法。最大的收获就是发现了一些RPS和Reactive Team之间的流程值得优化的地方,这也是这次轮岗的目的。

 

这次轮岗,可谓收获颇丰,也进一步认识到了我们可爱的Reactive Team的同事。在为客户圆满的解决一个又一个问题的背后,是他们所坚持的专业精神,只有融入了他们,才能深有体会。他们可能付出了很多,但是为了给客户提供最专业的服务,树立EMC的形象,无怨无悔。

 

作为两个部门之间的使者,衷心希望两个部门在今后的工作中齐心协力,为客户提供更好的服务,也深深的怀念那些陪我度过难忘一周的同事们。

Ensure all servers attached to your storage array have storage path management software, such as EMC PowerPath, that is correctly installed and configured for path failover. EMC recommends Round Robin path selection policy for XtremIO

 

相信大家在EMC 最佳实践文档中见过以上内容,简而言之,EMC推荐使用“Round Robin”作为NMP Policy以确保XtremIO升级的正常进行。

 

首先,我们来看看NMP到底是个啥玩意儿?

NMP =  Native Multipathing Plug-IN, 中文名为“本机多路径插件”。

其一共有三种模式,分别为 MRU,Fixed, Round Robin。

MRU (Most Recently Used): 最近使用策略,当系统启动后,第一个被发现可以工作的路径,如果不行,就一直试到好用的一条路径为止。当原路径恢复后也不会回切。适用于存储类型为Active/Passive主备模式。

Fixed: 固定策略,也是开机后的第一条可用路径,如果失效的链路恢复,会采取回切。适用于存储类型为Active/Active的模式。

Round Robin(RR):循环策略,以轮询的方式选择所有可用路径,这是最佳实践推荐的模式,但并不是所有存储都支持这种策略。

 

介绍完了NMP,我们就赶紧步入正题,一步一步来教你设置NMP。

 

第一步:选择“配置”

 

第二步:选择“存储器”

11.jpg

第三步:右键选择“属性”

22.jpg

第四步:选择“管理路径”

33.jpg

 

第五步:选择“循环”

 

以上,Round Robin已经设置完成,是不是很简单?那还等什么,赶快去教男神设置NMP吧。

 

今后还会定期推出老司机系列,所有内容都将会更新在首页“实战教程”中,敬请期待哦。

 

作者信息:

郑永亮(Derek Zhang)

亚太地区上海远程变更管理团队(Remote Proactive Team)升级工程师,负责XtremIO相关产品的升级工作。

原文出处: XtremIO社区  http://mp.weixin.qq.com/s?__biz=MzIwMTc5NzQzMw==&mid=2247483684&idx=1&sn=a957318e4fe75ab9cd2296cba18ba7f2&scene=1&srcid=0520b5JdiPv29BVZzp3c1fzP#rd

 

 

远程变更管理团队的日常工作,即是通过远程连接,如Webex或是EMC安全远程支持(ESRS)为客户进行服务,提供技术支持。

 

这次有幸能和现场工程师一起深入客户机房,体验一把onsite,现场经历远程协助的整个过程,现在想想都还有点小激动呢。

 

远程协助往往掌握着更多的资源,能更及时的对客户需求进行协同分析,调阅相关文档,从而制定解决方案。远程协助和现场协助都是本着EMC以客户为先,以服务至上的原则,确保客户能得到始终如一的优质服务。然而,不可否认的是在现场,往往要承受更多的压力。

 

此行前往现场,主要任务是对客户的XtremIO进行一次版本升级,客户的应用环境采用的是VNX+Vplex+XtremIO的解决方案。

 

这一次我的任务是帮助客户对远程协助进行更好的了解,对客户的疑问进行解答,整个升级工作仍将有资深工程师在远程进行通过Webex操控执行。在和客户的交流之中,客户对远程协助的好处也是深有感慨,并决定在近日上线ESRS的服务,这样就能与EMC的呼叫中心形成对接,全方位的7*24小时对设备进行监控,如发生报警,远程协助便能在第一时间对报警进行响应,排查故障。

 

每次升级之前,我们都会依循检查清单对客户环境进行验证,以期确保升级顺利进行,且对业务保持无中断。在预检结束之后,升级便在预约时间准时开始,整个升级过程都将由远程变更管理团队进行监控,并在每一个预设的检查点做出对当前任务的报告以及对下一步计划任务的概述,而客户将得到彻底解放。我不会告诉你在做升级的时候曾经有美国客户弹吉他给我们听,更多的则是会和我们的工程师聊文化,聊美食,聊音乐,甚至最后谈到人生理想,全程都无须费心。

 

升级结束之后,健康检查也显示一切正常,这时发生了一个小插曲,XtremIO的图形化管理界面XIO Client无法正常打开。这里也给大家科普一下,3.x到4.x作为跨版本的升级,图形化管理界面在升级后也有所改动,只需重新在浏览器中键入XMS IP地址,而后依照提示,便能重新打开管理界面。

 

由于客户的升级时间安排在非工作时间,升级结束已经是晚上10点了,忽然听得传来一声感慨“已经连续一个星期没回家吃晚饭了”,在这里也深深的感受到了现场工程师的不容易。

 

步出机房,这个美丽的城市华灯初上,一切似乎才刚刚开始。

 

 

 

 

作者信息:

郑水亮(Derek Zheng

亚太地区上海远程变更管理团队(Remote Proactive Team)升级工程师, 负责XtremIO相关产品的升级工作。

EMC Symmetrix系列是高端存储的一个重量级的产品,同时也是EMC最重要的产品之一。做为新一代的企业级存储,能为越来越多具有苛刻存储需求但资源有限的 IT组织和服务提供商提供高端虚拟存储功能。 symmetrix 总共有20多年历史, 一共有接近7代的产品线, 支持所有主流的操作系统.支持open systemmainframe.支持多种环境,具有非常强大的性能,扩张性和可用性. 1具体介绍了Symmtriex的发展历史。

Capture1.PNG.png

                           图1

Symmetrix VMAX作为 Symmetrix系列的最新成员,具有强大革新性的 Virtual Matrix Architecture横向扩展体系结构。VMAX提供了可扩展的性能、简化的管理与资源调配、自动分层、本地复制与远程复制,并且能够同时支持来自 VMware和其他供应商的数千个虚拟机。本文接下来将主要介绍Symmetrix VMAX独具特色的FAST(Fully Automated Storage Tiering)-- 全自动分层存储.

 

全自动分层存储简介

VMAX的自动存储分层(Fully Automated Storage Tier, FAST)的主要功能就是提升存储效率,同时通过减少昂贵存储设备的使用降低总体成本。它可以帮助将那些相对不常访问的数据由昂贵的固态硬盘或者光纤磁盘设备无缝迁移到相对廉价的SATA盘或者近线SAS盘上。

2.png

                                           图2

总的来说FAST 可以优化性能、成本和占用空间,使 IT 组织能够在较小的占用空间中更有效地管理更多信息。同时也能帮助企业降低电力和冷却成本、资金成本及运营成本。因此,与传统系统相比,它拥有更高的性能、更低的成本和更密集的占用空间。 通过 FAST,企业级闪存驱动器会帮助应用程序性能提高达 800%,并使串行高级技术附件 (SATA) 磁盘驱动器的成本降低高达 80%。


FAST基本工作原理

FAST是根据LUNSubLUN级别的负载情况,将访问频率高的数据迁移到高性能的磁盘,访问平率低的数据迁移到高容量的磁盘。FAST VP 主要由两部分组成:

  • Symmetrix微码:控制磁盘阵列各个部件的Enginuity存储操作环境的一部分。
  • FAST控制器:SP上运行的一项服务。

3.png

                        图3

FAST VP 处于激活状态下时,微码和FAST控制器会执行两套算法:

  • 智能分层算法(Intelligent Tiering Algorithm)主要是在FAST VP的控制下,利用sub-LUN的指标数据为需要迁移的数据选择适当的存储层。FAST VP会结合近期和远期参数统计数据,自动优化数据的读取功能,进而实现低成本的效益。总的来说智能分层算法就是一个数据移动请求的集合,并且这些请求最后都会被提交到VLUN VP 数据迁移引擎,实现最终的数据移动。分配合规算法主要是通过FAST策略里规定的最大使用容量,用来监测存储虚层中容量的使用情况
  • 分配合规算法(Allocation Compliance Algorithm)则由FAST控制器生成,通过微码并按照设定好的FAST策略来执行。

如图-3所示。智能分层算法利用微码收集到的指标数据,同时结合FAST控制器提供的运算结果,向Vlun VP数据移动引擎发出数据迁移的请求,然后根据数据存取频率的高低,将较的数据移到高速存储层,并将较不活跃的数据转移到低速存储层

由于追踪统计分析与数据迁移作业,都会消耗磁盘阵列控制器的资源,FAST VP为此专门提供预设操作功能,允许设定执行统计分析与数据迁移操作的时间区段,尽量避开数据存取的高峰时段。  比如可设定为只允许在晚上7点以后、或周五晚上到周日凌晨等下班时段,执行分析与迁移操作。

 

FAST VP 的配置

Symmetrix VMAX上运行FAST VP前,需要配置好:存储组, FAST 策略 以及虚拟池 VP Tiers);

  • 存储组是Symmetrix 逻辑卷的集合,通过关联相应的应用程序实施统一管理;
  • FAST 策略包含了一系列应用于一个或多个存储组的Tier使用规则;
  • 虚拟池 VP Tiers)包含了14个存储池以及RAID的保护类型;

FAST策略会收集每个Thin设备的LUNsub-LUN的统计数据。这个数据收集主要是由Symmetrix的微码在用户先前设定好的时间断执行。数据参数的收集则和Symmetrix的后端活动有关,因为这个涉及到服务器的I/O量。通过测定Symmetrix后端的I/O,进而判断数据的访问频率,这样FAST VP 就能够决定不同数据组里每个Thin设备的数据迁移。访问频率高的数据,会被移动高性能的磁盘(SSD),访问频率低的数据将被移到底层的低速存储。

4.png

                       图4

FAST VP 的运行模式 及常用命令

FAST VP 有两种运行模式,自动(Automatic)或者 关闭 Off)。自动模式下,系统会在预先设定好的时间段执行统计分析与迁移操作。关闭模式下,系统会继续收集统计分析数据,但是不会发生任何数据的迁移。

这里向大家介绍三条比较常用用于管理FAST VP SYMCLI命令:

symfast, symtier, and symsg

  • 建立一个存储组 “VP_ProdApp1”

symsg –sid 1849 create VP_ProdApp1

  • “VP_ProdApp1”存储组中添加存储设备:

symsg –sid 1849 -sg VP_ProdApp1 addall devs –range 100:104

  • 为保护类型为RAID5EDF创建一个虚拟池:

symtier –sid 1849 create –name RAID5_EFD_Tier –tgt_raid5 –tgt_prot 7+1 –technology EFD –vp –pool R5_EFD_Pool

 

  • 创建一个名为 Platinum 的策略

symfast -sid 1849 -fp create -name Platinum

  • FAST策略添加Tier,并设定25%的用量:

symfast -sid 1849 -fp -fp_name Platinum add -tier_name RAID5_EFD_Tier -max_sg_percent 25

  • 最后将存储组与策略关联:

symfast -sid 1849 -fp_name Platinum associate -sg VP_ProdApp1 -priority 2

 

客户可以根据上述SYMCLI命令来创建管理FAST VP

 

升级对FAST VP的影响


一般来说只要数据没有发生迁移,微码的升级是不会对FAST VP产生任何影响。作为升级工程师,在升级前,都会检查FAST VP当前的状态。在确定没有发生数据迁移的前提下,升级工程师都会先暂停FAST VP,等到升级结束后,在重新启用。

如果FAST VP正在执行数据迁移(如图-5所示),那么升级只能等到数据迁移结束后才能实施。因为这个时候升级会导致先前收集到的指标数据全部丢失,系统将无法判断数据的冷热程度,而且FAST VP将花费大量的时间需要重新开始收集指标数据。这些都会对阵列的性能造成一定的影响。数据迁移的时间由迁移数据量的大小来决定,一般是在24-48小时之间。

5.png

                                    图5

联系方式:

如果有意愿对您的Symmetrix阵列进行升级,请随时与RemoteProactive@emc.com 联系预约。

 

如果有任何问题请联系我们:

邮箱:RemoteProactive@emc.com

电话:+1-800-782-4362 x 6305555

网上在线支持: https://support.emc.com  Live chat


作者简介:

Steven Xu

DSC08518.JPG.jpg

亚太地区上海远程变更管理团队(Remote Proactive Team)升级工程师,熟悉Symmetrix基本工作原理,能够及时解决升级过程中出现的相关问题,并多次获得客户好评。目前主要负责Symmetrix, Isilon 和XtremIO产品的升级工作。

       Data MoverVNX nas端的一个硬件。它从存储后端读取数据,通过Ultraflex I/O技术给主机端提供数据访问,支持NFS, CIFSpNFS等协议。具有可扩展和冗余功能。

Data Mover故障切换/故障复原:此机制为系统备援能力的一种,当系统中其中一项设备失效而无法运作时,另一项设备即可自动接手原失效系统所执行的工作。

 

1.VNX Data Mover概况

1.png

  • 上图中的X-BladeData Mover
  • 一台VNX最多可以有8Data Mover,每个X-Blade Enclosure里面可以装2Data Mover
  • 可以把Data Mover看做是一个高性能高可用性的服务器
  • 用于连接数据和网络
  • VNX nas端的操作环境里,Failover(故障切换)不会影响使用性能
  • Data Mover支持热插拔操作
  • 支持多协议标签交换操作
  • Control Station(控制台)出现故障,不会影响Data Mover的正常
  • Data Mover内部没有磁盘

2. 如何辨别Data Mover类型

  • nas_server -list这条命令来显示Data Mover基本信息,如下:

    2.png

     其中type 1 代表 首选 Data Movertype 4 代表备用Data Mover

 

  • nas_server –a -i这条命令可以显示Data Mover的具体信息:

        3.png

3. Data Mover故障切换是如何实现的?

          4.PNG.png

  • 当首选Data Mover出现故障时,备用Data Mover会接替首选Data Mover的工作
  • 有些机型的Celerra只配了一个Data Mover,这种情况下,就无法实现故障切换功能了
  • Control Station(控制台)在这个过程中只起到监控作用

4. Data Mover故障切换机制

  当首选Data Mover出现故障无法正常工作时,会出现以下三种情况:

故障切换机制

概况

自动切换

立即启动备用Data Mover,接替首选Data Mover的工作

尝试复原

首先尝试修复首选Data Mover,如果修复失败,再激活备用Data Mover来接替首选Data Mover的工作

手动切换

手动重启来修复首选Data Mover,备用Data Mover维持原状

 

5. Data Mover 故障切换管理

 

server_standby等相关命令来管理Data Mover故障切换至备用Data Mover

下面是如何用命令行来手动切换备用Data Mover到首选Data Mover

5.png

6. RCM Data Mover故障切换/故障复原流程

 

  • Failover故障切换

 

  a.用nas_server –l显示Data Mover基本信息:

       6.png

  b.重启备用Data Mover (server_y代表备用data mover的名字)

       server_cpu server_y -reboot -monitor now

       7.png

c.用下面这条命令来查看备用Data Mover在重启后是否恢复正常,显示contacted说明正常,在显示contacted之前不要做其它操作。
      /nas/sbin/getreason

        8.png

d.切换首选Data Mover和备用Data Mover (server_x代表首选data mover名字)
      server_standby server_x -a mover

        9.png

e.首选Data Mover和备用Data Mover切换后,显示如下:

      nas_server -l

         10.png

 

  • Failback故障恢复 :

 

  a.切换之后,确保两个Data Mover都恢复contacted 状态

        /nas/sbin/getreason

       11.png

  b.故障恢复,将首选Data Mover恢复
       server_standby server_x -r mover

       12.png

  c.切换之后,确保两个Data Mover都恢复contacted 状态

       /nas/sbin/getreason

        13.png

  d.切换后,两个Data Mover恢复了最初的状态

        nas_server -l

         14.png

 

 

EMC 建议每个Data Mover最好配一个备用的Data Mover,那么在首选Data Mover出现问题时,备用Data Mover可以及时顶上去,确保主机端用户使用正常。

因此,备用的Data Mover配置要与首选Data Mover配置一样。



联系方式:

如果有意愿对您的 VNX 阵列进行升级,请随时与RemoteProactive@emc.com 联系预约。

 

如果有任何问题请联系我们:

邮箱:RemoteProactive@emc.com

电话:+1-800-782-4362 x 6305555

网上在线支持: https://support.emc.com  Live chat

 

作者简介:

16.png


陈郑燕(Zoe Chen

亚太地区上海远程变更管理团队(Remote Proactive Team)升级工程师, 负责VNX等相关产品的升级工作。


关于Isilon:

 

IsilonEMC公司提供的用于高容量存储,备份存档非结构型数据的横向扩展存储平台。通过节点的扩展,Isilon可以通过OneFS,向用户提供超过20PB的单文件系统。

每一个节点都有完整的硬件(包括中央处理器,内存,磁盘以及网络设备)当加入当前的阵列后,每一个节点都可以提升当前阵列的容量和性能,用户可以通过不同Node类型的搭配,获得性能与容量的平衡。


下图为不同存储节点类型的性能和容量的区别:

Isilon.png

Isilon主要用于下列应用环境: 生命科学, 保险金融行业,媒体娱乐,医疗行业,石油汽油行业。

 

 

远程变更团队简介:

Isilon远程变更团队主要负责Isilon的预检,时间安排以及升级相关工作。亚太地区上海远程变更团队的工作时间如下:

  1. 预约工程师: 周一至周五  0900 -- 1800
  2. 升级工程师: 周一到周日  0700 -- 1900

当收到用户提交的服务请求后,我们的预约工程师会联系客户协商预检时间,升级目标版本以及预检连接方式(上传日志文件,ESRSWebEx)

升级工程师对指定的阵列进行预检,以确保阵列符合升级的要求

升级工程师给出详细的升级安排计划,预约工程师会根据升级计划联系用户预约升级时间以及相关的细节。

升级流程

  • 升级当天,升级工程师将会通过预约时间半小时左右前进行预检或者发送WebEx链接。
  • 升级工程师会在升级开始之前对指定升级阵列进行升级前的必要健康检查,以排除会干扰升级的因素。
  • 升级时间根据不同的升级类型,以及当前机器的负载,各不相同。
  • 升级完成后,升级工程师会再进行一次健康检查,确保阵列在升级之后能够正常工作。

Isilon OneFS升级主要包括两种方式,滚动升级 和离线升级

滚动升级会比离线升级需要更多的时间。

  • 离线升级过程中,所有的节点会同时重启,所有客户端在重启过程中无法访问阵列,需要客户为升级准备宕机时间。
  • 滚动升级在升级过程中,一次只会重启一个节点,当前升级节点完成重启并加回阵列后,下一个节点才会开始重启。在滚动升级中,阵列中的其他节点对于客户端仍然是可以访问的,但是所有客户端在升级过程中还是会受到一定的影响, 可能出现下列的情况:
  1. 当客户端重新连接到其他在线的节点时,会有一定的延迟。
  2. SMB客户端不能自动重连到其他在线的节点,用户需要重新访问建立连接
  3. 如果你按照动态NFS客户端配置最佳建议,那么在升级过程中,NFS的客户端会自动重新连接到其他在线的节点。 (最佳建议配置具体可以参见https://support.emc.com/kb/90041 )

某些OneFS版本之间并不支持滚动升级,我们的升级工程师在预检的过程中会给出是否支持滚动升级,如有需要,也可以参见相关版本的版本说明来查看支持滚动升级的具体列表。

基于可能对客户端的影响,我们还是建议客户为滚动升级准备相应的维护窗口。


联系方式:

如果有意愿对您的 Isilon 阵列进行升级,请随时与RemoteProactive@emc.com 联系预约。

 

如果有任何问题请联系我们:

邮箱:RemoteProactive@emc.com

电话:+1-800-782-4362 x 6305555

网上在线支持: https://support.emc.com  Live chat

 

作者简介:

qi.jpg

戚惠斌(Mika Qi)

亚太地区上海远程变更管理团队(Remote Proactive Team)升级工程师, 负责Symmetrix,Isilon,XtremIOESRS产品的升级工作。

为什么升级

 

:    为什么要升级?(升级包含以下三个类型)

答:I.常规升级:

1. 因为新版本包含所有新功能

2.因为新版本包含最新漏洞解决方案,减少了DU/DL风险

3.因为升级让系统运行更稳定,升级优化了EMC产品使用价值;我们相信这也是EMC价值主张的一部分,让客户的系统与时俱进

    II.FCO:

1. FCO 是指Field Change Order(中文大概是指:现场变更通知)

2.FCOEMC未雨绸缪的项目:EMC方面发现产品存在某些问题并找到了解决方案,为避免此类问题将来在其它同类产品出现,特此先摄性的将所有受影响的客户列出,并为每个受影响的产品开一个SR(服务请求)提前来解决问题

    III.TSE:

1.TSE 是指 Trackable Service Event(中文大概是指:可追踪服务事件)

2.TSE类似于FCO,只是波及范围和影响没有FCO那么广,所有受TSE影响的客户名单也会列出,并开出相应的SR来跟踪解决

:    新版本的变化?

答:每个新版本代码内容有所不同,详情可参见support.emc.com 上的发行说明书。发行说明书有多种语言可选,可酌情选阅。

 

:    要升到最新版本还是EMC给的目标版本?

答:首先,要了解最新版本和EMC目标版本的区别。最新版本要通过工程部门内部审核才能成为EMC官方的“目标”版本。审核条件包括:安装过此版本代码的机器数量,系统安装后的最短运行时间,以及系统运行的稳定性

·      EMC给出的建议代码版本必须是目标版本及以上,以确保系统运行环境的稳定可靠

·      VNX现有的目标版本详情可参阅: https://support.emc.com/docu39695_Target-Revisions-and-Adoption-Rates.pdf?language=en_US

 

 

升级描述

 

:    升级时长?

答:下图是正常情况下VNX升级类型和大概时长:

 

升级类型

升级时长(小时)

File OE Upgrade

3

Block OE Upgrade

3-4

Unified OE Upgrade

6-8

Drive Firmware Upgrade with vault drives

6

Drive Firmware Upgrade without vault drives

2

 

Block OE升级在R33 P074版本之后,LCC(链路控制卡)上的FRUMON更新要花更长的时间,因此整个升级时长比正常的升级时长会更久一些。

:    升级主要步骤?

答:下图是File升级的主要步骤:

 

Capture4.PNG

 

下图是block升级的主要步骤:

顺序

步骤

时长(分钟)

  1. 1.

给SPB安装软件

20

  1. 2.

重启SPB

20

  1. 3.

等待SPB重启成功后接收输入输出请求(也叫NDU 延迟), SPB接收SPA的工作

默认6分钟

  1. 4.

给SPA安装软件

20

  1. 5.

重启SPA

20

  1. 6.

提交新代码 & 升级后机器检查

30-45

 

:    升级中是否当机? 当机多久?

:1.VNX File升级在Data mover重启时会有2-4分钟的当机时间

  2.Control station VNX File升级过程中可能不能正常运作

    3.VNX Block升级时,只要主机端配置得当,不会有当机发生(升级过程中,两个SP会逐一重启,在一个SP重启的时候,另一个SP会承担两个SP的所有工作)

 

:    升级前的准备?

答:详情可参照KB https://support.emc.com/kb/88321 包含了VNX, Celerra, Clariion三种类型机器升级前的准备事项

      参照多功能电子阅读导航https://elabnavigator.emc.com/eln/elnhome ,里面包含了EMC 所支持的矩阵,能帮助用户做一些升级前的兼容性

      查询根据升级时远程连接的不同,升级前的准备工作也会有细微的差别:

     

      I.使用EMC安全远程服务,即EMC Secure Remote Services (ESRS):

            1.确保ESRS连接正常

       2.如果ESRS需要用户授权后才能连接,请提供相关的授权流程

       3.升级开始前是否需要用户同意

    收集新的日志文件并传到SR上,以便EMC对机器做升级前的体检(如果用户可以提供用户名密码等信息,EMC也可以帮用户收集日志文件)

    事先提供用户名和密码

    File 升级需要的密码包括: nasadmin /root 密码

    Block 升级需要的密码是: Unisphere 用户名和密码

 

          II.Webex:

           准备一台可以连外网的电脑,同时这台电脑要能管理EMC产品,在电脑上安装下面软件:

         1.Putty

         2.WinScp

         3.最新版本的Unisphere Service Manager USM

     4.事先下载升级目标版本代码,供升级使用,同时也能确保升级能在设定的时间开始。EMC方面会在升级前把下载代码的链接发给用户

 

:    什么是ESRSESRS的优势?

 

答: 如果用户是第一次听说ESRS,那么可以通过下面的视频来了解    ESRShttps://community.emc.com/videos/35958

如果用户尚未使用ESRS,但是有意向使用,可以联系相关的客服代表进行ESRS配置。EMC会为用户进行个性化的设计,以便用户能更好的管理EMC产品环境。

 

:    如何收集日志文件?

答: VNX Block 升级, 需要SPCOLLECT日志文件,来给机器做升级前的体检,以确保升级前机器是正常运作的。如何收集SPCOLLECT日志文件,可参照KB https://support.emc.com/kb/166023

 

:    在线升级的条件?

答:取保所有的主机端同时连接SPA/SPB,确保多路径软件的兼容性以及是否配置得当。

 

:      系统中微代码版本的查询?

答:1.VNX File OE 代码版本查询步骤:

o     I.SSH control station,切换成root用户

o    II. ’nas_version’ 命令,显示nas代码版本

o       示图 :

         Capture1.PNG

 

          2.VNX Block OE版本查询步骤:

           I.  SSH control station,切换到root 用户

     II. ’ /nas/sbin/navicli -h <IP Address of SPA> ndu –list’, 最底端会显示block代码版本

        示图:

       Capture2.PNG

 

也可登录Unisphere上查看block代码版本

 

 

 

 

风险控制

 

:    升级失败后是否有回滚措施?

答: 升级失败后的回滚措施要视不同情况而定。

       1. File 升级时,在主control station重启之前,用户想要回滚,那么可以终止升级,清理升级残留文件

       2. Block 升级时,如果用户在提交代码前想要回滚,可以通过NDU命令来撤销代码。如果在提交代码后用户要求回滚,那么需要在SP上进行

   软映像

 

:    升级后对客户环境的影响?

答:除非有明确的说明,一般来说代码版本应该都是向后兼容的。

    请在升级前阅读https://elabnavigator.emc.com/eln/elnhome 上的SIMPLE SUPPORT MATRICES 文章,确认所有连在VNX上的其他设备,是否在升级后也能互相兼容。

 

:    升级中碰到的问题多久能解决?

答:在升级过程中出现DU/DL情况,我们会即时开S1support

       升级结束后,如果有硬件问题,我们会开S2,让相关部门上门派遣硬件更换

    SR的解决时间,取决于用户和EMC的合同类型,详情参照下表:

 

SR的严重性和EMC的反馈时间:

Capture5.PNG

请参照下表,EMC跟进SR时间对照表

工作时间周一-周五 8-5pm (当地时间)

Capture.PNG

 

:    多台VNX升级的顺序?

答: 如果有多台VNX需要升级,我们建议先升灾难恢复站的机器,再升生产环境的机器。只要升级后检查没发现问题,那么下一台VNX可以接着做升级,不需要等一个星期后再升。

 

Question:    同一数据中心多台设备升级顺序?

答:如果要升级的设备不受ETA影响,那么设备升级的先后顺序无所谓,但是一次只能升一台设备,即一台一台的升。如果要升级的设备受ETA影响,我们建议按照相关的ETA要求来安排设备的先后升级顺序

 

联系方式:

如果有意愿对您的 VNX 阵列进行升级,请随时与RemoteProactive@emc.com 联系预约。

 

如果有任何问题请联系我们:

邮箱:RemoteProactive@emc.com

电话:+1-800-782-4362 x 6305555

网上在线支持: https://support.emc.com  Live chat

 

作者简介:

VPLEX 5.png

陈郑燕(Zoe Chen

亚太地区上海远程变更管理团队(Remote Proactive Team)升级工程师,负责VNX等相关产品的升级工作。

远程变更管理VPLEX团队主要职责:

 

目前来说我们团队主要负责VPLEX产品的版本升级及升级前的准备工作亚太地区上海远程变更管理团队的工作时间是从早上到7点到晚上7点,如果升级没有在这段时间内完成,我们会交给其他地区(爱尔兰,埃及或美国)的同事继续完成,总体来说,我们支持全球7*24小时服务。

 

vplex.png

 

VPLEX升级介绍:

vplex1.png

 

                                             VPLEX产品系列

 

VPLEX升级与其他产品的主要区别之一是升级前必须有CCA 的批准,批准之后的有效期为一个月,升级开始的时间必须是在有效期之内。目前,我们团队已经可以负责CCA的审批工作,如有需要咨询审批流程相关问题可随时与我们联系。

目前我们支持升级版本从5.15.5不等,对于VS2的产品来说,可支持跨版本升级,比如从5.1P4升到5.4SP1P3也是可以的;如果是VS1的产品,如当前版本是5.1P3, 那么需要先升至中间版本5.2SP1及其更高版本, 再升到最终版本5.4SP1P3. 关于不同跨度版本之间的升级是否可以进行,首先可以参考已经审批的CCA,升级工程师在进行每一台VPLEX的升级之前都需要仔细地阅读CCA Email的内容以及建议。其次,可通过release notes查询相应版本升级通道信息。

关于升级时间,我们最近有更新。不再取决于升级版本。目前安排两种类型的升级,一类是标准的升级,时间是3小时;另一由于涉及管理控制台(management server)reimage 的过程。时间会在5小时。

 

VPLEX升级前准备工作:

 

1.CE需提前提交VPLEX CCA只有得到CCA approval之后, 我们才能帮客户安排升级。

2. 如果是WebEx的升级,客户或CE需要提前根据目标版本下载升级安装包。

3.VPLEX CCA approval之后,客户需要仔细阅读CCA邮件中涉及的问题及注意事项,尤其是有些issues需要在升级之前解决,以免造成升级延误。有些issue客户无法解决的,可以提交FSS解决。这里需要指出的是,升级之前的issue主要由field团队解决,升级开始之后出现的issueremote团队(VPLEX Support)解决。

4.如果因CCA提及的问题未能及时解决,超过一个月的CCA有效期,那么CE需要重新协助客户提交CCA以获得新的审批,新的CCA有效期仍为1个月。

 

VPLEX升级流程:

 

1. 1.关于ESRS连接类型,升级工程师一般会提前1天或1小时做健康检查, 同时对照CCA Email,如发现问题,会提前邮件通知客户或CE,并给予适当的建议,附上相关解决的KB文档等。

2. 2.如果是WebEx升级,工程师一般会提前半小时发WebEx链接给到客户,等客户加入后,开始做健康检查,同样发现问题会及时告知客户或CE,以确保升级正常进行。

3. 3.升级开始后,整个升级是线上进行,不存在downtime,首先进行management server的升级,然后是director的升级(也称为NDU)。升级进行中,management serverdirector都会进行重启,对于跨版本升级来说,每个management server会重启2次,NDU的过程相同。

4. 4.当整个升级结束后,工程师会查看VPLEX的健康状态并提醒客户测试升级后的状况,以确保VPLEX在升级之后能正常运行。

 

联系方式:

 

如果有意愿对您的 VPLEX 阵列进行升级,请随时与RemoteProactive@emc.com 联系预约。

 

如果有任何问题请联系我们:

邮箱:RemoteProactive@emc.com

电话:+1-800-782-4362 x 6305555

网上在线支持: https://support.emc.com  Live chat

 

作者简介:

 

陈欢玲(Varonica Chen

vplex3.png

亚太地区上海远程变更管理团队(Remote Proactive Team)升级工程师,负责VPLEX升级及CCA Approval.

XtremIO介绍:

 

VNX,VMAX,ISILON 等混合阵列不同,XtremIO是全闪存阵列,主要应用环境为VDI,虚拟机和数据库。

2015年5月5日,EMC 全球大会上, EMC宣布推出XtremIO™ 4.0。

XtremIO 4.0被业界称为“野兽”, 采用XtremIO突破性的横向扩展架构,提供40TB X-Brick基本构件以及多达8个40TB X-Brick配置,密度比之前的XtremIO系统提高一倍多。XtremIO 4.0的非中断性能及容量扩展可自动再平衡数据,保持一致和可预测的亚毫秒级性能。

对现有的XtremIO v3.X阵列,EMC将提供免费的无中断软件升级

 

XtremIO系列产品自一年半以前上市以来,现已成长为EMC历史上销售最快的产品,也是全闪存阵列所占市场份额最多的产品。

 

在我们熟悉的Gartner固态存储魔力象限中, EMC XtremIO也位居领导者地位。

1.png

在我们熟悉的Gartner固态存储魔力象限中, EMC XtremIO也位居领导者地位。

2.png

这也是为什么EMC之前敢于发起“XtremIO 100万美金担保(XtremIO $1Million Guarantee)”的活动,EMC宣布第一个能够证明XtremIO存储系统联机的数据服务出现了关闭(switch off)、降速(throttled back)、后处理(post-processed)或者减低优先级(deprioritized)现象的用户,就可以免费获得100万美金的奖金。

 

 

远程变更管理XtremIO团队主要职责:

XtremIO团队主要负责XtremIO系列产品的版本升级以及升级的前期准备工作。亚太地区上海远程变更管理团队的工作时间统一为早上7点到晚上7点。

XtremIO 4.0已于近日发布,远程变更管理团队也将与近期接手XtremIO 4.0 的升级工作。

 

XtremIO升级介绍:

目前远程变更管理团队接受 XtremIO 2.x 版本内的升级以及XtremIO 3.0 版本内的升级.

暂不接受XtremIO 2.x 到XtremIO 3.x的跨版本升级。

将于近日开始接手XtremIO 3.x 至 XtremIO 4.x的升级。

 

 

 

XtremIO升级前准备介绍:

1.  预检工程师将会与客户协商升级日期、指定版本及升级连线方式(ESRS或Webex)等细节。

2.  预检工程师将会对指定升级阵列进行预检,以确保阵列符合升级要求。

3.  预检工程师将会安排指定升级代码上传至指定阵列等待升级。

 

XtremIO升级流程介绍:

1.  升级当天,升级工程师将会按照客户意愿通过ESRS或者Webex连接至指定升级阵列。

2.  升级工程师会在升级开始之前对指定升级阵列进行升级前的必要健康检查,以排除会干扰升级的因素。

3.  开始升级,目前远程变更管理团队所支持的升级全部为线上升级,不会产生宕机时间。

4.  升级过程中会分为两部分,先是XtremAPP升级而后是OS 的升级,会对XMS 和 Storage Controller逐一进行重启。

5.  升级结束后,升级工程师将会对升级阵列再做一次健康检查,以确保阵列能在升级之后正常工作。

 

 

联系方式:

如果有意愿对您的XtremIO阵列进行升级,请随时与RemoteProactive@emc.com 联系预约。

 

如果有任何问题请联系我们:

邮箱:RemoteProactive@emc.com

电话:+1-800-782-4362 x 6305555

网上在线支持: https://support.emc.com  Live chat

 

作者简介:

3.jpg

郑水亮(Derek Zheng

亚太地区上海远程变更管理团队(Remote Proactive Team)升级工程师, 负责XtremIO相关产品的升级工作。

主动拷贝简介:

PACO的全称是Proactive Copy。这个功能会让磁盘主动的把数据拷贝到热备盘,这是根据磁盘上现有的介质错误数量来触发的,而不是等到磁盘坏了才去拷贝。PACO降低了两个坏盘同时存在的可能性,因为拷贝的盘并不是坏盘,而是我们判断它即将要坏的盘。如果一个RAID组里面的盘在主动拷贝的时候坏了,那我们依然可以通过RAID组里其他盘来计算出坏盘上面的数据。更加有弹(Resilient)的PACO功能我们称之为PACO-R。它比PACO更能降低两个以上坏盘的可能性,会比PACO允许更多的数据拷贝。EMC议所有客户都升级PACO-R,尤其是带有Viper-C磁盘的机柜

disk.jpg

 

关于PACO

自从200612月,我们就可以将磁盘主动拷贝到热备盘来将一块磁盘换掉。在此之前我们是只能将物理磁盘移除来强制重建一块盘,在重建的过程中,整个RAID组是存在风险的。那PACO在主动拷贝到热备盘的时候就有3个主要的优点:

  1. 避免了重建过程中由于介质错误导致的不可修复的磁盘错误。
  2. 极大的降低了一个RAID组有两款坏盘或者出于危险期的可能。
  3. 性能改善拷贝到热备盘的过程是比正常的重建过程块很多的。


拷贝到热备盘是怎样工作的?

第一步就是将我们要换掉的磁盘的所有数据拷贝到一个空闲的热备盘里。在此过程中,机柜会显示为转换(transitioning)状态。所有的数据拷贝完成以后,磁盘就会被断电,显示成已坏磁盘。然后我们可以安全地将磁盘换掉,一个均衡(equalization)过程就会开始。热备盘的数据会被拷贝到新替换上的磁盘里。机器又会显示为转换状态。当均衡过程结束后,热备盘会再次进入到空闲状态。当我们要换的盘正在拷贝到热备盘中的时候,这块磁盘还是保持I/O的。在它维持I/O的时候,如果遇到因介质错误引起的扇区内读写问题,会尝试重映射此扇区。如果一块磁盘在拷贝到热备盘的时候持续报告介质错误并且达到了坏盘的极限,那这块盘将停止PACO,重建(rebuild)过程将会继续到热备盘。如果在重建过程中RAID组里另外一块盘又坏了,那就是一个RAID组里坏了两块磁盘,这将导致DU或者DL


PACO-R

更有弹力的(Resilient),适应能力更光的PACO称之为PACO-R。如果一个磁盘在持续报告介质错误以后,磁盘并不会被认定为坏盘(其它条件的错误仍有可能导致此磁盘被认定为坏盘),拷贝到热备盘的过程会继续。这样就在拷贝到热备盘之前阻止了在一个RAID组里面发生两块坏盘。这个改变可能会让客户感觉到写入LUN时的性能偏低,但这是为了阻止RAID组里双坏盘所付出的代价。

EMC针对日前日立600G磁盘漏洞,在VNX机型上向客户提供PACO-R的安装,PACO-R所兼容的版本为VNX Block OE R32 P209, R32 P215, R32 P217。在R32 P217R32 P218里,PACO-R已经是启用的状态。

 

如何安装PACO-R

目前我们有最为简便的ndu文件可以直接安装PACO-R,它可以用USM来安装,或者利用Control StationCLI来安装。的整个过程仅持续2-3分钟(不含升级后检查时间),而且是没有任何宕机时间的。目前我们Remote Proactive也支持PACO-R的安装,如果您有需要,请随时与 RemoteProactive@emc.com 联系来预约安装PACO-R

 

如果有任何问题请联系我们:

邮箱:RemoteProactive@emc.com

电话:+1-800-782-4362 x 6305555

网上在线支持: https://support.emc.com  Live chat

 

作者简介:

329bd81.jpg

崔超(Clear Cui

来自Remote Proactive团队,负责的产品有VNXVNXeCenteraESRS。经验丰富,是优秀的升级工程师。多次获得客户的好评。

远程变更管理RP团队主要职责:

 

目前来说我们团队主要提供RecoverPoint产品的版本升级以及升级前的准备工作。亚太地区上海远程变更管理团队的工作时间是从早上到7点到晚上7点,如果升级没有在这段时间内完成,我们会交给其他地区的同事继续完成。

由于RP版本实现了与Vplex的整合,目前越来越多的公司希望将他们的RP升到新版本并与Vplex搭配使用。

rp.png

RP升级介绍:

 

我们现在最新的RP版本是4.1.SP1.P1,对 RP升级来说,需要注意RP是不能跳级升级的,举个简单的例子,如果当前版本是3.4,而客户想升级到4.1的版本,我们是不能直接用4.1的升级包直接将RP3.4升到4.1的。我们必须先将RP3.4升到3.5,再从3.5升到4.0,最后从4.0升到4.1.整个过程实际上包括了3次版本升级。

RP4.1以前的升级都是两个站点的RPA同时升级的,每个版本的升级只需要一次升级即可。但是从RP4.1开始,我们必须对每个站点分开来升,也就意味着我们完成了A站点的升级后,我们需要再跑一遍相同的升级过程来完成B站点的升级,对应的升级时间也更长。

RP的升级时间主要是依据每个站点的RPA数量。如果整个升级过程很顺利,以最低每个站点2RPA来说,每一次版本升级最少需要3个小时,随着RPA数量的增加升级时间递增。

由于RP的升级都是通过deployment manager这个工具来完成的,这个工具是无法通过ESRS来实现的,所以RP的远程升级只支持WebEX

RP升级来说理论上是non-distributive的,如果升级过程出现了问题,我们会将问题esclate到我们的RP support team 他们会 帮我们尽快解决问题。

 

RP升级前准备工作:

 

RP升级来说,我们需要提交对应的RP CCA,只有得到RP CCA  approval后,我们才能帮客户安排升级时间。对于L4的客户,我们远程变更团队会帮忙提交CCA并安排升级时间,而其他的客户将由CE直接帮客户提交CCA并帮客户安排升级时间。

在升级之前客户需要预先下好版本的升级包和deployment manager工具,由于Deployment manager需要7.0版本的java才能运行,所以升级之前客户最好在他的机器上把java7.0装上。

在升级之前,要帮客户提前申请向license team申请对应的license。每个版本需要安装什么样的license,都会在CCA approval的邮件里标明。所以当你的CCA approval之后,要仔细阅读CCA Approval的邮件,里面有升级需要注意的事项和升级前有哪些问题需要提前解决,否则将会导致升级失败而推迟升级。

 

RP升级流程:

 

1. 升级当天,工程师会将WebEx远程会话以邮件形式发给客户等待客户进入

2. 客户进入之后,工程师会做一次健康检查以保证升级正常进行

3. 运行deployment manager,根据这个工具将必要的信息输入,然后一步一步的进行,这个工具会再做一次健康检查并最终开始升级过程。

4. 升级开始后,整个升级过程是个线上升级,在对每个RPA升级完成后会将每个RPA重启一次。

5. 当整个升级结束后,工程师会查看下RP的健康状态并让客户简单测试下,以确保RP正常运行。

 

曹 璐(Cambrian Cao)

Senior Technical Support Engineer


如果有任何问题请联系我们:

邮箱:RemoteProactive@emc.com

电话:+1-800-782-4362 x 6305555

网上在线支持: https://support.emc.com  Live chat

Filter Blog

By date:
By tag: