故障率やDisk交換が増えてきたというお問合せに関する回答

Storage製品をご利用になられているお客様が導入後数年経ってきますと稀にEMC製品のDisk交換の頻度が最近多いのではないか? 障害発生率はどのくらいなものなのか? その他にもDTA(ETA)やFCOといったコードの不具合情報に対して、その不具合の発生率はどのくらいあるのか?と言った質問がございます。

 

一般的にDELL-EMCのサポートから回答できる内容は以下の通りです。

◆Disk Drive(SSD含む)交換頻度について

ストレージ製品という性質上、経年劣化は免れないことではございますが、DELL-EMC製品に関してはDisk Driveのファームウェア及びOE(Operating Enviroment)の提供ならびに、アップデートを推奨させていただいております。

DELL-EMC製品のDisk Driveは実際に障害・故障となる前に予防保守・交換を強く意識しており、重大な障害を未然に防ぐことに重きを置いている側面がございます。

Disk Drive Faultとして検知をする閾値基準や予見的な検知・制御によって交換必要対象としてアラートを上げ重大な障害を引き起こす事前に予防交換対応を促進しています。 ※閾値レベルや予見的検知のロジック等は社外公開されていません。

従て、お客様のシステムの構成台数にも関係しますが、稼働時間に応じて交換件数が多いと感じられる場合がございます。

 

しかしながら、製品の最新ファームウェア・OEにアップデートを行っていく事によって、より適切に各パーツに対する制御することで予見検知・制御が改善され、結果的にディスクがストレージ装置から障害として切り離される可能性をより小さくすることが可能となります。

上記をご理解・ご了承いただいた上、定期的なファームウェアアップデートならびに、OEアップグレードを強く推奨しております。

 

 

◆発生率について

FCOやDTA(ETA)となっている事象がお客様の利用されている環境で発生する可能性があるのか、どのくらいの発生頻度があるのか、過去にDELL-EMCとして全世界・国内の導入台数からして何件発生しているのか?と言った情報によってアップグレードをする・しないを判断する基準にされてたいご意向があるのかと存じます。 

 

しかしながら、DELL-EMCでは発生率や導入台数を公開することはしておりません。また、発生率の話になりますと、母数をどのレベルまでの絞り込みをするのかによって異なってきます。稼働しているバージョン、稼働経過時間、システム構成、設置場所環境、アクセス頻度等によって異なってきます。そのため、お客様に対して曖昧な回答をすることもできないわけです。従って、サポートにお問合せをされましてもご期待される回答を提供することは基本的にできません。しいて言うならば、100%でも0%でも無いという事になります。

システム運用者としては、現状特に問題が発生していないのにアップグレードの調整の工数や関連するシステムの依存性確認といった工数をかけたくないという考えも非常に理解できます。但しシステムの安定稼働を求められる責務においては常にリスクヘッジをする観点でもFCOやDTA(ETA)で公開されている不具合については速やかに適応調整をすることを強く推奨いたします。

 

また、Codeに関連する不具合が発生した場合は事象復旧までのサポートは対応されますが、原因究明が必要となった場合は推奨バージョンにアップグレードをしていただく案内のみの回答となります。 推奨バージョンで事象再現された場合においては原因究明を行います。 

 

なおDELL-EMCではサポートオプションに準じてRemoteによるアップグレードを提供しております。アップグレード作業に関してはこちら:https://community.emc.com/docs/DOC-57676ご参考ください。

 

DTA(ETA)とFCOについてはこちらご参考ください。

DTA(ETA) https://community.emc.com/message/699364

FCO https://community.emc.com/message/1004614