もしVCSAが突然使えなくなったらどうしますか?

 

VCSAがDownした場合はvMotionやvSANに関するオペレーションができなくなるか、かなり制限されます。

またHorizon環境ではVDIに接続できなくなったりするので被害が甚大になる場合があります。

 

この世の中に100%の可用性を保証するストレージは存在せず、VxRail(vSAN)も例外ではありません。

したがって、VCSAに限らず、失われたら困るデータやVMは必ずバックアップを取る必要があります。

 

しかしながら、バックアップは取ってはいるものの、いざリストアが必要になったときに手順がわからないといった不安や、

ベンダーの提供する手順書通りにリストアできない!といったトラブルはバックアップあるあるだと思います。

 

VxRail環境においてもきっと例外ではないでしょう。

 

VxRail環境では多くのユーザーでVDPによるバックアップをしていますが、特にVCSA/PSCのリストアをする際に以下の想定外に直面することになります。

 

  1. VDPでVMをリストアする際にvCenterが必要なのでVCSA/PSCがない状態では、そもそもVMをリストアできない
  2. VxRailは分散仮想スイッチしかないのでリストアしたVM(VCSA/PSC)をネットワークに接続するにはVCSA/PSCが必要
  3. リストア後にVxRail Manager の内部DBの情報と齟齬が生じる

 

 

1つ目と2つ目は要するにVDPやVDSの観点でそもそもVCSA/PSCに依存しているため、金庫に鍵を閉じ込めたような状態になるわけです。

かといって、VCSA/PSCは重要なVMであり、リストアできませんでは話になりません。


3つ目はVxRail固有の問題とはなりますが、通常運用時は問題にならず、Upgradeや構成変更の際に顕在化することがあるのでリストア後に追加の対処が必要です。

ではどのようにしてこの矛盾を解決すればいいでしょうか?

 

1つ目の問題について

1については簡単です。というのもすでにVDPにはその機能があります。

EmergencyRestoreと呼ばれる機能で、vCenterがない状態でもESXiに直接VMをリストアできる機能です。

この機能があるのでVCSA/PSCに問題が発生したとしてもVDPが生きていればリストアが可能です。

 

詳細は下記VDP管理者ガイドに譲りますが概要としては以下です。

    1. VDP GUIにログイン
    2. Emergency Restoreのタブに移動し、VDPが稼働しているESXiを確認
    3. 上記ESXiのGUIにログインして「vCenterからの切断」を実施
    4. VDP GUIのEmergency Restoreタブから上記ESXiにVCSA/PSCのリストアを実行
    5. リストア後、VCSA/PSCを起動して後に上記ESXiをvCenterに再接続する

 

VDP管理者ガイド

https://docs.vmware.com/en/VMware-vSphere/6.5/vmware-data-protection-administration-guide-61.pdf

 

上記ドキュメントだけでは不安(英語だし。。。)というユーザは有事の際はDell EMCサポートにご相談下さい。

通常、リストア作業はユーザ作業範疇ですがDell EMCのVxRailサポートは旧EMCのエンタープライズサポート文化を継承しているので、より踏み込んだサポートを提供していると自負しています。

また以下のDECNブログでも詳しく説明されています。

 

VxRail 管理系VMのバックアップ・リストア方法【リストア・復旧編】

 

 

VDP以外のバックアップソリューションを利用している場合は必ずVCSA/PSCへの対応状況を確認してください。

一部のバックアップソリューションはVCSA/PSCのリストアができない場合があります。

 

 

2つ目の問題について

2つ目の問題についてはどうでしょうか?

VDPの機能でVCSA/PSC VMをリストアした場合、リストアしたVMは新規VMということになりますが、新規VMのネットワークを設定する場合はVCSA/PSCが必要になります。

そのため、リストアしたVCSA/PSCは仮想スイッチに接続することができず、そのままでは役に立ちません。

この問題の解決方法として以下が考えられます。

 

    1. 事前に短期ポート(Ephemeral Port)を作成しておく
    2. 一時的に標準仮想スイッチを作成し、vmnicの一つを割り当てる(冗長性の低下が発生)
    3. VxRail Manager VMのポートを借りてネットワークに接続する

 

1の方法は短期ポート(短期バインド)とよばれる、VDS上のポートグループでありながらESXiのみで管理可能なポートになります。※短期ポート(短期バインド)の説明(https://kb.vmware.com/s/article/1022312?lang=ja

ただし、短期ポートの作成自体はVCSA/PSCが必要なため、復旧用に事前に作成しておく必要があります。

※作成する短期ポートのポートグループは既存のvCenterネットワークポートグループと同様のVLANを設定し、IPの変更なくESXiと疎通できる必要があります。

事前に作成さえしておけば、この方法が最も簡単なリストア方法になります。

やり方としては、Emergency RestoreでVCSA/PSC VMをリストアしたのちに対象のESXiのGUIにログインして、短期ポートとして作成しておいたポートグループをアサインするだけです。

 

2の方法は既存VDSに割り当てられているvmnicの一つを引っぺがして、新しく作った標準仮想スイッチに割り当てなおすことで、VCSA/PSCなしで新規VMを外部ネットワークと疎通させることができます。

この方法はすでにご紹介済みのDECNブログで説明されていますのでそちらをご参照ください。

VxRail 管理系VMのバックアップ・リストア方法【リストア・復旧編】

 

 

3の方法は既存のVMから作成済みの分散仮想スイッチポートを借用する方法です。

要するに既存の接続済み仮想マシンに成りすまして分散仮想スイッチのポートグループに接続してしまう、という方法です。

この方法はDell EMC KB#504380にて説明されている方法です。

犠牲となるVMはVxRail Managerでなくとも、vCenterと同じポートグループに接続されているVMであれば構いません。

Shutdownする必要があるので、業務影響のないVMを選んでください。

古いVCSA/PSCのポートを借用可能であればそれを流用して構いません。

詳細は上記KBに譲りますが、概要は以下です。

 

    1. VxRail Manager VMをShutdownする
    2. VxRail Managerのvmxファイルからdvs.portIdとdvs.connectedIdをメモする
    3. リストア済み(ネットワーク未接続)のVCSA VMをShutdownする
    4. リストア済みVCSAのvmxファイルを編集してdvs.portIdとdvs.connectedIdをVxRail Manager VMのものと書き換える
    5. VCSA VMを起動する
    6. 起動後VCSA VMを別のHostにvMotionする。vMotionすることでdvs.portId情報が更新されます。
    7. VxRail Manager VMを起動する


 

3つ目の問題について

3つ目の問題はVCSA/PSCのリストア後に発生する問題です。

VxRail Managerでは内部DBにVCSA/PSCのuuidとmorefIdを保存していますが、VCSA/PSCをリストアすることでその値が変わってしまうため、内部DB側も編集してあげる必要があります。

この作業はDell EMCサポートにて実施すべきものなので、リストア後はDell EMCサポート窓口にご連絡ください。

なお、VxRail Manager の内部DBの値が実際のUUID/MorefIDと異なっていたとしても、業務影響はありませんのでご安心ください。

即座に対処する必要はありませんが、将来的にUpgradeや構成変更時にVxRail ManagerがVCSA/PSCを見つけられずにエラーとなる可能性がありますので忘れずに対処しましょう。

 

 

いかがでしたでしょうか。

いきなりすべてを理解するのは難しいかもしれませんが、障害時は迅速な復旧が求められる場合もありますので一度関連KBや資料に目を通しておかれることをお勧めします。