Exchangeサーバ、VSS失敗のチェックリスト


Microsoft ExchangeのバックアップをVeeam Backup & Replicationで実施する場合、以下のようなタイムアウトエラーで失敗することがあります。
Unfreeze error:[Backup job failed]
Cannot create shadow copy of the volumes containing writer’s data
A VSS critical writer has failed. Writer name: [Microsoft Exchange Writer]. Class ID: [{76fe1ac4-15f7-4bcd-987e-8e1acb462fb7}]. Instance ID: [{0db23250-4d1e-42c1-8d14-2be32f448184}]. Writer’s state: [VSS_WS_FAILED_AT_FREEZE]. Error code: [0x800423f2].]
Logging onto the Exchange server after backup has failed and going to a command prompt and typing vssadmin list writers will show all writers and their current state. Typically you will see an Exchange Writer has failed because of a timeout error (error code 9).

Exchangeの静止点作成処理はMicrosoftの仕様により20秒以内に終了する必要があるため、これをタイムアウトして失敗しているエラーなのですが、仮想環境の場合、単純にVSSの処理の処理だけでなく、VMwareのスナップショット作成時間等も含まれてくるため、どの部分に時間がかかっているのかを明確にすることが難しくなっています。
http://msdn.microsoft.com/en-us/library/windows/desktop/aa384615%28v=vs.85%29.aspx

そのため、Veeamでは確認点として以下のようなものを挙げています。
http://www.veeam.com/kb1680

・まずVSSを使用したWindows バックアップが正常に作成できることを確認してください。
 これによりVSS自体の問題がVMwareのスナップショットとの組み合わせの問題かを切り分けることができます。

・ゲストOS上にバックアップベンダーのエージェントがインストールされている場合はこれをアンインストールします。

・Exchange Serverを再起動します。

・ESXiホストが十分なリソースを持っていることを確認します。

・VMwareのスナップショット作成に20秒以上かかっていないことを確認します。

・静止時にExchangeサーバに対する大量のI/OやExchangeサーバの仮想ディスクが保存されているデータストアに大量の変更が行われていないか確認します。

・COM+ Event System Serviceを再起動します。根本的な原因は不明ですがいくつかのケースではバックアップの前にこのサービスの再起動をスクリプト化しています。

・VeeamにvSphereホストを直接登録し、そこからExchangeの仮想マシンを登録します。
 VCとホストの間のレイテンシにより、VSSバックアップ時にvCenterを経由するとフリーズの問題が発生するが、vSphereホストを直接登録した場合は発生せず成功することがあります。

・もしVeeamがExchangeに対する直接のネットワーク接続を持ち合わせていない場合は、テストとして、VeeamをExchangeへのネットワーク接続をもっているネットワーク上に置き、それで事象が解決するかを確かめてください。
 直接のネットワーク接続は必要なものではありませんが、もしVIXに関連する潜在的な問題が発生しているのであれば、そのときはIPを使用した通信を行います。
 いくつかのケースではネットワークのアーキテクチャのために、適切にこれが動作いたしません。

・もしあなたがVSSを「コネクションレスモード」(VMware VIX)で使おうとしている場合、極めて重要なことは、
 以下の条件のうち少なくとも1つと合致している必要があるということです。

 1.VSSを使うアカウントは「ビルトイン」のローカルアドミニストレータか「ビルトイン」のドメインアドミニストレータ
  (500で終わるよく知られたSIDを持ち合わせている必要)である必要があります。
  それ以外のローカルまたはドメインの管理者アカウントは動作しません。

 もしくは

 2.ゲストVMのUACを切ってください。

・Exchange仮想マシン上にスナップショットが存在していないか確認してください。不必要な追加でのストレージI/Oを発生させてしまいます。

・アンフリーズ中に負荷がかかっているのであれば、Exchangeサーバに追加のリソースが必要となります。

関連トピックス

コメントを残す

メールアドレスが公開されることはありません。

 

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください