VMware VM および物理サーバーのレプリケーション問題のトラブルシューティング
この記事では、オンプレミス VMware VM および物理サーバーを Site Recovery を使用して Azure にレプリケートする場合に発生する可能性がある、いくつかの一般的な問題と特定のエラーについて説明します。
手順 1:プロセス サーバーの正常性を監視する
Site Recovery はプロセス サーバーを使用して、レプリケートされたデータを受信して最適化し、それを Azure に送信します。
ポータルでプロセス サーバーの正常性を監視して、それらが正しく接続されて機能しており、プロセス サーバーに関連付けられているソース マシンに対してレプリケーションが進行していることを確認するようお勧めします。
- プロセス サーバーの監視についての説明をご覧ください。
- ベスト プラクティスを確認します。
- プロセス サーバーの正常性をトラブルシューティングします。
手順 2:接続性とレプリケーションの問題をトラブルシューティングする
ソース サーバーとプロセス サーバー間またはプロセス サーバーと Azure 間の接続に関する問題により、初期および継続的なレプリケーション エラーが発生することが少なくありません。
これらの問題を解決するために、接続性とレプリケーションのトラブルシューティングをします。
手順 3:レプリケーションに使用できないソース マシンをトラブルシューティングする
Site Recovery を使用してレプリケーションを有効にするソース マシンを選択しようとした場合、次のいずれかの理由から、そのマシンが使用できないことがあります。
- 同じインスタンス UUID を持つ 2 つの仮想マシン: vCenter で管理されている 2 つの仮想マシンが同じインスタンス UUID を持っている場合は、構成サーバーによって最初に検出された仮想マシンが Azure portal に表示されます。 この問題を解決するには、インスタンス UUID が同じ仮想マシンが 2 つ存在しないようにします。 このシナリオは、バックアップ VM がアクティブになり、探索レコードにログインしているインスタンスでよく見られます。 解決するには、「Azure Site Recovery VMware-to-Azure:How to clean up duplicate or stale entries (Azure Site Recovery (VMware から Azure へ): 重複エントリまたは古いエントリのクリーンアップ方法)」を参照してください。
- vCenter ユーザーの資格情報が正しくない:OVF テンプレートまたは統合設定を使用して構成サーバーを設定するときに追加した vCenter 資格情報が正しいことを確認します。 設定時に追加した資格情報を確認するには、自動検出のための資格情報の変更に関する記事を参照してください。
- vCenter の特権が不足している:vCenter にアクセスするために提供されたアクセス許可に、必要なアクセス許可がない場合は、仮想マシンを検出できない場合があります。 「Prepare an account for automatic discovery (アカウントを自動検出のために準備する)」に記載されているアクセス許可が vCenter ユーザー アカウントに追加されていることを確認します。
- Azure Site Recovery の管理サーバー: 仮想マシンが、構成サーバー、スケールアウト プロセス サーバー、マスター ターゲット サーバーのいずれかまたは複数のロールを持つ管理サーバーとして使用されている場合は、ポータルからその仮想マシンを選択できません。 管理サーバーはレプリケートできません。
- Azure Site Recovery サービスによって既に保護されている、またはフェールオーバーされている:仮想マシンが Site Recovery によって既に保護されているかフェールオーバーされている場合、その仮想マシンは、ポータル内で保護対象として選択することはできません。 ポータル内で探している仮想マシンが他のユーザーや別のサブスクリプションでまだ保護されていないことを確認します。
- vCenter が未接続: vCenter が接続状態であることを確認します。 確認するには、[Recovery Services コンテナー]、[Site Recovery インフラストラクチャ]、[構成サーバー] の順に移動し、該当する構成サーバーをクリックします。右側にブレードが開き、関連付けられているサーバーの詳細が表示されます。 vCenter が接続されているがどうかをチェックします。 「未接続」状態である場合は、問題を解決し、ポータルで構成サーバーを更新します。 この後、仮想マシンはポータルに表示されません。
- ESXi の電源がオフになっている: 仮想マシンが存在する ESXi ホストの電源がオフ状態の場合、その仮想マシンは Azure portal に表示されないか、選択できません。 ESXi ホストの電源をオンにし、ポータルで構成サーバーを更新してください。 この後、仮想マシンはポータルに表示されます。
- 保留中の再起動: 仮想マシンに保留中の再起動がある場合は、Azure portal でそのマシンを選択できません。 保留中の再起動アクティビティを必ず完了し、構成サーバーを更新します。 この後、仮想マシンはポータルに表示されます。
- IP が見つからないか、マシンに IP アドレスが割り当てられていない: 仮想マシンに関連付けられている有効な IP アドレスがない場合は、Azure portal でそのマシンを選択できません。 有効な IP アドレスが仮想マシンに割り当てられていることを確認し、構成サーバーを更新します。 また、いずれかの NIC に関連付けられている有効な IP アドレスがマシンに存在しない場合にも、発生することがあります。 すべての NIC に有効な IP アドレスを割り当てるか、IP が割り当てられていない NIC を削除してください。 その後、仮想マシンがポータルに表示されます。
ポータルでグレー表示されている保護された仮想マシンのトラブルシューティング
Site Recovery でレプリケートされる仮想マシンは、システム内に重複したエントリが存在する場合、Azure portal 内で使用できません。 古いエントリの削除と問題の解決について、詳細を確認してください。
もう 1 つの理由は、マシンが複製されたことです。 マシンがハイパーバイザー間で移動し、BIOS ID が変更されると、モビリティ エージェントによってレプリケーションがブロックされます。 複製されたマシンのレプリケーションは、Site Recovery ではサポートされていません。
過去 'XXX' 分間、VM で使用可能なクラッシュ整合性復旧ポイントはありません
最も一般的な問題の一覧を次に示します。
初期レプリケーションの問題 [エラー 78169]
接続、帯域幅、時間同期に関係する問題がないことを確認することに加えて、次の点を確認します。
- ウイルス対策ソフトウェアが Azure Site Recovery をブロックしていない。 Azure Site Recovery で必要なフォルダーの除外について、詳細を参照してください。
ソース マシンのチャーン レートが高い [エラー 78188]
考えられる原因:
- 仮想マシンの一覧上のディスクでのデータ変化率 (書き込みバイト/秒) が、レプリケーション ターゲットのストレージ アカウントの種類に対して Azure Site Recovery がサポートしている上限を超えている。
- チャーン レートが突然急増した結果、大量のデータのアップロードが保留になっている。
問題を解決するには、以下の操作を実行します。
ターゲットのストレージ アカウントの種類 (Standard または Premium) が、ソースのチャーン レート要件に従ってプロビジョニングされていることを確認します。
Premium マネージド ディスク (asrseeddisk タイプ) に既にレプリケートしている場合、Site Recovery 制限に従って、ディスクのサイズが、測定されたチャーン レートをサポートしていることを確認します。 必要に応じて、asrseeddisk のサイズを増やすことができます。 次の手順に従います。
- 影響を受けたレプリケーション対象のマシンの [ディスク] ブレードに移動し、レプリカ ディスク名をコピーします
- このレプリカ マネージド ディスクに移動します
- [概要] ブレードに、SAS URL が生成されていることを示すバナーが表示される場合があります。 このバナーをクリックして、エクスポートをキャンセルします。 バナーが表示されない場合は、この手順を無視してください。
- SAS URL が取り消されたらすぐに、マネージド ディスクの [構成] ブレードにアクセスし、Azure Site Recovery がソース ディスク上で観測されたチャーン レートをサポートできるように、サイズを増やします。
観測されたチャーンが一時的なものである場合は、保留中のデータ アップロード処理が進行し復旧ポイントが作成されるまで、数時間待機します。
ディスクに一時ログやテスト データなどの重要ではないデータが含まれている場合は、このデータを他の場所に移動するか、このディスクをレプリケーションから完全に除外することを検討してください
問題が解決しない場合は、レプリケーションの計画に役立つ Site Recovery デプロイ プランナーを使用します。
ソース マシンにハートビートがない [エラー 78174]
これは、ソース マシンの Azure Site Recovery モビリティ エージェントが構成サーバー (CS) と通信する際に発生します。
この問題を解決するには、次の手順に従って、ソース VM から構成サーバーへのネットワーク接続を確認します。
ソース マシンが動作していることを確認します。
管理者特権を持つアカウントを使用してソース マシンにサインインします。
次のサービスが実行中であることを確認します。実行されていない場合は、サービスを再起動します。
- Svagents (InMage Scout VX Agent)
- InMage Scout アプリケーション サービス
ソース マシンで、エラーの詳細が保存されているログを確認します。
C:\Program Files (X86)\Microsoft Azure Site Recovery\agent\svagents*.log
プロセス サーバーにハートビートがない [error 806]
プロセス サーバーからハートビートがない場合は、次のことを確認します。
プロセス サーバー VM が稼働していること
プロセス サーバー上の次のログでエラーの詳細を確認します。
C:\ProgramData\ASR\home\svsystems\eventmanager*.log
および
C:\ProgramData\ASR\home\svsystems\monitor_protection*.log
マスター ターゲット サーバーにハートビートがない [エラー 78022]
これは、マスター ターゲットの Azure Site Recovery モビリティ エージェントが構成サーバーと通信していない場合に発生します。
この問題を解決するには、次の手順に従ってサービスの状態を確認します。
マスター ターゲット VM が動作していることを確認します。
管理者特権を持つアカウントを使用してマスター ターゲット VM にサインインします。
svagents サービスが実行中であることを確認します。 実行中の場合は、サービスを再起動します。
エラーの詳細が保存されているログを確認します。
C:\Program Files (X86)\Microsoft Azure Site Recovery\agent\svagents*.log
マスター ターゲットを構成サーバーに登録するには、%PROGRAMDATA%\ASR\Agent フォルダーに移動し、コマンド プロンプトで以下を実行します。
cmd cdpcli.exe --registermt net stop obengine net start obengine exit
仮想マシンに対して保護を正常に有効にできない [エラー 78253]
このエラーは、レプリケーション ポリシーが構成サーバーに正しく関連付けられていない場合に発生することがあります。 また、構成サーバーに関連付けられているポリシーが無効な場合にも発生することがあります。
このエラーの原因を確認するには、回復コンテナーの [管理] >[Site Recovery インフラストラクチャ] に移動し、VMware と物理マシンのレプリケーション ポリシーを表示して、構成済みのポリシーの状態をチェックします。
この問題を解決するには、使用中の構成サーバーにポリシーを関連付けるか、新しいレプリケーション ポリシーを作成して関連付けます。 ポリシーが無効な場合は、関連付けを解除して削除できます。
エラー ID 78144 - 過去 "XXX" 分間に、VM 使用可能なアプリ整合性復旧ポイントはありません
モビリティ エージェントのバージョン 9.23 と 9.27 では、VSS インストール エラーの動作を処理するための機能強化が行われています。 VSS エラーのトラブルシューティングに関する最適なガイダンスを得るには、最新バージョンを使用してください。
最も一般的な問題の一部を次に示します。
原因 1:SQL Server 2008/2008 R2 での既知の問題
修正方法: SQL Server 2008/2008 R2 には、既知の問題があります。 サポート技術情報の「Azure Site Recovery Agent or other non-component VSS backup fails for a server hosting SQL Server 2008 R2 (SQL Server 2008 R2 をホストしているサーバーで Azure Site Recovery エージェントまたはその他の非コンポーネント VSS バックアップが失敗する)」を参照してください
原因 2:AUTO_CLOSE DB があるいずれかのバージョンの SQL Server インスタンスをホストするサーバーで Azure Site Recovery ジョブが失敗します
修正方法: ナレッジ ベースの記事を参照してください。
解決方法: ナレッジ ベース記事を参照してください
原因 3:SQL Server 2016 および 2017 での既知の問題
修正方法: ナレッジ ベースの記事を参照してください。
原因 4:Linux サーバーでアプリの整合性が有効になっていない
修正方法: Linux オペレーティング システム用の Azure Site Recovery では、アプリの整合性を保つためのアプリケーション カスタム スクリプトがサポートされています。 プリオプションとポストオプションを含むカスタム スクリプトが、アプリの整合性のために Azure Site Recovery の Mobility Agent によって使用されます。 これを有効にする手順は、こちらをご覧ください。
VSS 関連の問題に起因するその他の原因:
さらにトラブルシューティングを続けるには、ソース マシン上のファイルを確認して、失敗の正確なエラー コードを取得します。
C:\Program Files (x86)\Microsoft Azure Site Recovery\agent\Application Data\ApplicationPolicyLogs\vacp.log
ファイル内のエラーは、どのように探せば良いでしょうか。 エディターで vacp.log ファイルを開いて、"vacpError" という文字列を検索します
Ex:
vacpError
:220#Following disks are in FilteringStopped state [\\.\PHYSICALDRIVE1=5, ]#220|^|224#FAILED: CheckWriterStatus().#2147754994|^|226#FAILED to revoke tags.FAILED: CheckWriterStatus().#2147754994|^|
上の例では、2147754994 がエラーに関する情報を示すエラー コードです。
VSS ライターがインストールされていません - エラー 2147221164
修正方法: アプリケーション整合性タグを生成するために、Azure Site Recovery では Microsoft ボリューム シャドウ コピー サービス (VSS) が使用されます。 これによって、アプリ整合性スナップショットを作成する操作のために、VSS プロバイダーがインストールされます。 この VSS プロバイダーは、サービスとしてインストールされます。 VSS プロバイダー サービスがインストールされていない場合は、アプリケーション整合性スナップショットの作成が失敗し、エラー ID 0x80040154 "クラスが登録されていません" というエラーが発生します。
VSS ライターのインストールのトラブルシューティングに関する記事を参照してください
VSS ライターが無効です - エラー 2147943458
修正方法: アプリケーション整合性タグを生成するために、Azure Site Recovery では Microsoft ボリューム シャドウ コピー サービス (VSS) が使用されます。 これによって、アプリ整合性スナップショットを作成する操作のために、VSS プロバイダーがインストールされます。 この VSS プロバイダーは、サービスとしてインストールされます。 VSS プロバイダー サービスが無効になっている場合は、アプリケーション整合性スナップショットの作成が失敗し、エラー ID "指定したサービスは無効であるため、開始できません (0x80070422)" というエラーが発生します。
- VSS が無効になっている場合は、
- VSS プロバイダー サービスのスタートアップの種類が [自動] に設定されていることを確認します。
- 次のサービスを再起動します。
- VSS サービス
- Azure Site Recovery VSS プロバイダー
- VDS サービス
VSS PROVIDER NOT_REGISTERED - エラー 2147754756
修正方法: アプリケーション整合性タグを生成するために、Azure Site Recovery では Microsoft ボリューム シャドウ コピー サービス (VSS) が使用されます。
Azure Site Recovery VSS プロバイダー サービスがインストールされているかどうかを確認してください。
- 以下のコマンドを使用して、プロバイダーのインストールを再試行します。
- 既存のプロバイダーのアンインストール: C:\Program Files (x86)\Microsoft Azure Site Recovery\agent\InMageVSSProvider_Uninstall.cmd
- 再インストール: C:\Program Files (x86)\Microsoft Azure Site Recovery\agent\InMageVSSProvider_Install.cmd
VSS プロバイダー サービスのスタートアップの種類が [自動] に設定されていることを確認します。 - 次のサービスを再起動します。 - VSS サービス - Azure Site Recovery VSS プロバイダー - VDS サービス
エラー ID 95001 - 不十分なアクセス許可
このエラーは、レプリケーションを有効にしようとしたときに、アプリケーション フォルダーに十分なアクセス許可がない場合に発生します。
修正方法: この問題を解決するには、IUSR ユーザーが次のすべてのフォルダーに対する所有者ロールを持っていることを確認してください。
- C\ProgramData\Microsoft Azure Site Recovery\private
- インストール ディレクトリ。 たとえば、インストール ディレクトリが F ドライブの場合、以下に対する正しいアクセス許可を指定します。
- F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems
- インストール ディレクトリ内の \pushinstallsvc フォルダー。 たとえば、インストール ディレクトリが F ドライブの場合、以下に対する正しいアクセス許可を指定します。
- F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems\pushinstallsvc
- インストール ディレクトリ内の \etc フォルダー。 たとえば、インストール ディレクトリが F ドライブの場合、以下に対する正しいアクセス許可を指定します。
- F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems\etc
- C:\Temp
- C:\thirdparty\php5nts
- 次のパスの下にあるすべての項目。
- C:\thirdparty\rrdtool-1.2.15-win32-perl58\rrdtool\Release*
レプリケートされたサーバーでの時間の変更に対するトラブルシューティングと処理
このエラーは、ソース マシンの時間が進み、その後、短時間で元に戻って変更が修正される場合に発生します。 時間が迅速に修正されるため、変更に気付かないことがあります。
解決方法: この問題を解決するには、システム時間がずれている未来時間を超えるまで待ちます。 もう 1 つの選択肢は、レプリケーションを無効化し、もう一度有効化することです。これは、フォワード レプリケーション (データがオンプレミスから Azure にレプリケートされる) の場合のみ実行でき、リバース レプリケーション (データが Azure からオンプレミスにレプリケートされる) には適用できません。
次のステップ
さらにサポートが必要な場合は、Azure Site Recovery に関する Microsoft Q&A 質問ページで質問を投稿してください。 弊社のアクティブなコミュニティを通じて、エンジニアがサポートいたします。