イベント ID 1135 に関するクラスターの問題のトラブルシューティング
この記事は、フェールオーバー クラスター環境でクラスター サービスの開始時にログに記録される可能性があるイベント ID 1135 を診断および解決するのに役立ちます。
適用対象: Windows Server 2022、Windows Server 2019、Windows Server 2016、Azure Stack HCI、バージョン 21H2、20H2
仮想オペレーターを試す - Active Directory レプリケーションに関する一般的な問題をすばやく特定、解決するのに役立ちます。
開始ページ
イベント ID 1135 は、アクティブなフェールオーバー クラスターのメンバーシップから 1 つ以上のクラスター ノードが削除されたことを示します。 次のような現象が発生する可能性があります。
アクティブなフェールオーバー クラスター メンバーシップから削除されるクラスター フェールオーバー\ノード:
イベント ID 1069:
クォーラム損失のイベント ID 1177:
クラスター サービスのイベント ID 1006 が停止しました:
検証とネットワーク テストは、問題の原因になる可能性がある構成に問題がないことを確認するために、最初のトラブルシューティングの手順の 1 つとして推奨されます。
推奨される修正プログラムがインストールされているかどうかを確認する
クラスター サービスは、フェールオーバー クラスターの操作のすべての側面を制御し、クラスター構成データベースを管理する必須のソフトウェア コンポーネントです。 イベント ID 1135 が表示される場合は、次の記事に記載されている修正プログラムをインストールし、クラスターのすべてのノードを再起動してから、問題が繰り返し発生するかどうかを確認することをお勧めします。
- Windows Server 2012 R2 ベースのフェールオーバー クラスターの推奨される修正プログラムと更新プログラム
- Windows Server 2012 ベースのフェールオーバー クラスターの推奨される修正プログラムと更新プログラム
- Windows Server 2008 R2 SP1 フェールオーバー クラスターの推奨される修正プログラムと更新プログラム
すべてのノードでクラスター サービスが実行されているかどうかを確認する
Windows オペレーティング システムに従って次のコマンドを実行し、クラスター サービスが継続的に実行されていて利用可能であることを確認します。
Windows Server 2008 R2 クラスターの場合
管理者特権でのコマンド プロンプトから、cluster.exe node /stat
を実行します。
Windows Server 2012 と Windows Server 2012 R2 クラスターの場合
次の PowerShell コマンドレットを実行します: Get-ClusterResource
クラスター サービスは継続的に実行され、すべてのノードで使用できますか。
イベント ID 1135 のいくつかのシナリオ
クラスターのすべてのノードで、システム イベント ログを詳しく見ます。 ノードに表示されているイベント ID 1135 を確認し、このイベントのすべてのインスタンスをコピーします。 これは、それらを見て確認するのに役立ちます。
Event ID 1135
Cluster node ' **NODE A** ' was removed from the active failover cluster membership. The Cluster service on this node may have stopped.
This could also be due to the node having lost communication with other active nodes in the failover cluster.
Run the Validate a Configuration wizard to check your network configuration.
If the condition persists, check for hardware or software errors related to the network adapters on this node.
Also check for failures in any other network components to which the node is connected such as hubs, switches, or bridges.
次の 3 つの一般的なシナリオがあります。
シナリオ A
すべてのイベントが表示され、クラスター内のすべてのノードが、NODE A が通信を失ったことを示しています。
NODE A にシステム ログが表示されるときに、クラスター内の残りのすべてのノードに対するイベントが含まれている可能性があります。
ソリューション
これにより、ネットワークの輻輳、またはノード A への通信が失われたことが原因で、問題が発生したことがわかります。
ネットワークの構成と通信に関する問題を確認し、検証する必要があります。 ノード A に関する問題を忘れないように注意してください。
シナリオ B
ノード上のイベントを確認し、クラスターが 2 つのサイトに分散しているとします。 サイト 1 の NODE A、NODE B、NODE C、およびサイト 2 の NODE D および NODE E。
ノード A、B、C では、ログに記録されるイベントがノード D および E への接続用であることがわかります。同様に、ノード D と E にイベントが表示されると、A、B、C との通信が失われることが示されます。
ソリューション
類似したアクティビティが表示される場合は、これらのサイトを接続するリンクで通信エラーが発生したことを示しています。 サイト間の接続を確認することをお勧めします。これが WAN 接続を経由している場合は、接続について ISP に確認することをお勧めします。
シナリオ C
ノード上のイベントを確認すると、ノードの名前が特定のパターンで集計されないことがわかります。 クラスターが 2 つのサイトに分散しているとします。 サイト 1 のノード A、ノード B、ノード C、およびサイト 2 の NODE D および NODE E。
- ノード A では、ノード B、D、E のイベントが表示されています。
- ノード B では、ノード C、D、E のイベントが表示されています。
- ノード C では、ノード A、B、E のイベントが表示されています。
- ノード D では、ノード A、C、E のイベントが表示されています。
- ノード E では、ノード B、C、D のイベントが表示されています。
- またはその他の組み合わせです。
ソリューション
このようなイベントは、ノード間のネットワーク チャネルが詰まっていて、クラスター通信メッセージが適時に到達していない場合に発生する可能性があります。これにより、ノード間の通信が失われているとクラスターが感知し、その結果クラスターのメンバーシップからノードが削除されています。
クラスター ネットワークを確認する
次の 3 つのオプションを 1 つずつ調べてクラスター ネットワークを確認し、このトラブルシューティング ガイドを続けることをお勧めします。
ウイルス対策の除外を確認する
クラスター サービスを実行しているサーバーで、次のファイル システムの場所をウイルス スキャンから除外します。
- ファイル共有監視のパス
- %Systemroot%\Cluster フォルダー
ウイルス対策ソフトウェア内でリアルタイム スキャン コンポーネントを構成して、次のディレクトリとファイルを除外します。
既定の仮想マシン構成ディレクトリ (C:\ProgramData\Microsoft\Windows\Hyper-V)
カスタム仮想マシンの構成ディレクトリ
既定の仮想ハード ディスク ドライブ ディレクトリ (C:\Users\Public\Documents\Hyper-V\Virtual Hard Disks)
カスタム仮想ハード ディスク ドライブ ディレクトリ
Hyper-V レプリカを使用している場合は、カスタム レプリケーション データ ディレクトリ
スナップショット ディレクトリ
mms.exe
Note
このファイルは、ウイルス対策ソフトウェア内でプロセス除外として構成されている必要があります。
Vmwp.exe
Note
このファイルは、ウイルス対策ソフトウェア内でプロセス除外として構成されている必要があります。
さらに、クラスターの共有ボリュームと共にライブ マイグレーションを使用する場合は、CSV パス C:\Clusterstorage とそのすべてのサブディレクトリを除外します。 フェールオーバーの問題のトラブルシューティングを行っている場合、またはクラスター サービスとウイルス対策ソフトウェアの一般的な問題がインストールされている場合は、ウイルス対策ソフトウェアを一時的にアンインストールするか、ソフトウェアの製造元に問い合わせて、ウイルス対策ソフトウェアがクラスター サービスで動作するかどうかを確認します。 ほとんどの場合、ウイルス対策ソフトウェアを無効にするだけでは不十分です。 ウイルス対策ソフトウェアを無効にした場合でも、コンピューターを再起動するとフィルター ドライバーは読み込まれたままになります。
ファイアウォールでネットワーク ポートの構成を確認する
クラスター サービスは、サーバー クラスターの操作を制御し、クラスター データベースを管理します。 クラスターは、1 台のコンピューターとして機能する独立したコンピューターのコレクションです。 マネージャー、プログラマ、およびユーザーには、クラスターが単一のシステムとして表示されます。 ソフトウェアは、クラスターのノード間でデータを分散します。 ノードで障害が発生した場合、他のノードは、なくなったノードが以前に提供していたサービスとデータを提供します。 ノードが追加または修復されると、クラスター ソフトウェアによって一部のデータがそのノードに移行されます。
システム サービス名: ClusSvc
アプリケーション | Protocol | Port |
---|---|---|
クラスター サービス | UDP | 3343 |
クラスター サービス | TCP | 3343 (ノードの結合操作中にこのポートが必要です。) |
RPC | TCP | 135 |
クラスター管理者 | UDP | 137 |
Kerberos | UDP/TCP | 464* |
SMB | TCP | 445 |
ランダムに割り当てられた高 UDP ポート** | UDP | 1024 から 65535 の間のランダムなポート番号 49152 から 65535 の間のランダムなポート番号*** |
Note
さらに、Windows Server 2008 以上の Windows フェールオーバー クラスターで検証を成功させるには、ICMP4、ICMP6 の受信トラフィックと送信トラフィックを許可します。
- 詳細については、「Windows Server 2012 フェールオーバー クラスターの作成がエラー 0xc000005e で失敗する」を参照してください。
- これらのポートをカスタマイズする方法の詳細については、「 Service の概要と Windows のネットワーク ポートの要件」の「参照」セクションを参照。
対象範囲は Windows Server 2012、Windows 8、Windows Server 2008 R2、Windows 7、Windows Server 2008、Windows Vista です。
さらに、次のコマンドを実行して、ファイアウォールでのネットワーク ポートの構成を確認します。 次に例を示します。このコマンドは、フェールオーバー クラスターに使用されるポート 3343 が利用可能または開いているかを特定するのに役立ちます。
netsh advfirewall firewall show rule name="Failover Clusters (UDP-In)" verbose
エラーまたは警告に対してクラスター検証レポートを実行する
クラスター検証ツールでは、一連のテストを実行して、ハードウェアと設定がフェールオーバー クラスタリングと互換性を持つかどうかを確認します。
次の手順に従ってください。
エラーまたは警告に対してクラスター検証レポートを実行します。 詳細については、「クラスター検証テストを理解する: ネットワーク」を参照してください
ネットワークの警告とエラーを確認します。 詳細については、「クラスター検証テストを理解する: ネットワーク」を参照してください。
ネットワーク バインドの順序の一覧表示を確認する
このテストでは、各ノードのアダプターにネットワークがバインドされる順序を一覧表示します。
[ Adapters とバインド ] タブには、接続がネットワーク サービスによってアクセスされる順序で接続が一覧表示されます。 これらの接続の順序は、汎用 TCP/IP 呼び出しまたはパケットがネットワークに送信される順序を反映します。
ネットワーク アダプターのバインド順序を変更するには、次の手順に従います。
- Startを選択し、Runを選択し、「ncpa.cpl」と入力して、OKを選択します。 使用可能な接続は、[ネットワーク接続] ウィンドウの [LAN と高速インターネット] セクションで確認できます。
- [ Advanced メニューの Advanced Settings を選択し、 Adapters と Bindings タブを選択します。
- [接続] 領域で、一覧の上位に移動する接続を選択します。 矢印ボタンを使用して接続を移動します。 一般的なルールとして、ネットワークと通信するカード (ドメイン接続、他のネットワークへのルーティングなど) は、最初のバインド (リストの先頭) カードにする必要があります。
クラスター ノードはマルチホーム システムです。 ネットワークの優先順位は、送信ネットワーク接続の DNS クライアントに影響します。 クライアント通信に使用されるネットワーク アダプターは、バインド順序で一番上に表示する必要があります。 ルーティングされていないネットワークは、優先順位を低くすることができます。 Windows Server 2012 および Windows Server 2012 R2 では、クラスター ネットワーク ドライバー (NETFT.SYS) アダプターがバインド順序一覧の下部に自動的に配置されます。
ネットワーク通信の検証を確認する
ネットワークの待機時間によっても発生する可能性があります。 ノード間でパケットが失われることはありませんが、タイムアウト期間が経過する前にノードに到達できない可能性があります。
このテストでは、テスト対象のサーバーがすべてのネットワークにおいて許容できる待ち時間で通信できることを検証します。
例: [ネットワーク通信の検証] で、ネットワーク待機時間の問題について次のメッセージが表示される場合があります。
Succeeded in pinging network interface node003.contoso.com IP Address 192.168.0.2 from network interface node004.contoso.com IP Address 192.168.0.3 with maximum delay 500 after 1 attempt(s).
Either address 10.0.0.96 is not reachable from 192.168.0.2 or **the ping latency is greater than the maximum allowed 2000 ms**
This may be expected, since network interfaces node003.contoso.com - Heartbeat Network and node004.contoso.com - Production Network are on different cluster networks
Either address 192.168.0.2 is not reachable from 10.0.0.96 or **the ping latency is greater than the maximum allowed 2000 ms**
This may be expected, since network interfaces node004.contoso.com - Production Network and node003.contoso.com - Heartbeat Network for MSCS are on different cluster networks
マルチサイト クラスターの場合は、タイム アウト値を増やします。 詳細については、「マルチサイト フェールオーバー クラスターでハートビートと DNS 設定を構成する」を参照してください。
WAN 接続の問題については、ISP に確認してください。
次の問題が発生した場合は、確認してください。
ノード間でネットワーク パケットが失われる
パフォーマンスを使用してパケット損失を確認する
パケットがノード間のどこかのネットワーク上で失われると、ハートビートは失敗します。 パフォーマンス モニターで「ネットワーク インターフェイス\破棄された受信パケット」カウンターを調べると、これが問題であるかどうかを簡単に確認できます。 このカウンターを追加したら、[平均]、[最小]、[最大]の数値を確認し、値が 0 より大きい値の場合は、アダプター用に受信バッファーを調整する必要があります。
VMware 仮想化プラットフォームでネットワーク パケットが失われる場合は、「VMware 仮想化プラットフォームにインストールされているクラスター」セクションを参照してください。
NIC ドライバーをアップグレードする
この問題は、古い NIC ドライバー、統合コンポーネント (IC)、VmTools または NIC アダプターの障害が原因で発生する可能性があります。 物理マシン上のノード間でネットワーク パケットが失われた場合は、ネットワーク アダプター ドライバーを更新してください。 古いまたは旧式のネットワーク カード ドライバーやファームウェア。 場合によっては、ネットワーク カードやスイッチの単純な設定ミスでハートビートが失われることもあります。
VMware 仮想化プラットフォームにインストールされているクラスター
VMware 環境の場合は、VMware アダプターの問題を確認します。
この問題は、大きなトラフィック バースト中にパケットが破棄された場合に発生する可能性があります。 (メール フィルターなど) トラフィック のフィルター処理がないことを確認します。 この可能性を排除した後、ゲスト オペレーティング システム内のバッファーの数を徐々に増やし、確認します。
バースト トラフィックによる破棄を減らすには、次の手順に従います。
- Start を選択し、Run を選択し、「
devmgmt.msc
」と入力して、Enter キーを押します。 - Network アダプター展開し、vmxnet3を右クリックし、Properties を選択します。
- [Advanced] タブを選択します。
- Small Rx バッファーを選択し、値を大きくします。 既定値は 512 で、最大値は 8192 です。
- [ Rx リング #1 サイズを選択し、値を大きくします。 既定値は 1024 で、最大値は 4096 です。
VMware 環境の場合に VMware アダプターの問題を確認するには、次の記事を確認してください。
- VMWare ESX のフェールオーバー クラスターのメンバーシップからノードが削除されていますか。
- ESXi の VMXNET3 vNIC のゲスト オペレーティング システム レベルでの大きなパケット損失
ネットワークの輻輳に注意する
ネットワークの輻輳により、ネットワーク接続の問題が発生する可能性があります。
MS とベンダーの推奨事項に従ってネットワークが構成されていることを確認します。「Windows のフェールオーバー クラスター ネットワークの構成」を参照してください。
ネットワーク構成を確認します
それでも機能しない場合は、クラスター GUI でパーティション分割されたネットワークが表示されているか、ハートビート NIC で NIC チーミングが有効になっているかどうかを確認してください。
クラスター GUI にパーティション分割されたネットワークが表示される場合は、「パーティション分割されたクラスター ネットワーク」を参照して問題のトラブルシューティングを行います。
ハートビート NIC で NIC チーミングを有効にしている場合は、チーミング ベンダーの推奨事項に従ってチーミング ソフトウェア機能を確認します。
NIC ドライバーをアップグレードする
この問題は、古い NIC ドライバーまたは NIC アダプターの障害が原因で発生する可能性があります。
物理マシン上のノード間でネットワーク パケットが失われた場合は、ネットワーク アダプター ドライバーを更新してください。 古いまたは旧式のネットワーク カード ドライバーやファームウェア。
場合によっては、ネットワーク カードやスイッチの単純な設定ミスでハートビートが失われることもあります。
ネットワーク構成を確認します
それでも機能しない場合は、クラスター GUI でパーティション分割されたネットワークが表示されているか、ハートビート NIC で NIC チーミングが有効になっているかを確認します。