Azure Monitor アラートを使用して Azure ローカル正常性アラートに応答する
適用対象: Azure Local 2311.2 以降
Azure Local の OS 正常性サービスは、Azure Local システムを継続的に監視し、物理ディスクと仮想ディスク、記憶域プールの容量、ボリューム容量、ネットワーク インターフェイス、ストレージ QoS、仮想マシン (VM)、VHD などさまざまなコンポーネントにわたり、80 を超える正常性の問題を検出します。 問題の原因、発生時刻、問題を軽減するための推奨事項など、影響を受けたコンポーネントに関する情報が提供されます。 サポートされていないハードウェア、応答しないディスク、不適切なブロック書き込み、デタッチされたドライブ、修復の必要性、CPU/メモリ/ストレージの使用量の超過、待機時間の長さなどの正常性の問題を確認できます。 サポートされている健康障害の完全な一覧については、「ヘルス サービスの障害を表示」を参照してください。
この記事では、 Azure Monitor アラート を使用して、Azure Local Health アラートを事前に識別、通知、応答する方法について説明します。
Azure Local Health アラートと Azure Monitor の統合
Azure Monitor アラートと Azure Local の統合により、Azure Local の正常性アラート機能が強化されます。 この統合により、オンプレミスの Azure ローカル システム内で生成されたすべての正常性アラートは、Azure Monitor アラートに自動的に転送されます。 これらのアラートを自動化されたインシデント管理システムとリンクすることで、タイムリーかつ効率的な対応を実現できます。
Azure Monitor アラートの詳細については、「Azure Monitor アラートとは」を参照してください。
メリット
Azure Monitor アラートと Azure Local の統合には、いくつかの主な利点があります。
追加コストはありません。 正常性アラート機能を有効にすると、追加コストなしで、すべての Azure ローカル システムの正常性の問題に対する Azure Monitor アラートが自動的に取得されます。 Log Analytics を設定したり、アラート ルールを手動で作成したりする必要はありません。
ほぼリアルタイムの監視。 ほぼリアルタイムの監視を提供する Azure Local Health アラートを使用すると、発生した問題を検出して直ちにアクションを実行できるため、ダウンタイムを短縮できます。
カスタマイズ性:個々のテナントに合わせてアプリケーションをさまざまな方法でカスタマイズできます。 Azure ローカル正常性アラート エクスペリエンスは、Azure Monitor アラートに基づいて構築されています。 アラート処理ルールを構成して、優先する Incident 管理パートナーを介して適切なチームに通知し、問題に迅速かつ効果的に対応できます。
前提条件
Azure Local で正常性アラートを使用するための前提条件を次に示します。
- デプロイおよび登録されている Azure Local バージョン 23H2 システムにアクセスできます。 詳細については、「 Azure portal を使用して Azure Local をデプロイする」を参照してください。
Azure Local の正常性アラートを構成する
Azure Local の正常性アラートを構成する手順の概要を次に示します。
- 手順 1: 正常性アラート機能を有効にします。
- 手順 2: アラート処理ルールを構成します。
手順 1: 正常性アラート機能を有効にする
Azure portal を使用してアラートを有効にすると、Azure Monitor 拡張機能がバックグラウンドでインストールされます。 この拡張機能がインストールされていることを確認するには、Azure portal の Settings>Extensions に移動します。 この拡張機能は、拡張機能の一覧に AzureEdgeAlerts として表示されます。
Azure portal を使用して正常性アラートを有効にするには、次の手順に従います。
Azure ローカル システム リソース ページに移動し、クラスターを選択します。 [Capabilities] タブで、[アラートの] タイルを選択します。
右側の [ 正常性アラートの表示 ] ウィンドウで、[ ターン オン ] ボタンを選択します。
Azure Monitor アラート拡張機能のインストールはバックグラウンドで開始されます。
拡張機能が正常にインストールされると、Capabilities タブに移動します。[Capabilities] タブの下の [アラート] タイルが Configured として表示されることを確認します。
手順 2: アラート処理ルールを構成する
この手順では、受信アラートの処理方法を決定するための一連の構成とアクションで構成されるアラート処理ルールを構成します。 これらのルールを使用すると、アクション グループを追加または抑制したり、フィルターを適用したり、ルールを適用するための定義済みのスケジュールを指定したりできます。
Azure Local Health アラートを処理するようにアラート処理ルールを構成する方法の一般的なユース ケースを次に示します。
- 通知を受け取るユーザーと送信する通知の種類を決定するアクション グループを構成します。 通知は、電子メール、SMS メッセージ、またはその両方で送信できます。
- ストレージ関連の正常性エラーに関するすべてのアラートを、ストレージの問題に対処するチームに送信するように指定します。
- ルールを適用するタイミングを構成します。 既定では、ルールは常にアクティブです。 特定の時刻に動作するように設定することも、定期的なスケジュールを設定することもできます。
アラート処理ルールとその構成方法については、「 アラート処理ルールの構成 アラート処理ルールの構成 を参照してください。
正常性アラートを確認する
Azure portal では、 Monitoring>Alerts ブレードから、Azure ローカル システムの正常性アラートをリアルタイムで確認できます。
Alerts ブレードには、各重大度レベルでのアラートの概要が表示されます。 ドリルダウンすることで、各重要度レベルの個々のアラートを確認できます。
正常性アラートのしきい値を変更する
一部の正常性アラートのしきい値 (CPU、メモリ、ストレージ使用量など) は、PowerShell を使用して変更できます。 詳細については、「正常性サービス設定を変更する」を参照してください。
さまざまな正常性エラーの現在のしきい値の設定を表示するには、次のコマンドを実行します。
Get-StorageSubSystem Cluster* | Get-StorageHealthSetting -Name <SettingName>
たとえば、ストレージ ボリューム容量の警告と重要なしきい値を表示するには、次のコマンドを実行します。
Get-StorageSubSystem Cluster* | Get-StorageHealthSetting -Name "System.Storage.Volume.CapacityThreshold.Warning"
Get-StorageSubSystem Cluster* | Get-StorageHealthSetting -Name "System.Storage.Volume.CapacityThreshold.Critical"
しきい値を望ましい設定に変更するには、次のコマンドを実行します。
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name <SettingName> -Value <Value>
たとえば、ストレージ ボリューム容量の警告しきい値を変更するには、次のコマンドを実行します。
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.Volume.CapacityThreshold.Warning" -Value 70
正常性アラートを無効にする
正常性アラート機能を無効にするには、前にインストールした Azure Monitor アラート拡張機能をアンインストールします。
手順については、「 Azure portal から拡張機能をアンインストールするを参照してください。
次のステップ
Azure ローカル システム内で実行できる正常性アラート の一覧を表示します。