Überwachen der Clusterverfügbarkeit mit Azure Monitor-Protokollen in HDInsight

Artikel
06/15/2024

HDInsight-Cluster bieten eine Integration mit Azure Monitor-Protokollen, die abfragbare Metriken und Protokolle sowie konfigurierbare Warnungen bereitstellt. In diesem Artikel wird gezeigt, wie Sie Azure Monitor zum Überwachen Ihres Clusters verwenden.

Integration von Azure Monitor-Protokollen

Mit Azure Monitor-Protokollen können Daten, die von mehreren Ressourcen wie z. B. HDInsight-Clustern generiert wurden, zentral gesammelt und zusammengefasst werden, um eine einheitliche Überwachungsumgebung zu schaffen.

Als Voraussetzung benötigen Sie einen Log Analytics-Arbeitsbereich, um die gesammelten Daten zu speichern. Wenn Sie noch keinen eingerichtet haben, befolgen Sie die nachstehenden Anweisungen: Erstellen eines Log Analytics-Arbeitsbereichs.

Aktivieren der Integration von Azure Monitor-Protokollen in HDInsight

Wählen Sie im Portal auf der Seite mit den HDInsight-Clusterressourcen Azure Monitor aus. Wählen Sie dann Aktivieren und Ihren Log Analytics-Arbeitsbereich aus der Dropdownliste aus.

HDInsight Operations Management Suite.

Standardmäßig wird damit der OMS-Agent auf allen Clusterknoten (mit Ausnahme der Edgeknoten) installiert. Da auf den Edgeknoten des Clusters kein OMS-Agent installiert ist, sind standardmäßig keine Telemetriedaten für Edgeknoten in Log Analytics vorhanden.

Abfragemetriken und Protokolltabellen

Sobald die Integration von Azure Monitor-Protokollen aktiviert ist (was einige Minuten dauern kann), navigieren Sie zu Ihrer Ressource Log Analytics-Arbeitsbereich und wählen Protokolle aus.

Log Analytics-Arbeitsbereich – Protokolle.

In den Protokollen sind eine Reihe von Beispielabfragen aufgeführt, wie z. B.:

Abfragename	BESCHREIBUNG
Computer availability today (Heute verfügbare Computer)	Diagramm der Anzahl von Computern, die Protokolle senden, stündlich
List heartbeats (Heartbeat auflisten)	Listet alle Heartbeats von Computern der letzten Stunde auf
Last heartbeat of each computer (Letzter Heartbeat jedes Computers)	Zeigt den letzten von jedem Computer gesendeten Heartbeat
Unavailable computers (Nicht verfügbare Computer)	Listet alle bekannten Computer auf, die in den letzten 5 Stunden keinen Heartbeat gesendet haben
Availability rate (Verfügbarkeitsrate)	Berechnet die Verfügbarkeitsrate jedes angebundenen Computers

Sie können die Beispielabfrage Availability rate (Verfügbarkeitsrate) ausführen, indem Sie für die Abfrage Run (Ausführen) auswählen, wie im Screenshot oben dargestellt. Dadurch wird die Verfügbarkeitsrate jedes Knotens in Ihrem Cluster als Prozentsatz angezeigt. Wenn Sie mehrere HDInsight-Cluster für das Senden von Metriken an denselben Log Analytics-Arbeitsbereich aktiviert haben, wird die Verfügbarkeitsrate für alle Knoten (mit Ausnahme der Edgeknoten) in diesen Clustern angezeigt.

Protokolle im Log Analytics-Arbeitsbereich mit Beispielabfrage zur Verfügbarkeitsrate.

Hinweis

Die Verfügbarkeitsrate wird über einen Zeitraum von 24 Stunden gemessen, sodass Ihr Cluster mindestens 24 Stunden ausgeführt werden muss, bevor Sie genaue Verfügbarkeitsraten sehen.

Sie können diese Tabelle an ein freigegebenes Dashboard anheften, indem Sie rechts oben auf Anheften klicken. Wenn Sie über kein beschreibbares freigegebenes Dashboard verfügen, erfahren Sie hier, wie Sie ein Dashboard erstellen: Erstellen und Freigeben von Dashboards im Azure-Portal.

Azure Monitor-Warnungen

Sie können auch Azure Monitor-Warnungen einrichten, die ausgelöst werden, wenn der Wert einer Metrik oder die Ergebnisse einer Abfrage bestimmte Bedingungen erfüllen. Als Beispiel erstellen wir eine Warnung zum Senden einer E-Mail, wenn mindestens von einem Knoten innerhalb von 5 Stunden kein Heartbeat gesendet wurde (d. h. es wird angenommen, dass er nicht verfügbar ist).

Führen Sie unter Logs (Protokolle) die Beispielabfrage Unavailable computers (Nicht verfügbare Computer) aus, indem Sie für diese Abfrage Run (Ausführen) auswählen, wie unten dargestellt.

Protokolle im Log Analytics-Arbeitsbereich mit Beispiel zu nicht verfügbaren Computern.

Wenn alle Knoten verfügbar sind, sollte diese Abfrage vorerst 0 (null) Ergebnisse zurückgeben. Klicken Sie auf Neue Warnungsregel, um mit der Konfiguration Ihrer Warnung für diese Abfrage zu beginnen.

Log Analytics-Arbeitsbereich mit neuer Warnungsregel.

Eine Warnung besteht aus drei Komponenten: der Ressource, für die die Regel erstellt werden soll (in diesem Fall der Log Analytics-Arbeitsbereich), der Bedingung zum Auslösen der Warnung und den Aktionsgruppen, die bestimmen, was passieren soll, wenn die Warnung ausgelöst wird. Klicken Sie auf den Titel der Bedingung, wie unten gezeigt, um die Konfiguration der Signallogik abzuschließen.

Portalwarnung – Erstellen einer Regelbedingung.

Dadurch wird Signallogik konfigurieren geöffnet.

Legen Sie den Abschnitt Warnungslogik wie folgt fest:

Basierend auf: Anzahl von Ergebnissen, Bedingung: Größer als, Schwellenwert: 0.

Da diese Abfrage nur nicht verfügbare Knoten als Ergebnis zurückgibt, sollte die Warnung immer ausgelöst werden, wenn die Anzahl der Ergebnisse größer als 0 ist.

Legen Sie im Abschnitt Auswertung basierend auf den Zeitraum und die Häufigkeit basierend darauf fest, wie oft Sie die Prüfung auf nicht verfügbare Knoten erfolgen soll.

Stellen Sie für diese Benachrichtigung sicher, dass Period=Frequency (Zeitraum=Häufigkeit) ist. Weitere Informationen zu Zeitraum, Häufigkeit und anderen Benachrichtigungsparametern finden Sie hier.

Wählen Sie Fertig aus, wenn die Konfiguration der Signallogik abgeschlossen ist.

Warnungsregel zur Konfiguration von Signallogik.

Wenn Sie noch nicht über eine Aktionsgruppe verfügen, klicken Sie im Abschnitt Aktionsgruppen auf Neu erstellen.

Warnungsregel zur Erstellung einer neuen Aktionsgruppe.

Dadurch wird Aktionsgruppe hinzufügen geöffnet. Wählen Sie den Namen der Aktionsgruppe, den Kurznamen, das Abonnement und die Ressourcengruppe aus. Wählen Sie im Abschnitt Aktionen einen Aktionsnamen aus, und wählen Sie E-Mail/SMS/Push/Sprachanruf als Aktionstyp aus.

Hinweis

Es gibt mehrere andere Aktionen, die neben „E-Mail/SMS/Push/Sprachanruf“ eine Warnung auslösen können, wie beispielsweise eine Azure-Funktion, LogicApp, Webhook, ITSM und Automation Runbook. Weitere Informationen.

Dadurch wird E-Mail/SMS/Push/Sprachanruf geöffnet. Wählen Sie einen Namen für den Empfänger, aktivieren Sie das Feld E-Mail, und geben Sie eine E-Mail-Adresse ein, an die die Warnung gesendet werden soll. Wählen Sie unter E-Mail/SMS/Push/Sprachanruf und dann unter Aktionsgruppe hinzufügen die Option OK aus, um die Konfiguration der Aktionsgruppe abzuschließen.

Erstellen einer Warnungsregel – Hinzufügen einer Aktionsgruppe.

Nachdem diese Blätter geschlossen wurden, sollte Ihre Aktionsgruppe unter dem Abschnitt Aktionsgruppen aufgeführt sein. Geben Sie abschließend im Abschnitt Warnungsdetails den Namen der Warnungsregel und eine Beschreibung ein, und wählen Sie einen Schweregrad. Klicken Sie im letzten Schritt auf Warnungsregel erstellen.

Portal – Fertigstellen der Warnungsregel.

Tipp

Die Möglichkeit, einen Schweregrad anzugeben, ist ein leistungsstarkes Instrument, das bei der Erstellung mehrerer Benachrichtigungen verwendet werden kann. Sie können beispielsweise eine Warnung (Schweregrad 1) auszulösen, wenn ein einzelner Hauptknoten ausfällt, und eine weitere kritische Warnung (Schweregrad 1) für den unwahrscheinlichen Fall erstellen, dass beide Hauptknoten ausfallen.

Wenn die Bedingung für diese Warnung erfüllt ist, wird die Warnung ausgelöst, und Sie erhalten eine E-Mail mit den entsprechenden Details:

Beispiel für eine Azure Monitor-Warnungs-E-Mail.

Sie können auch alle ausgelösten Warnungen gruppiert nach Schweregrad anzeigen, indem Sie im Log Analytics-Arbeitsbereich zu Warnungen wechseln.

Warnungen im Log Analytics-Arbeitsbereich.

Wenn Sie eine Schweregradgruppe auswählen (d. h. Schweregrad 1, wie oben beschrieben), werden Datensätze für alle Warnungen dieses Schweregrads angezeigt, die wie unten ausgelöst wurden:

Screenshot, der den Schweregrad des Log Analytics-Arbeitsbereichs um eine Warnung zeigt.

Freigeben über

Überwachen der Clusterverfügbarkeit mit Azure Monitor-Protokollen in HDInsight

Integration von Azure Monitor-Protokollen

Aktivieren der Integration von Azure Monitor-Protokollen in HDInsight

Abfragemetriken und Protokolltabellen

Azure Monitor-Warnungen

Nächste Schritte

Feedback

Zusätzliche Ressourcen