Freigeben über


Integritätsmodellierung für Workloads

Cloudanwendungen generieren hohe Datenmengen, was es schwierig macht, Probleme schnell zu ermitteln und zu lösen. Ein allgemeiner Grund für diese Herausforderung ist das Fehlen einer Integritätsgrundlinie, die an die Funktionalität der Workload angepasst ist, und die Unfähigkeit, Abweichung von dieser Basislinie zu erkennen.

Die Integritätsmodellierung ist eine Beobachtbarkeitsübung, die Geschäftskontexte mit rohen Überwachungsdaten kombiniert, um die Gesamtintegrität einer Workload zu quantifizieren. Sie hilft beim Festlegen eines Basisplans, auf den Sie die Arbeitsauslastung überwachen können. Sie sollten Daten wie Telemetrie aus Infrastruktur- und Anwendungskomponenten berücksichtigen. Die Integritätsmodellierung kann auch andere Informationen enthalten, die erforderlich sind, um die Qualitätsziele der Workload zu erreichen.

Leistungsprobleme oder betriebsbedingte Beeinträchtigungen können zu einer Abweichung vom erwarteten Betriebszustand führen. Indem Sie die Integrität einer Arbeitsauslastung modellieren, können Sie Drift identifizieren und fundierte operative Entscheidungen treffen, die die Geschäftlichen Auswirkungen berücksichtigen.

Die Gesundheitsmodellierung überbrückt die Kluft zwischen Stammeswissen und handlungsfähigen Erkenntnissen. Es hilft Ihnen, kritische Probleme effektiv zu verwalten. Das Konzept ist unerlässlich, um Zuverlässigkeit und betriebliche Effektivität zu maximieren.

Dieses Handbuch bietet praktische Anleitungen zur Integritätsmodellierung, einschließlich der Erstellung eines Modells, das den Laufzeitstatus einer Workload und aller seiner Subsysteme bewertet.

Terminologie Definition
Integritätsmodellierung Eine Beobachtbarkeitsübung, die den Geschäftskontext verwendet, um Überwachungsdaten als Integritätszustände zu interpretieren.
Integritätsmodell Eine grafische Darstellung logischer Entitäten und deren Beziehungen für einen bestimmten Bereich. Jeder Knoten verfügt über eine Integritätsstatusdefinition, um Überwachungsdaten im gesamten Modell zu rationalisieren.
Integritätsentität Eine logische Komponente, die eine einzelne Einheit eines Systems, eine logische Kombination mehrerer verwandter Entitäten oder das Gesamtsystem darstellt.
Integritätsstatus Ein definierter und messbarer Status, der aussagekräftige operative Erkenntnisse über die Integrität einer Entität liefert.
Integritätssignal Einzelne Datenströme, die Einblicke in das Betriebsverhalten einer Entität bieten.
Modell von Modellen Ein aggregierter Modellierungsbereich, in dem Entitäten unterschiedliche Integritätsmodelle für Komponentensysteme darstellen.

Wir empfehlen Ihnen, dieses Video anzusehen, um ein allgemeines Verständnis der Integritätsmodellierung zu erhalten.

Was ist Gesundheit, Integritätsmodellierung und ein Integritätsmodell?

Der Begriffsstatus bezieht sich auf den Betriebsstatus einer Entität und deren Abhängigkeiten. Diese Entität kann eine einzelne Einheit eines Systems, eine logische Kombination mehrerer verwandter Entitäten oder das Gesamtsystem sein.

Es wird empfohlen, die Integrität in einem von drei Zuständen darzustellen:

  • Gesund: Funktioniert optimal und erfüllt Qualitätserwartungen

  • Herabgestuft: Zeigt weniger als ein gesundes Verhalten an, das potenzielle Probleme anzeigt

  • Ungesund: In einem kritischen Zustand und erfordert sofortige Aufmerksamkeit

Hinweis

Sie können die Integrität mit einer Bewertung anstelle von Zuständen darstellen, um mehr Daten granularität bereitzustellen.

Integritätszustände werden abgeleitet, indem Überwachungsdaten mit Domäneninformationen kombiniert werden. Jeder Zustand muss definiert werden und muss messbar sein. Integritätszustände werden mithilfe von Integritätssignalen berechnet, bei denen es sich um einzelne Datenströme handelt, die Einblicke in das Betriebsverhalten einer Entität bieten. Signale können Metriken, Protokolle, Ablaufverfolgungen oder andere Qualitätsmerkmale enthalten. Beispielsweise kann ein Integritätssignal für eine VM-Entität (Virtual Machine) die CPU-Auslastungsmetrik nachverfolgen. Andere Signale für diese Entität können speicherauslastung, Netzwerklatenz oder Fehlerraten umfassen.

Berücksichtigen Sie beim Definieren von Integritätssignalen die Nichtfunktionsanforderungen für die Workload. Schließen Sie im Beispiel der CPU-Auslastung die erwarteten Schwellenwerte für jeden Integritätszustand ein. Wenn die Auslastung den tolerierten Schwellenwert in Übereinstimmung mit den Workloadanforderungen überschreitet, wechselt das System von "Fehlerfrei" auf "Beeinträchtigt" oder "Ungesund" um. Diese Zustandsänderungen lösen die entsprechenden Warnungen oder Aktionen aus.

Die Integritätsmodellierung erfordert, dass Entitäten über klar definierte Zustände verfügen, die von mehreren Integritätssignalen abgeleitet werden und für die Workload kontextbezogen sind. Die Integritätsdefinition für einen virtuellen Computer kann z. B.:

  • Fehlerfrei: Wichtige nicht funktionsfreie Anforderungen und Ziele, z. B. Antwortzeit, Ressourcenauslastung und Gesamtsystemleistung, sind vollständig erfüllt. Beispielsweise werden 95 % der Anforderungen innerhalb von 500 Millisekunden verarbeitet. Die Workload verwendet VM-Ressourcen wie CPU, Arbeitsspeicher und Speicher optimal und verwaltet ein Gleichgewicht zwischen Workloadanforderungen und verfügbarer Kapazität. Die Benutzererfahrung erfolgt auf erwarteten Ebenen.

  • Beeinträchtigt: Ressourcen werden nicht optimal ausgeführt, sind aber weiterhin betriebsbereit. Auf dem Speicherdatenträger tritt beispielsweise Drosselungsprobleme auf. Benutzer können langsame Antworten erhalten.

  • Ungesund: Beeinträchtigungen überschreiten die tolerierten Grenzen. Ressourcen sind nicht mehr reaktionsfähig oder verfügbar, und das System erfüllt keine akzeptablen Leistungsstufen mehr. Die Benutzererfahrung ist stark betroffen.

Das Ergebnis der Integritätsmodellierung ist ein Modell oder eine grafische Darstellung logischer Entitäten und deren Beziehungen für eine Workloadarchitektur. Jeder Knoten verfügt über eine Integritätsstatusdefinition.

Wichtig

Die Integritätsmodellierung ist ein abstraktes Konzept, das Sie in verschiedenen Bereichen implementieren und anwenden können, wenn Sie über ein gutes Verständnis der Geschäftsszenarien verfügen.

Ein Diagramm, das die Definition des Integritätsmodells zeigt.

In der Abbildung:

  • Entitäten sind logische Komponenten der Workload, die Aspekte des Systems darstellen. Sie können Infrastrukturkomponenten wie Server, Datenbanken und Netzwerke sein. Sie können auch spezifische Anwendungsmodule, Pods, Dienste oder Microservices sein. Oder Entitäten können Benutzerinteraktionen und Systemflüsse innerhalb der Workload erfassen.

    Hinweis

    Benutzer- und Systemflüsse fassen nicht funktionsfreie Anforderungen in Geschäftsszenarien zusammen, die Anwendungs- und Infrastrukturkomponenten umfassen. Diese Zusammenfassung spiegelt den Geschäftlichen Wert für die Anwendung wider.

  • Beziehungen zwischen Entitäten spiegeln die Abhängigkeitsketten innerhalb des Systems wieder. Beispielsweise kann ein Anwendungsmodul bestimmte Infrastrukturkomponenten aufrufen, die eine Beziehung bilden.

Berücksichtigen Sie ein Szenario, in dem eine E-Commerce-Workload eine Spitzenleistung bei fehlgeschlagenen Nachrichten in einer Azure Service Bus-Warteschlange aufweist, was zu Einem Fehler bei Zahlungen führt. Dieses Problem ist aufgrund des implizierten Umsatzverlusts für die Organisation von entscheidender Bedeutung. Obwohl ein Anwendungsentwickler möglicherweise die Auswirkungen dieser Metrik auf Zahlungen versteht, wird dieses Stammeswissen nicht häufig über das Operationsteam hinweg geteilt.

Ein Integritätsmodell kann operatoren sofortige Einblicke in das Problem und seine Auswirkungen geben. Der Zahlungsfluss hängt von Service Bus ab, der einer der Workloadkomponenten ist. Die visuelle Darstellung zeigt den beeinträchtigten Zustand der ServiceBus-Instanz und deren Auswirkungen auf den Zahlungsfluss an. Operatoren können die Bedeutung des Problems verstehen und sich auf ihre Korrekturbemühungen auf diese spezifische Komponente konzentrieren.

Die Integritätsmodellierung war im vorherigen Szenario auf folgende Weise wichtig:

  • Dadurch wurde die Zeit für die Erkennung (TTD) und die Zeit zum Abmildern (TTM) verbessert, indem eine schnellere Problemisolation ermöglicht wurde, was zu einer schnelleren Erkennung von Problemen und potenziellen Korrekturen führte.

  • Operatoren erhielten Warnungen basierend auf Integritätszuständen, wodurch unnötiges Rauschen reduziert wurde. Betreiber erhielten Benachrichtigungen, die spezifischen Kontext zu den auswirkungen auf zahlungen bereitgestellt haben.

  • Abhängigkeitsketten haben den Betreibern geholfen, das Ausmaß der operativen Probleme vollständig zu verstehen. Dieses Wissen beschleunigte Folgenabschätzungen und führte zu priorisierten Antworten. Operatoren können auch leicht kaskadierende oder korrelierte Probleme erkennen.

  • Operatoren führten Aktivitäten nach dem Vorfall mit Genauigkeit durch, da das Integritätsmodell Einblicke in die Ursachen von Anomalien und die spezifischen Gesundheitssignale lieferte, die beteiligt waren.

  • Es hat die Überwachungsdaten für alle Teammitglieder aussagekräftig gemacht. Es überbrückte die Kluft zwischen Stammeswissen und geteilten Erkenntnissen.

  • Die Organisation nutzte das Integritätsmodell als Basis für zukünftige Investitionen in KI-gesteuerte Vorgänge, um intelligente Erkenntnisse abzuleiten.

Schema des Integritätsmodells

Integritätsmodelle bieten ein eindeutiges Datenschema, das für Observability-Anwendungsfälle optimiert ist. Dieses Schema verwendet die Integritätsmodellierung von einem abstrakten Konzept zu einer messbaren Lösung. Indem Sie Ihre spezifischen Anforderungen, Ziele und architekturspezifischen Kontext modellieren, können Sie Gesundheitsdaten auf Ihr einzigartiges Szenario anpassen.

Ein Diagramm, das die Definition des Integritätszustands zeigt.

Gesundheit ist ein relatives Datenkonzept. Jedes Modell stellt Integritätsdaten dar, die für den kontextbezogenen Bereich eindeutig und priorisiert sind, auch wenn sie dieselbe Gruppe von Entitäten verwendet. Was in einem bestimmten Szenario fehlerfrei ist, kann sich in anderen Kontexten erheblich unterscheiden.

Betrachten Sie beispielsweise Azure-Ressourcen desselben Typs innerhalb Ihrer Workload.

  • VM A führt eine CPU-sensible Anwendung aus.
  • VM B verarbeitet einen arbeitsspeicherintensiven Dienst.

Die Integritätsdefinitionen für diese Computer unterscheiden sich. CPU-Auslastungsmetriken beeinflussen wahrscheinlich den Integritätsstatus von VM A, und VM B priorisieren möglicherweise arbeitsspeicherbezogene Metriken.

Wichtig

Ein Integritätsmodell sollte nicht alle Fehler gleich behandeln. Es sollte eindeutig zwischen erwarteten oder vorübergehenden, aber wiederherstellbaren Fehlern und einem echten Katastrophenzustand unterschieden werden.

Erstellen eines Integritätsmodells

Der erste Schritt zum Erstellen eines Integritätsmodells ist eine logische Entwurfsübung, die in der Regel die Aktivitäten umfasst, die in den folgenden Abschnitten beschrieben werden.

Ein Diagramm, das Integritätsmodellierungsaktivitäten zeigt.

Bewerten des Workloaddesigns

Beginnen Sie diese logische Entwurfsübung, indem Sie die folgenden Komponenten Ihres Workloaddesigns auswerten.

  • Infrastrukturkomponenten wie Computecluster und Datenbanken

  • Anwendungskomponenten, die auf Compute und deren relevante Komponenten ausgeführt werden

  • Logische oder physische Abhängigkeiten zwischen Komponenten

  • Benutzer- und Systemflüsse

Beispielsweise sollte das Integritätsmodell für eine E-Commerce-Anwendung den aktuellen Status kritischer Prozesse wie Benutzeranmeldung, Auschecken und Zahlungen darstellen.

Kontextualisieren von Geschäftsanforderungen

Bewerten Sie die relative Wichtigkeit und die Gesamtwirkung jedes Flusses auf Ihre Organisation. Berücksichtigen Sie Faktoren wie Benutzerfreundlichkeit, Sicherheit und Betriebliche Effizienz. In den meisten Szenarien ist der Ausfall eines Zahlungsvorgangs wahrscheinlich wichtiger als der Ausfall eines Berichterstellungsprozesses.

Identifizieren Sie Eskalationspfade für die Behandlung von Problemen im Zusammenhang mit den einzelnen Flussen. Weitere Informationen finden Sie unter Optimieren des Arbeitsauslastungsdesigns mithilfe von Flüssen.

Hinweis

Sie erkennen den Wert der Integritätsmodellierung nur dann, wenn Sie Ihre Geschäftsszenarien und Ihren Kontext integrieren. Anschließend können Sie die Geschäftlichen Auswirkungen aus betrieblichen Problemen rationalisieren.

Zuordnung zu Zuverlässigkeitsmetriken

Suchen Sie nach relevanten Zuverlässigkeitsmetriken im gesamten Anwendungsdesign.

Erwägen Sie die Definition von Indikatoren auf Service-Ebene (Service Level Indicators, SLIs) und ServiceLevel-Zielen (SLOs) für die gesamte Anwendung und ihre einzelnen Geschäftsprozesse. Diese SLIs und SLOs sollten mit den spezifischen Gesundheitssignalen übereinstimmen, die für Ihr Integritätsmodell berücksichtigt werden. Auf diese Weise erstellen Sie eine umfassende Definition der Integrität, die genau die Erreichung einer akzeptablen Serviceebene für die Anwendung widerspiegelt.

Wichtig

SLIs und SLOs sind kritische Gesundheitssignale. Sie erstellen eine aussagekräftige Definition der Integrität, die den gewünschten Dienstgrad zusammen mit anderen Qualitätsattributen widerspiegelt. Sie können auch Ziele für den Dienststatus (SERVICE Health Objectives, SHOs) definieren, um die Integrität zu erfassen, die Sie über einen aggregierten Zeitraum erreichen möchten.

Identifizieren von Gesundheitssignalen

Um ein umfassendes Integritätsmodell zu erstellen, korrelieren Sie verschiedene Arten von Überwachungsdaten, einschließlich Metriken, Protokollen und Ablaufverfolgungen. Dadurch stellen Sie sicher, dass das Konzept der Integrität den Laufzeitzustand einer bestimmten Entität oder der gesamten Workload genau widerspiegelt.

Verwenden von Plattformmetriken und Protokollen

Im Kontext der Integritätsmodellierung ist es wichtig, Metriken auf Plattformebene und Protokolle aus zugrunde liegenden Azure-Ressourcen zu sammeln. Zu diesen Metriken gehören CPU-Prozentsatz, Netzwerk in und Netzwerkausgang sowie Datenträgervorgänge pro Sekunde. Sie können diese Daten in Ihrem Integritätsmodell verwenden, um potenzielle Probleme zu erkennen und vorherzusagen und gleichzeitig eine zuverlässige Umgebung aufrechtzuerhalten.

Darüber hinaus hilft Ihnen dieser Ansatz, zwischen vorübergehenden Fehlern oder temporären Störungen und nichttransparenten Fehlern oder dauerhaften Problemen zu unterscheiden.

Hinweis

Als bewährte Methode sollten Sie alle Anwendungsressourcen so konfigurieren, dass Diagnoseprotokolle und Metriken an die ausgewählte Protokollaggregationstechnologie übermittelt werden. Erstellen Sie Schutzläufe mithilfe der Azure-Richtlinie , um konsistente Diagnoseeinstellungen in der gesamten Anwendung sicherzustellen und die ausgewählte Konfiguration für jeden Azure-Dienst zu erzwingen.

Hinzufügen von Anwendungsprotokollen

Anwendungsprotokolle sind eine wichtige Quelle für Diagnosedaten für Ihr Integritätsmodell. Hier sind einige bewährte Methoden für die Anwendungsprotokollierung:

  • Verwenden Sie semantische oder strukturierte Protokollierung. Strukturierte Protokolle erleichtern den automatisierten Verbrauch und die Analyse von Protokolldaten im großen Maßstab.

    Erwägen Sie das Speichern von Azure-Ressourcenmetriken und Diagnosedaten in einem Azure Monitor Logs-Arbeitsbereich anstelle eines Speicherkontos. Mithilfe dieser Methode können Sie Gesundheitssignale mithilfe von Kusto-Abfragen zur effizienten Auswertung erstellen.

  • Protokollieren Sie Daten in der Produktionsumgebung. Erfassen Sie umfassende Daten, während die Anwendung in der Produktionsumgebung arbeitet. Ausreichende Informationen sind für die Gesundheitsbewertung und die Diagnose erkannter Produktionsprobleme unerlässlich.

  • Protokollieren Sie Ereignisse an Dienstgrenzen. Schließen Sie eine Korrelations-ID ein, die Dienstgrenzen durchläuft. Wenn eine Transaktion mehrere Dienste umfasst und einer von ihnen fehlschlägt, hilft Ihnen die Korrelations-ID, Anforderungen in der gesamten Anwendung nachzuverfolgen und die Ursache eines Fehlers zu ermitteln.

  • Verwenden Sie die asynchrone Protokollierung. Vermeiden Sie synchrone Protokollierungsvorgänge, die Anwendungscode blockieren können. Die asynchrone Protokollierung stellt die Verfügbarkeit sicher, indem Anforderungsrückgänge während Protokollschreibvorgängen verhindert werden.

  • Trennen Sie die Anwendungsprotokollierung von der Überwachung. Verwalten Sie Überwachungsprotokolle getrennt von Diagnoseprotokollen. Obwohl Überwachungsdatensätze compliance- oder behördliche Anforderungen erfüllen, verhindert die unterschiedliche Aufbewahrung verworfener Transaktionen.

Implementieren der verteilten Ablaufverfolgung

Implementieren Sie die verteilte Ablaufverfolgung, indem Sie Telemetrie über kritische Systemflüsse hinweg korrelieren. Korrelierte Telemetrie bietet Einblicke in End-to-End-Transaktionen und ist für eine effektive Ursachenanalyse (Root Cause Analysis, RCA) unerlässlich, wenn Fehler auftreten.

Verwenden von Integritätstests

Implementieren und ausführen Sie Integritätssonden außerhalb der Anwendung, um die Integrität und Reaktionsfähigkeit Ihrer Anwendung explizit zu überprüfen. Verwenden Sie Probeantworten als Signale innerhalb Ihres Integritätsmodells.

Sie können Integritätssonden implementieren, indem Sie die Reaktionszeit der Anwendung als Ganzes oder aus den einzelnen Komponenten messen. Probes können Prozesse ausführen, um Die Latenz zu messen und die Verfügbarkeit zu überprüfen oder Informationen aus der Anwendung zu extrahieren. Weitere Informationen finden Sie unter Überwachungsmuster für den Integritätsendpunkt.

Die meisten Lastenausgleichsgeräte unterstützen die Ausführung von Integritätssonden, die Anwendungsendpunkte in konfigurierten Intervallen pingen. Alternativ können Sie einen externen Watchdog-Dienst verwenden. Ein Watchdog-Dienst aggregiert Integritätsprüfungen aus mehreren Komponenten in der Workload. Watchdogs können auch Code hosten, der sofortige Korrekturen für bekannte Integritätsbedingungen durchführt.

Übernehmen struktureller und funktionaler Überwachungstechniken

Die strukturelle Überwachung umfasst die Ausstattung der Anwendung mit semantischen Protokollen und Metriken. Die Anwendung sammelt diese Metriken direkt, einschließlich der aktuellen Speicherauslastung, der Anforderungslatenz und anderer relevanter Daten auf Anwendungsebene.

Stärken Sie Ihre Überwachungsprozesse mithilfe der funktionalen Überwachung. Dieser Ansatz konzentriert sich auf die Messung von Plattformdiensten und deren Auswirkungen auf die allgemeine Benutzererfahrung. Im Gegensatz zur strukturellen Überwachung erfordert die funktionale Überwachung keine detaillierten Kenntnisse des Systems. Es testet das extern sichtbare Verhalten der Anwendung. Dieser Ansatz ist nützlich für die Bewertung von SLOs und SLIs.

Modell des Designs

Stellen Sie den identifizierten Anwendungsentwurf als Entitäten und Beziehungen dar. Ordnen Sie Integritätssignale bestimmten Komponenten zu, um Integritätszustände auf Entitätsebene zu quantifizieren. Berücksichtigen Sie die Kritischität von Komponenten, um zu bestimmen, wie Integritätszustände über das Modell verteilt werden sollen. Beispielsweise sind Berichtskomponenten möglicherweise nicht so kritisch wie andere Komponenten, was zu unterschiedlichen Auswirkungen auf die Allgemeine Workloadintegrität führt.

Festlegen von Aktionen erfordernden Warnungen

Verwenden Sie die ausgewerteten Integritätszustände, um Warnungen und automatisierte Aktionen auszulösen. Die Gesundheit sollte in bestehende betriebsbereite Runbooks als Kerndaten-Daten-Tenet integriert werden.

In der Regel gibt es eine 1:1-Zuordnung zwischen Überwachungsdaten und Warnungsregeln, die zu unerwünschten Ergebnissen führen können, z. B. Alarmstürme und Umgebungsgeräusche. In einem Computecluster können z. B. hohe Mengen von Warnungen auf VM-Ebene, die auf CPU-Auslastung und Fehleranzahl basieren, die Operatoren bei Fehlern überwältigen und zu Verzögerungen bei der Auflösung führen. Wenn eine hohe Anzahl von konfigurierten Warnungen vorhanden ist, führen Umgebungswarnungsgeräusche häufig zu Warnungen, die übersehen oder ignoriert werden.

Ein Integritätsmodell führt zu einer Trennung zwischen Überwachungsdaten und Warnungsregeln. Eine Integritätsdefinition aggregiert viele Signale in einen einzelnen Integritätszustand, wodurch die Anzahl der Warnungen verringert wird, sodass sich Die Operatoren ausschließlich auf hochwertige Warnungen konzentrieren können, die für die Organisation kritisch sind. Berücksichtigen Sie das E-Commerce-Szenario. Sie können eine Benachrichtigung einrichten, um Benachrichtigungen über Änderungen an der Integrität des Prozesszahlungenflusses anstelle von Änderungen an zugrunde liegenden Ressourcen wie der Servicebus-Warteschlange zu senden.

Hinweis

Die Möglichkeit, über alle Ebenen des Integritätsmodells zu benachrichtigen, bietet Flexibilität für die verschiedenen Workload-Personas. Anwendungsbesitzer und Produktmanager können auf Änderungen des Integritätszustands in wichtigen Geschäftsszenarien oder in der gesamten Workload benachrichtigt werden. Operatoren können basierend auf der Integrität von Infrastruktur- oder Anwendungskomponenten benachrichtigt werden.

Visualisieren des Modells

Erstellen Sie visuelle Darstellungen, z. B. Tabellen oder Diagramme, um den aktuellen Zustand und den Verlauf des Integritätsmodells effektiv zu vermitteln. Stellen Sie sicher, dass die Visualisierung mit dem Geschäftskontext übereinstimmt und umsetzbare Einblicke bietet.

Wenn Sie Ihr Gesundheitsmodell visualisieren, sollten Sie einen Ampelansatz einführen, um Integritätszustände sofort in Abhängigkeitsketten aufschlussreich zu machen.

Weisen Sie Grün für gesunde, gelb für beeinträchtigte und rot für ungesunde Zuweisen zu. Durch die schnelle Identifizierung der farbcodierten Zustände können Sie die Ursache einer Anwendungsverschlechterung effizient finden.

Das Diagramm zeigt ein Integritätsmodell, das einen Ampelansatz verwendet.

Hinweis

Es wird empfohlen, Barrierefreiheitsanforderungen für Personen zu berücksichtigen, die eine Sehbehinderung haben, wenn Sie ein Dashboard für Ihr Integritätsmodell erstellen. Bewährte Methoden für die Diagrammerstellung finden Sie unter Architekturentwurfsdiagramme.

Übernehmen Ihres Integritätsmodells

Berücksichtigen Sie nach dem Erstellen eines Integritätsmodells die folgenden Anwendungsfälle, um die Erkennung und Interpretation von Fehlern oder Betriebsproblemen zu fördern.

Anwendbarkeit auf verschiedene Rollen

Die Integritätsmodellierung kann Informationen bereitstellen, die spezifisch für Auftragsfunktionen oder Rollen innerhalb desselben Kontexts der Workload sind. Beispielsweise kann eine DevOps-Rolle betriebliche Integritätsinformationen benötigen. Ein Sicherheitsbeauftragter ist möglicherweise mehr besorgt über Angriffssignale und Sicherheitsrisiken. Ein Datenbankadministrator ist wahrscheinlich nur an einer Teilmenge des Anwendungsmodells über die Datenbankressourcen interessiert.

Passen Sie Gesundheitserkenntnisse für unterschiedliche Projektbeteiligte an. Erwägen Sie, separate Modelle von überlappenden Datensätzen zu erstellen.

Fortlaufende Validierung

Verwenden Sie Ihr Integritätsmodell, um Test- und Validierungsprozesse wie Auslastungstests und Chaostests zu optimieren. Sie können den Laufzeitbetriebsstatus während des Tests überprüfen und die Effektivität Ihres Modells in Skalierungs- und Fehlerszenarien bewerten, indem Sie Integritätsmodelle in Ihren Engineering-Lebenszyklus integrieren.

Organisationsintegrität

Obwohl die Integritätsmodellierung häufig mit der Quantifizierung von Integritätszuständen für einzelne Anwendungen verbunden ist, erstreckt sich ihre Anwendbarkeit über diesen Bereich hinaus.

Auf einer individuellen Arbeitsauslastungsebene bieten Integritätsmodelle eine Grundlage für die Anwendung observability und operational insights. Jede Anwendung kann über ein eigenes Integritätsmodell verfügen, das erfasst, was jeder Integritätszustand innerhalb seines Kontexts bedeutet.

Sie können mehrere Integritätsmodelle in einem allgemeinen Konstrukt kombinieren, indem Sie ein Modell von Modellen erstellen. Sie können beispielsweise den Observability-Fußabdruck einer Geschäftseinheit oder eines gesamten Cloudbereichs erstellen, indem Sie Integritätsmodelle als Komponenten innerhalb eines größeren Modells verwenden. Integritätsmodelle stellen Arbeitslasten innerhalb der Fläche als Knoten innerhalb des Diagramms der obersten Ebene dar. Verwenden Sie die Beziehungen in diesem Modell, um Anwendungsabhängigkeiten zu erfassen, einschließlich Datenflüsse, Dienstinteraktionen und freigegebener Infrastruktur.

Betrachten Sie ein Einzelhandelsunternehmen, das verschiedene Anwendungen für E-Commerce, Zahlungen und Auftragsverarbeitung hat. Sie können jede dieser Anwendungen als unabhängiges Integritätsmodell definieren, um zu quantifizieren, welche Integrität für diese Workload bedeutet. Anschließend können Sie ein übergeordnetes Modell verwenden, um alle diese Komponentenintegritätsmodelle als Entitäten zuzuordnen und operative Auswirkungen zwischen Anwendungen über Abhängigkeitsketten zu erfassen. Wenn die E-Commerce-Anwendung beispielsweise ungesund wird, wirkt sie sich auf die Zahlungsanwendung überlappend aus.

Die Integritätsmodellierung bietet einen quantifizierten betrieblichen Basisplan, der auf einen bestimmten Geschäftskontext abgestimmt ist. KI für IT-Vorgänge (AIOps) ist eine beliebte Möglichkeit, die betriebliche Effizienz zu verbessern. Integritätsdaten sind eine grundlegende Eingabe für Machine Learning-Modelle zur Analyse von Gesundheitstrends. Beispielsweise können Machine Learning-Modelle:

  • Extrahieren Sie weitere Erkenntnisse aus Zustandsänderungen, und empfehlen Sie Aktionen.

  • Analysieren Sie Integritätstrends im Laufe der Zeit, um die Problemvorhersage und Modelleinschränkung zu fördern.

Verwalten Ihres Integritätsmodells

Die Pflege eines Heidemodells ist eine kontinuierliche technische Aktivität, die sich an die Entwicklung und den Betrieb Ihrer Anwendung richtet. Stellen Sie bei der Entwicklung ihrer Anwendung sicher, dass sich Ihr Integritätsmodell parallel weiterentwickelt.

Behandeln Sie auch Integritätsmodelle wie Workloadartefakte, die in Ihren Entwicklungslebenszyklus integriert werden sollten. Übernehmen Sie die Infrastruktur als Code (IaC) für eine konsistente, versionsgesteuerte Verwaltung Ihres Integritätsmodells. Verwenden Sie die Automatisierung, damit das Modell beim Hinzufügen oder Entfernen von Infrastruktur- und Anwendungskomponenten aus der Workload auf dem neuesten Stand bleibt.

Die Integritätsdaten werden im Laufe der Zeit schrittweise verringert. Um die Betriebliche Effizienz zu optimieren und Kosten zu minimieren, vermeiden Sie die Aufbewahrung von Gesundheitsdaten über 30 Tage hinweg. Bei Bedarf können Sie Daten archivieren, um Überwachungsanforderungen oder in Szenarien zu erfüllen, die eine langfristige Musteranalyse in KI für IT-Vorgänge beinhalten.

Hinweis

Wenn Sie Integritätsdaten archivieren, stellen Sie sicher, dass Sie sie mit dem Konfigurationsstatus des Modells verknüpfen. Das Interpretieren von Zustandsänderungen kann ohne diesen Kontext schwierig sein.

Nächster Schritt