Nach einem Incident
Das Azure-Entwicklungsteam führt interne Retrospektiven für Dienstvorfälle durch, die sich auf Kunden auswirken, um zu erfahren, was passiert ist – letztendlich, um Vorfälle weniger wahrscheinlich oder zumindest weniger schwerwiegend zu machen. Einblicke aus diesen internen Untersuchungen werden betroffenen Kunden und Partnern in Form von Post Incident Reviews (PIRs) bereitgestellt.
Für unsere größten schwerwiegenden Dienstvorfälle (insbesondere Vorfälle mit Multi-Service- und Multiregions-Auswirkungen) laden wir auch betroffene Kunden zu einem Livestream für Azure Incident Retrospektive ein – um zu hören, was passiert ist und was wir gelernt haben, und Kunden und Partner können Antworten von unseren Experten auf alle Fragen zu dem Vorfall erhalten.
Wenn wir aufgrund eines oder mehrerer Dienstvorfälle unsere Service Level Agreements (SLAs) nicht erreichen oder einhalten können, sind betroffene Kunden ggf. berechtigt, eine Gutschrift in Höhe eines Teils ihrer monatlichen Servicegebühren erstattet zu bekommen.
Post Incident Reviews (PIRs)
Für jeden Azure-Dienstvorfall, der sich auf Kunden auswirkt, stellen wir eine Risikominderungserklärung bereit, die zusammenfasst, was passiert ist, mit welchen Diensten, in welchen Regionen und wann die Auswirkungen begonnen und letztendlich behoben wurden.
Bei kleineren, weniger wirkungsvollen Dienstproblemen, bei denen der Trigger und die beitragenden Faktoren bereits gut verstanden werden, ist diese Risikominderungserklärung die abschließende Zusammenfassung. (Wenn sich beispielsweise Probleme nur auf eine Teilmenge eines einzelnen Dienstes innerhalb einer einzelnen Region auswirken, mit nur einer relativ kurzen Auswirkungsdauer.)
Bei Dienstproblemen, die abgemildert wurden, aber dennoch eine genauere Untersuchung erforderlich ist, folgt der Risikominderungserklärung ein Post Incident Review (PIR), sobald unsere internen Untersuchungen abgeschlossen sind, generell innerhalb von 14 Tagen nach der Entschärfung. PIRs umfassen alle Erkenntnisse oder Verbesserungen, die Microsoft als Ergebnis des Vorfalls vornimmt, und alle relevanten Resilienzempfehlungen für die Art und Weise, wie Kunden und Partner ähnliche Vorfälle weniger schwerwiegend machen können.
Für unsere größten, wirkungsvollsten Dienstprobleme folgt der Risikominderungserklärung ein Post Incident Review (PIR) in der Regel innerhalb von 72 Stunden nach der Entschärfung, um zusammenzufassen, was wir bisher aus der noch in Bearbeitung befindlichen Untersuchung gelernt haben. (Wenn sich z. B. Probleme auf mehrere Dienste oder mehrere Regionen auswirken oder eine erweiterte Auswirkungsdauer aufweisen.) Sobald unsere interne Retrospektive abgeschlossen ist, wird im Allgemeinen innerhalb von 14 Tagen nach der Entschärfung eine Final Post Incident Review (PIR) veröffentlicht, um zusätzliche Details oder Erkenntnisse bereitzustellen.
Alle Post Incident Reviews (PIRs) werden über Azure Service Health an betroffene Abonnements gesendet, die auf dem Blatt „Integritätsverlauf“ landen. Dadurch werden auch alle vom Kunden konfigurierten Dienststatuswarnungen ausgelöst, bei denen die Warnungskriterien den Ereignistyp „Dienstproblem“ enthalten und werden mit dem Attribut „Stage“ auf „RCA“ markiert. Bei Vorfällen, die unsere Kriterien für die öffentliche Offenlegung erfüllt haben („Szenario 1“-Vorfälle, wie in unserer öffentlichen Dokumentation beschrieben), steht der neueste Post Incident Review nach Vorfällen auch auf der Seite “Azure-Statusverlauf“ zur Verfügung.
Hinweis
Wir sind dabei, von „Root Cause Analyses (RCAs)“ zu „Post Incident Reviews (PIRs)“ zu wechseln, sodass Sie vorübergehend beide Begriffe im Azure-Portal und in Service Health-Warnungen sehen können.
Azure Incident Retrospective (Livestreamereignisse für Kunden)
Für unsere größten schwerwiegendsten Dienstvorfälle (insbesondere diejenigen, die unsere Kriterien für die öffentliche Offenlegung erfüllten, „Szenario 1“-Vorfälle, wie in unserer öffentlichen Dokumentation beschrieben), laden wir betroffene Kunden ein, an einem Livestreamereignis mit Azure Incident Retrospektive teilzunehmen.
Diese Webcast-Foren ermöglichen es den Kunden und Partnern, die von dem Vorfall betroffen waren, eine Diskussion mit den technischen Leitern unserer relevanten Serviceteams zu beobachten, die zusammenfasst, was passiert ist, wie wir reagiert haben, was wir gelernt haben und was wir tun werden (oder was wir bereits tun), um „Vorfälle wie diesen“ weniger wahrscheinlich oder zumindest weniger schwerwiegend zu machen.
Darüber hinaus bieten Azure Incident Retrospecktive-Livestreams Kund*innen und Partnern die Möglichkeit, Fragen zu dem Vorfall zu stellen, die von unseren Expert*innen beantwortet werden, in einer moderierten Frage-Antwort-Runde (Q&A), die mit Vertreter*innen unserer relevanten Entwicklungsteams besetzt ist.
Um sicherzustellen, dass Sie zu einer Azure Incident Retrospektive eingeladen werden (wenn Ihre Dienste von einem qualifizierenden „Szenario 1“-Vorfall betroffen waren), stellen Sie sicher, dass Sie Azure Service Health-Warnungen konfiguriert haben. Einladungen zu den Livestreams für Azure Incident Retrospektive werden an den Dienststatus und über Dienststatuswarnungen verteilt, genau wie Post Incident Reviews (PIRs).
Nach jedem Livestream veröffentlichen wir eine Aufzeichnung der Sitzung, um diese YouTube-Wiedergabeliste zu und gegebenenfalls das PIR auf der Seite Statusverlauf mit einem Link zu aktualisieren.
Service Level Agreements (SLAs) und Service Credit-Prozess
Die Vereinbarungen zum Servicelevel (Service Level Agreements, SLA) beschreiben die Verpflichtungen von Microsoft die Verfügbarkeit und Konnektivität für Microsoft Online Services sicherzustellen. Die aktuellen und archivierten Editionen der SLA stehen zum Download zur Verfügung und decken Azure sowie Dynamics 365, Office 365 und Intune ab. Wenn wir die Servicelevels für jeden Dienst nicht erreichen und verwalten, wie in diesem SLA beschrieben (aus irgendeinem Grund, einschließlich aufgrund eines oder mehrerer Dienstvorfälle), können Kunden anspruchsberechtigt sein, einen Teil ihrer monatlichen Servicegebühren erstattet zu bekommen.
Damit Microsoft einen SLA-Rückforderungsanspruch in Betracht ziehen kann, müssen Sie innerhalb von zwei Monaten nach Ablauf des Abrechnungsmonats, in dem der Vorfall, der Gegenstand der Rückforderung ist, aufgetreten ist, einen Antrag auf Erstattung an den Kundensupport übermitteln. Um eine, Antrag zu übermitteln, melden Sie sich beim Azure-Portal an, erstellen Sie eine neue Supportanfrage, wählen Sie den Problemtyp „Antrag auf Erstattung“ aus, wählen Sie den Problemtyp „Rückerstattungsantrag“ aus, und geben Sie dann so viele Details wie möglich an – einschließlich der Vorfallverfolgungs-ID aus Azure Service Health und Informationen darüber, welche Dienste und Ressourcen als Ergebnis bei Ihnen betroffen waren.
Unsere Abrechnungssupportteams überprüfen, welche Ressourcen, Dienste und Abonnements betroffen waren, und berechnen und wenden alle relevanten SLA-Gutschriften an. Wir unternehmen wirtschaftlich angemessene Anstrengungen, um Ansprüche innerhalb des nachfolgenden Monats und innerhalb von 45 Tagen nach Erhalt zu bearbeiten. Wenn wir feststellen, dass Ihnen eine Gutschrift geschuldet ist, wenden wir diese Gutschrift auf Ihre monatlichen Servicegebühren an.
Servicegutschriften sind Ihr einziger und ausschließlicher Rechtsbehelf für Leistungs- oder Verfügbarkeitsprobleme für alle Dienste im Rahmen der Vereinbarung der SLA. Vorschauen und Onlinedienste oder Serviceebenen, die kostenlos bereitgestellt werden, sind nicht enthalten und berechtigen zu SLA-Ansprüchen oder Gutschriften. Beachten Sie schließlich, dass die in jedem Abrechnungsmonat für eine bestimmte Dienst- oder Dienstressource vergebenen Dienstgutschriften unter keinen Umständen Ihre monatlichen Servicegebühren für diese Dienst- oder Dienstressource im Abrechnungsmonat überschreiten.