Sicherung und Wiederherstellung für AKS
Sicherung und Wiederherstellung sind ein wesentlicher Bestandteil der Strategie jeder Organisation für Betrieb und Notfallwiederherstellung. Ein Sicherungs- und Wiederherstellungsplan beruht in der Regel auf einer Vielzahl von Technologien und Methoden, die auf dem regelmäßigen Erstellen von Kopien von Daten und Anwendungen auf einem separaten, sekundären Gerät oder Dienst basieren. Im Fall eines Systemfehlers, Datenverlusts oder Notfalls können anhand dieser Kopien die Daten und Anwendungen sowie die Geschäftsvorgänge, von denen sie abhängen, wiederhergestellt werden.
In diesem Abschnitt des AKS-Leitfadens (Azure Kubernetes Service) für Day-2-Vorgänge werden Sicherungs- und Wiederherstellungspraktiken für AKS beschrieben.
Warum das Sichern Ihres AKS-Clusters wichtig ist
Da der Einsatz von cloudnativen Bereitstellungen und Kubernetes immer mehr zunimmt, wird es für Organisationen immer wichtiger, Kubernetes-Cluster und Workloads in eine umfassende Sicherungs- und Wiederherstellungsstrategie aufzunehmen.
Wenn Sie die Sicherung und Wiederherstellung in AKS implementieren, können Sie:
- Eine sekundäre Kopie der Konfiguration und der Daten aus Ihrem AKS-Cluster für den Fall eines irreversiblen Systemfehlers, Datenverlusts oder Notfalls erstellen.
- Kubernetes-Ressourcen und Anwendungsdaten aus einem AKS-Cluster in einen anderen kopieren.
- Ihren AKS-Cluster replizieren, um andere Umgebungen zu erstellen.
- Vor Wartungsvorgängen wie AKS-Versionsupgrades Momentaufnahmen von Workloads erstellen.
- Datenschutzanforderungen einhalten und so die Compliance mit gesetzlichen Bestimmungen und Vorschriften der Organisation wahren.
- Eine schnelle Zurücksetzung auf eine vorherige Bereitstellung vornehmen, wenn ein Problem mit einer aktuellen Bereitstellung oder Änderung festgestellt wird.
Sicherungen erleichtern zwar die Wiederherstellung Ihrer Workload im Fall eines Problems, bieten aber keine hohe Verfügbarkeit (HA).
Im Hinblick auf die regionsinterne hohe Verfügbarkeit und die regionenübergreifende Notfallwiederherstellung in AKS können Sie verschiedene andere Optionen in Betracht ziehen, wie z. B.:
- Verfügbarkeitszonen: AKS unterstützt die Verwendung von Verfügbarkeitszonen, bei denen es sich um physisch getrennte Rechenzentren innerhalb einer Azure-Region handelt. Durch die Bereitstellung von AKS-Clustern in mehreren Verfügbarkeitszonen können Sie für eine höhere Resilienz und Fehlertoleranz innerhalb einer Region sorgen. Auf diese Weise können Ihre Anwendungen auch bei einem Ausfall in einer Zone betriebsbereit bleiben.
- Redundanzoptionen für persistente Volumes: AKS verfügt über verschiedene Redundanzoptionen für persistente Volumes. Der Azure Disk-CSI-Treiber für Kubernetes unterstützt integrierte Speicherklassen und benutzerdefinierte Speicherklassen, die für eine bessere regionsinterne Resilienz den lokal redundanten Speicher (LRS) oder den zonenredundanten Speicher (ZRS) nutzen. Weitere Informationen finden Sie unter Treiberparameter.
- Azure Kubernetes Fleet Manager: Azure Kubernetes Fleet Manager ermöglicht regionsinterne und regionenübergreifende Szenarien für AKS-Cluster mit mehreren Clustern und im großen Stil.
- Georedundanzoptionen für Azure Container Registry (ACR): Azure Container Registry (ACR) verfügt über Georeplikationsfunktionen. Mit Georedundanz werden Ihre Containerimages in verschiedenen Azure-Regionen repliziert. So bleiben Ihre Images auch bei einem Ausfall in einer bestimmten Region verfügbar, was eine höhere Verfügbarkeit für Ihre Containerregistrierung bedeutet.
Sie können auch Methoden wie Infrastructure as Code (IaC), Azure Pipelines, GitOps und Flux anwenden, um Ihre Workloads in einem Notfall schnell wieder bereitzustellen.
Weitere Informationen zu diesen Methoden finden Sie in den folgenden Artikeln:
- Erstellen und Bereitstellen in Azure Kubernetes Service mit Azure Pipelines
- Tutorial: Bereitstellen von Anwendungen mithilfe von GitOps mit Flux v2
- Grundlegendes zur Struktur und Syntax von ARM-Vorlagen
- Was ist Bicep?
- Übersicht über Terraform in Azure – Was ist Terraform?
Was gesichert werden sollte
Wenn die Sicherung und Wiederherstellung für AKS- und Kubernetes-Cluster generell in Betracht gezogen wird, muss unbedingt genau bestimmt werden, welche Komponenten in eine Sicherung einbezogen werden sollten, um eine erfolgreiche Wiederherstellung zu gewährleisten. Zu diesen entscheidenden Komponenten gehören in erster Linie:
Clusterstatus: Bezieht sich auf die aktuelle und gewünschte Konfiguration oder den aktuellen oder gewünschten Status aller Kubernetes-Objekte innerhalb des Clusters. Dazu gehören verschiedene Objekte wie Bereitstellungen, Pods, Dienste und anderes. Der Clusterstatus wird in einer hochverfügbaren etcd-Datenbank für Schlüssel-Wert-Paare gespeichert, die häufig nur vom API-Server aus zugänglich ist, wie es bei verwalteten Clustern wie AKS der Fall ist. Der Clusterstatus wird deklarativ definiert und ist das Ergebnis aller Kubernetes-Konfigurationsdateien, die auf den Cluster angewendet werden, wie z. B. YAML-Manifeste.
Anwendungsdaten: Bezieht sich auf die Daten, die von den im Cluster ausgeführten containerisierten Workloads erstellt, verwaltet oder aufgerufen werden. Um die Datenpersistenz über Pod- oder Containerneustarts hinweg sicherzustellen, empfiehlt Kubernetes das Speichern von Anwendungsdaten in persistenten Volumes. Diese Volumes können statisch oder dynamisch erstellt und durch verschiedene Arten von beständigen Speichern gesichert werden, was den Datenspeicher- und Verwaltungsanforderungen Flexibilität und Skalierbarkeit verleiht.
Während bei einer vollständigen Sicherung des Clusters sowohl der Clusterstatus als auch die Anwendungsdaten als einzelne Einheit einbezogen werden müssen, hängt die Ermittlung des optimalen Umfangs jeder Sicherung von verschiedenen Faktoren ab. So kann beispielsweise das Vorhandensein alternativer Quellen wie Continuous Integration und Continuous Delivery (CI/CD)-Pipelines eine einfachere Wiederherstellung des Clusterstatus ermöglichen. Darüber hinaus spielt die Größe der Anwendungsdaten eine Rolle für die Speicherkosten und den Zeitaufwand für die Sicherungs- und Wiederherstellungsvorgänge.
Die ideale Sicherungs- und Wiederherstellungsstrategie hängt stark von der konkreten Anwendung und Umgebung ab. Daher sollte der Umfang der Sicherung von Fall zu Fall bestimmt werden. Außerdem sollten Faktoren wie die Bedeutung des Clusterstatus und das Volumen der Anwendungsdaten berücksichtigt werden.
Das Abzielen auf andere Komponenten wie einzelne Clusterknoten (VMs) oder lokale Dateisysteme und Volumes, die in herkömmlichen Sicherungs- und Wiederherstellungsplänen für serverbasierte Systeme normalerweise enthalten sind, ist bei Kubernetes nicht relevant. Relevanter Status und Daten sind nicht auf die gleiche Weise wie bei herkömmlichen Systemen in einzelnen Knoten oder lokalen Dateisystemen persistent.
Einführung in Sicherungs- und Wiederherstellungsoptionen für AKS
Es gibt beachtliche Unterschiede zwischen herkömmlichen monolithischen Anwendungen und Workloads, die in einem Kubernetes-Cluster ausgeführt werden, was diverse Herausforderungen bei der Sicherung und Wiederherstellung mit sich bringt. Kubernetes-Workloads sind bewusst so konzipiert, dass sie hoch dynamisch und verteilt sind, wobei Daten über externe persistente Volumes hinweg bestehen bleiben, die von mehreren zugrunde liegenden Ressourcen und Diensten unterstützt werden.
Um Kubernetes-Umgebungen effektiv zu unterstützen, müssen Sicherungs- und Wiederherstellungslösungen ein Bewusstsein für Kubernetes und Anwendungen haben. Sie sollten über einen Grad an Automatisierung, Zuverlässigkeit und Integration verfügen, der bei älteren oder herkömmlicheren Sicherungs- und Wiederherstellungstools oft nicht zu finden ist.
Es stehen verschiedene Kubernetes-native Sicherungs- und Wiederherstellungslösungen zur Verfügung, deren Optionen von Open bis Closed Source reichen und die verschiedene Lizenzierungsmodelle anbieten.
Im Folgenden finden Sie einige Beispiele für Sicherungs- und Wiederherstellungslösungen, die Sie mit AKS verwenden können. Ein bemerkenswertes Beispiel ist die vollständig verwaltete Erstanbieterlösung von Microsoft namens Azure Kubernetes Service (AKS) Backup, die einen in Azure integrierten Dienst bereitstellt, der auf die Sicherung und Wiederherstellung von AKS-Clustern und deren Workloads ausgelegt ist. Diese Liste ist nicht vollständig und enthält nur einige verfügbare Optionen.
AKS Backup
AKS Backup ist das Angebot von Azure zum Sichern und Wiederherstellen von AKS-Clustern. Es handelt sich um einen einfachen, Azure-nativen Prozess, mit dem Sie die in Ihren AKS-Clustern ausgeführten containerisierten Anwendungen und Daten sichern und wiederherstellen können.
Mit AKS Backup können Sicherungen des Clusterstatus und der Anwendungsdaten, die in persistenten Azure-Volumes auf Datenträgern gespeichert sind, vollständig oder differenziert nach Bedarf oder planmäßig vorgenommen werden. Es ist in das Azure Backup Center integriert, sodass Sie Sicherungen in einem einzigen Bereich im Azure-Portal im großen Stil steuern, überwachen, betreiben und analysieren können.
Eine detaillierte Beschreibung der Funktionsweise von AKS Backup und der entsprechenden Funktionalitäten finden Sie unter Informationen zu AKS Backup mit Azure Backup.
Kasten
Kasten ist ein kommerzielles Produkt, das Betriebsteams ein benutzerfreundliches und sicheres System zur Sicherung und Wiederherstellung von Kubernetes-Anwendungen bietet. Es ist als kostenlose Version mit eingeschränkter Funktionalität und ohne Support wie auch als kostenpflichtige Version mit mehr Features und Kundendienst verfügbar.
Wenn Kasten als Kubernetes-Operator innerhalb des Clusters bereitgestellt wird, stellt es eine umfassende Sicherungslösung dar. Es verfügt über ein Verwaltungsdashboard für zentrale Steuerung und Sichtbarkeit. Kasten bietet den Benutzern den Vorteil inkrementeller und anwendungsabhängiger Sicherungen, die einen effizienten Datenschutz ermöglichen. Darüber hinaus verfügt Kasten über Notfallwiederherstellungsfunktionen. Zu diesen Funktionen gehören automatisiertes Failover und Failback sowie Features für die Datenmigration und die Gewährleistung der Sicherheit.
Weitere Informationen zu den Features von Kasten finden Sie in der Dokumentation zu Kasten K10. Informationen zur effektiven Verwendung von Kasten mit AKS-Clustern finden Sie unter Installieren von K10 auf Azure.
Velero
Velero ist ein weit verbreitetes Open-Source-Sicherungs- und Wiederherstellungstool für Kubernetes. Es bietet allen Benutzern eine kostenlose und uneingeschränkte Version mit Unterstützung und Wartung durch eine Gemeinschaft von Projektmitwirkenden.
Velero wird als Bereitstellung im Cluster ausgeführt und bietet eine umfassende Reihe von Features für die Sicherung und Wiederherstellung von Anwendungen und die Datenmigration. Dashboards sind zwar nicht sofort einsatzbereit, können aber über externe Integrationen hinzugefügt werden.
Weitere Informationen zu den Features und zur Integration in AKS-Cluster finden Sie in der Velero-Dokumentation.
Installieren und Konfigurieren von AKS Backup
Gehen Sie zum Installieren und Konfigurieren von AKS Backup nach den folgenden Schritten vor:
- Eine detaillierte Beschreibung der Voraussetzungen für die Verwendung von AKS Backup mit Ihrem AKS-Cluster finden Sie unter Voraussetzungen für AKS Backup mit Azure Backup.
- In der Unterstützungsmatrix für AKS Backup finden Sie eine detaillierte Beschreibung der regionalen Verfügbarkeit, der unterstützten Szenarien und der Einschränkungen von AKS Backup.
- Anleitungen zum Registrieren der erforderlichen Ressourcenanbieter für Ihre Abonnements und zum Verwalten dieser Registrierungen finden Sie unter Verwalten von AKS-Sicherungen mit Azure Backup.
- Detaillierte Anweisungen zum Einrichten der Sicherung und Wiederherstellung für Ihren AKS-Cluster mit AKS Backup finden Sie unter Sicherung von AKS mit Azure Backup. Die Anweisungen umfassen die Erstellung und Konfiguration aller erforderlichen Azure-Ressourcen wie Sicherungstresor, Sicherungsrichtlinien und Sicherungsinstanzen.
- Detaillierte Anweisungen zum Ausführen vollständiger oder elementbezogener Wiederherstellungen Ihres AKS-Clusters aus einer vorhandenen Sicherungsinstanz finden Sie unter Wiederherstellung von AKS mit Azure Backup.
Sicherungshäufigkeit und Aufbewahrung in AKS: Definieren einer Sicherungsrichtlinie
Die Bestimmung der Sicherungshäufigkeit und des Aufbewahrungszeitraums ist ein grundlegender Aspekt von Sicherungs- und Wiederherstellungslösungen. Diese Parameter legen fest, wie oft Sicherungen ausgeführt werden und wie lange sie vor dem Löschen aufbewahrt werden. Die Auswahl der Sicherungshäufigkeit und des Aufbewahrungszeitraums für einen AKS-Cluster und seine Workloads sollte mit den vorgegebenen Zielen von Recovery Point Objective (RPO) und Recovery Time Objective (RTO) übereinstimmen.
In einem Kubernetes-Szenario stellt das RPO den maximal akzeptablen Umfang an Clusterstatus- oder Datenverlust dar, der toleriert werden kann. Das RTO gibt die maximal zulässige Zeit zwischen einem Clusterstatus- oder Datenverlust und der Wiederaufnahme des Clusterbetriebs an.
Die gewählte Sicherungshäufigkeit und der gewählte Aufbewahrungszeitraum sind ein Kompromiss zwischen wünschenswerten RPO/RTO-Zielen, Speicherkosten und Mehraufwand für die Sicherungsverwaltung. Dies bedeutet, dass es keine Universalkonfiguration für alle AKS-Cluster und Workloads gibt und dass die optimale Konfiguration für jeden Cluster oder jede Workload stattdessen von Fall zu Fall entsprechend den Anforderungen des Unternehmens nach sorgfältiger Planung und Überlegung festgelegt werden sollte. Zu den relevanten Faktoren, die beim Festlegen der Sicherungshäufigkeit und des Aufbewahrungszeitraums eines AKS-Clusters zu berücksichtigen sind, gehören:
- Kritikalität: Der Kritikalitätsgrad, der dem Cluster und seinen Workload-Anwendungsdaten im Hinblick auf die Geschäftskontinuität zugeordnet wird.
- Zugriffsmuster und Änderungsrate: Der Umfang an Clusterstatus und Daten, der in einem bestimmten Zeitraum hinzugefügt, geändert oder gelöscht wird.
- Datenvolumen: Das Datenvolumen, das sich auf die Speicherkosten und den Zeitaufwand für Sicherungs- und Wiederherstellungsvorgänge auswirkt.
- Compliance: Die Anforderungen an die Datenaufbewahrung und Datenhoheit basierend auf internen Complianceregeln und Branchenvorschriften.
In AKS Backup werden Sicherungshäufigkeit und Aufbewahrungszeitraum als Sicherungsrichtlinienressource gespeichert, die sowohl für den Clusterstatus als auch für die Anwendungsdaten aus persistenten Volumes gilt.
Sicherungsrichtlinien in AKS Backup unterstützen tägliche und stündliche Sicherungen mit Aufbewahrungszeiträumen von bis zu 360 Tagen. Es können mehrere Richtlinien definiert und auf denselben Cluster angewendet werden.
Weitere Informationen zum Konfigurieren von Sicherungsrichtlinien in AKS Backup finden Sie unter Erstellen einer Sicherungsrichtlinie.
Weitere Sicherungsüberlegungen
Um sicherzustellen, dass Ihre Sicherungs- und Wiederherstellungslösung die Anforderungen und Richtlinien Ihrer Organisation erfüllt, sind folgende Punkte zu beachten:
- Recovery Point Objective (RPO) und Recovery Time Objective (RTO): Ermitteln Sie, ob Sie bestimmte RPO- und RTO-Ziele haben, die für Ihre Sicherungen und Wiederherstellungsvorgänge erfüllt werden müssen.
- Persistente Volumes (PVs): Überprüfen Sie, ob Sie persistente Volumes verwenden und stellen Sie sicher, dass die AKS Backup-Lösung Ihre PV-Typen unterstützt. Details zur Kompatibilität finden Sie in der Unterstützungsmatrix für AKS Backup.
- Sicherungsumfang: Legen Sie fest, was gesichert werden muss, z. B. bestimmte Namespaces, Ressourcentypen oder bestimmte Daten innerhalb des Clusters. Weitere Informationen finden Sie unter Konfigurieren eines Sicherungsauftrags.
- Sicherungshäufigkeit und Aufbewahrung: Bestimmen Sie die Häufigkeit, mit der Sie Sicherungen durchführen müssen, und die Dauer, für die Sie sie aufbewahren müssen. Diese Einstellung kann mithilfe von Sicherungsrichtlinien konfiguriert werden. Weitere Informationen finden Sie unter Definieren einer Sicherungsrichtlinie.
- Clusterauswahl: Entscheiden Sie basierend auf Ihren Anforderungen, ob Sie alle Cluster oder nur bestimmte Produktionscluster sichern müssen.
- Testwiederherstellungsverfahren: Führen Sie regelmäßige Testwiederherstellungen durch, um die Zuverlässigkeit und Brauchbarkeit Ihrer Sicherungsstrategie zu überprüfen. Dieser Schritt ist entscheidend zum Gewährleisten der Effektivität der Sicherungs- und Wiederherstellungslösung. Weitere Informationen finden Sie unter Wiederherstellen eines AKS-Clusters.
- Unterstützte Szenarien: Überprüfen Sie, ob die AKS Backup-Lösung Ihr konkretes Szenario unterstützt. Informationen zur Kompatibilität finden Sie in der Unterstützungsmatrix für AKS Backup.
- Budgetzuweisungen: Überlegen Sie, ob Sie bestimmte Budgetzuweisungen für Sicherungs- und Wiederherstellungsvorgänge haben. Überprüfen Sie die von der AKS Backup-Lösung angegebenen Preisinformationen zwecks Abstimmung mit ihren Budgetanforderungen.
Anhand dieser weiteren Überlegungen können Sie gewährleisten, dass Ihre Sicherungs- und Wiederherstellungslösung für AKS die Anforderungen und Präferenzen Ihrer Organisation effizient und effektiv erfüllt.
Speicherort und Speicher für AKS Backup
AKS Backup verwendet einen Sicherungstresor und ein Speicherkonto zum Speichern der verschiedenen Datentypen, die während einer Sicherung aus einem Cluster erfasst werden.
Für persistente Volumes auf Datenträgern verwendet AKS Backup inkrementelle Momentaufnahmen des zugrunde liegenden Azure-Datenträgers, die in Ihrem Azure-Abonnement gespeichert sind.
Ein Sicherungstresor ist eine sichere Speicherentität in Azure, die zum Speichern von Sicherungsdaten für von Azure Backup unterstützte Workloads dient, wie z. B. AKS-Cluster. Der Sicherungstresor selbst enthält sowohl die Sicherungsrichtlinien als auch die Sicherungen und Wiederherstellungspunkte, die von Sicherungsaufträgen erstellt wurden.
Azure verwaltet automatisch den Speicher für einen Sicherungstresor. Sie haben mehrere Redundanzoptionen für die darin gespeicherten Daten zur Auswahl, die zum Zeitpunkt der Erstellung des Sicherungstresors konfiguriert werden können.
Ein Speicherkonto ist ein Speicherbereich für Ihre Datenobjekte in Azure und ist in hohem Maß konfigurierbar. Es verfügt über mehrere regionsinterne und regionenübergreifende Redundanzoptionen zur Wahrung der Dauerhaftigkeit der Daten. AKS Backup verwendet für Sicherungen einiger Komponenten des AKS-Clusters einen Blob-Container innerhalb eines bestimmten Speicherkontos.
Inkrementelle Momentaufnahmen sind Sicherungen zu einem bestimmten Zeitpunkt für verwaltete Datenträger, die bei der Erfassung nur aus den Änderungen seit der letzten Momentaufnahme bestehen. Die erste inkrementelle Momentaufnahme ist eine vollständige Kopie des Datenträgers. In nachfolgenden inkrementellen Momentaufnahmen werden nur Deltaänderungen an Datenträgern seit der letzten Momentaufnahme erfasst.
Einsatz von AKS Backup zum Migrieren von Workloads zwischen AKS-Clustern
Sie können AKS Backup als Mechanismus zur Sicherung und Wiederherstellung für bestimmte Cluster verwenden. AKS Backup unterstützt auch Migrationsszenarien, da Sie eine Sicherung eines Clusters erstellen und sie auf einem anderen wiederherstellen können, z. B.:
- Wiederherstellen eines Entwicklungsclusters in einem Staging-Cluster
- Replizieren von Inhalten über mehrere Cluster hinweg
Um sicherzustellen, dass Ihr Szenario unterstützt wird, lesen Sie die folgende Dokumentation:
Beitragende
Dieser Artikel wird von Microsoft gepflegt. Er wurde ursprünglich von folgenden Mitwirkenden geschrieben:
Hauptautor:
- Adam Sharif | Technical Advisor
- Joao Tavares | Senior Escalation Engineer
Andere Mitwirkende:
- Paolo Salvatori | Principal Customer Engineer, FastTrack for Azure
- Sonia Cuff | Principal Cloud Advocate Lead
Nächste Schritte
Weitere Informationen zu AKS Backup
- Übersicht über AKS Backup
- Unterstützungsmatrix für AKS Backup
- Voraussetzungen für AKS Backup
- Konfigurieren von AKS Backup
- Erstellen eines Sicherungstresors
- Erstellen einer Sicherungsrichtlinie
- Konfigurieren von Sicherungen
- Wiederherstellen eines AKS-Clusters
- Bewährte Methoden für Business Continuity & Disaster Recovery für AKS
- Resilienz