Dela via


Säkerhetskopiering och återställning för AKS

Säkerhetskopiering och återställning är en viktig del av organisationens strategi för drifts- och haveriberedskap. En säkerhetskopierings- och återställningsplan förlitar sig vanligtvis på en mängd olika tekniker och metoder som baseras på regelbundna kopior av data och program till en separat, sekundär enhet eller tjänst. Om ett systemfel, dataförlust eller haveri inträffar används dessa kopior för att återställa data och program och de affärsåtgärder som de är beroende av.

I det här avsnittet av åtgärdsguiden för Azure Kubernetes Service (AKS) dag-2 beskrivs säkerhetskopierings- och återställningsmetoder för AKS.

Därför är det viktigt att säkerhetskopiera ditt AKS-kluster

I takt med att molnbaserade distributioner och Kubernetes fortsätter att växa under implementeringen blir det allt viktigare för organisationer att inkludera Kubernetes-kluster och arbetsbelastningar i en omfattande strategi för säkerhetskopiering och återställning.

Genom att implementera säkerhetskopiering och återställning i AKS kan du:

  • Skapa en sekundär kopia av konfigurationen och data från AKS-klustret för att använda om oåterkalleliga systemfel, dataförlust eller haveri inträffar.
  • Kopiera Kubernetes-resurser och programdata från ett AKS-kluster till ett annat.
  • Replikera DITT AKS-kluster för att skapa andra miljöer.
  • Ta ögonblicksbilder av arbetsbelastningen innan underhållsåtgärder, till exempel uppgraderingar av AKS-version.
  • Följ dataskyddskraven för att upprätthålla regel- eller organisationsefterlevnad.
  • Återställ snabbt till en tidigare distribution om ett problem med en nyligen genomförd distribution eller ändring har identifierats.

Även om säkerhetskopior hjälper dig att återställa din arbetsbelastning om ett problem uppstår, ger de inte hög tillgänglighet (HA).

När det gäller hög tillgänglighet inom regionen och haveriberedskap mellan regioner i AKS kan du överväga flera andra alternativ, till exempel:

  • Tillgänglighetszoner: AKS stöder användning av tillgänglighetszoner, som är fysiskt separata datacenter i en Azure-region. Genom att distribuera AKS-kluster i flera tillgänglighetszoner kan du säkerställa högre återhämtning och feltolerans inom en region. På så sätt kan dina program fortsätta att fungera även om en zon upplever ett avbrott.
  • Redundansalternativ för beständiga volymer: AKS tillhandahåller olika redundansalternativ för beständiga volymer. Azure Disk CSI-drivrutinen för Kubernetes stöder inbyggda lagringsklasser och anpassade lagringsklasser som använder lokalt redundant lagring (LRS) eller zonredundant lagring (ZRS) för bättre återhämtning inom regionen. Mer information finns i Drivrutinsparametrar.
  • Azure Kubernetes Fleet Manager: Azure Kubernetes Fleet Manager möjliggör scenarier för flera kluster och i stor skala inom och mellan regioner för AKS-kluster.
  • Alternativ för geo-redundans för Azure Container Registry (ACR): Azure Container Registry (ACR) erbjuder geo-replikeringsfunktioner. Med geo-redundans replikeras dina containeravbildningar i olika Azure-regioner. Så även om en viss region upplever ett avbrott är dina avbildningar tillgängliga, vilket ger högre tillgänglighet för containerregistret.

Du kan också använda metoder som Infrastruktur som Kod (IaC), Azure Pipelines, GitOps och Flux för att snabbt distribuera om dina arbetsbelastningar om en katastrof inträffar.

Om du vill veta mer om dessa metoder kan du läsa de här artiklarna:

Vad ska säkerhetskopieras?

När du överväger säkerhetskopiering och återställning för AKS- och Kubernetes-kluster i allmänhet är det viktigt att identifiera exakt vilka komponenter som ska ingå i en säkerhetskopia för att säkerställa en lyckad återställning. I första hand består dessa kritiska komponenter av:

  • Klustertillstånd: Refererar till den aktuella och önskade konfigurationen eller tillståndet för alla Kubernetes-objekt i klustret. Den omfattar olika objekt, till exempel distributioner, poddar, tjänster med mera. Klustertillståndet lagras i en nyckel/värde-nyckel/värde-databas med hög tillgänglighet, som ofta endast är tillgänglig från API-servern, vilket är fallet med hanterade kluster som AKS. Klustertillståndet definieras på ett deklarativt sätt och är resultatet av alla Kubernetes-konfigurationsfiler som tillämpas på klustret, till exempel YAML-manifest.

  • Programdata: Refererar till de data som skapas, hanteras eller nås av de containerbaserade arbetsbelastningar som körs i klustret. För att säkerställa datapersistence mellan poddar eller containeromstarter rekommenderar Kubernetes att programdata lagras i beständiga volymer. Dessa volymer kan skapas statiskt eller dynamiskt och kan backas upp av olika typer av beständig lagring, vilket ger flexibilitet och skalbarhet för datalagring och hanteringskrav.

Även om en fullständig säkerhetskopia av klustret kräver att både klustertillståndet och programdata inkluderas som en enda enhet, beror det på olika faktorer att fastställa det optimala omfånget för varje säkerhetskopia. Till exempel kan förekomsten av alternativa källor, till exempel CI/CD-pipelines (Continuous Integration and Continuous Delivery) möjliggöra enklare återställning av klustertillståndet. Dessutom spelar storleken på programdata en roll i lagringskostnaderna och den tid som krävs för säkerhetskopierings- och återställningsåtgärder.

Den idealiska säkerhetskopierings- och återställningsstrategin är mycket beroende av det specifika programmet och miljön. Säkerhetskopieringens omfattning bör därför bedömas från fall till fall. Den bör också ta hänsyn till faktorer som klustertillståndets betydelse och mängden programdata.

Att rikta in sig på andra komponenter, till exempel enskilda klusternoder (VM) eller lokala filsystem och volymer, som vanligtvis ingår i traditionella säkerhetskopierings- och återställningsplaner för serverbaserade system, är inte relevant i Kubernetes. Relevant tillstånd och data sparas inte på enskilda noder eller lokala filsystem på samma sätt som traditionella system.

Introduktion till alternativ för säkerhetskopiering och återställning för AKS

Det finns anmärkningsvärda skillnader mellan traditionella monolitiska program och arbetsbelastningar som körs i ett Kubernetes-kluster, vilket medför flera utmaningar för säkerhetskopiering och återställning. Kubernetes-arbetsbelastningar är avsiktligt utformade för att vara mycket dynamiska och distribuerade, med data bevarade över externa beständiga volymer som stöds av flera underliggande resurser och tjänster.

För att effektivt stödja Kubernetes-miljöer måste säkerhetskopierings- och återställningslösningar ha Kubernetes och programmedvetenhet. De bör erbjuda en viss grad av automatisering, tillförlitlighet och integrering, vilket ofta inte finns i äldre eller mer konventionella säkerhetskopierings- och återställningsverktyg.

Olika Kubernetes-inbyggda lösningar för säkerhetskopiering och återställning är tillgängliga, med alternativ som sträcker sig från öppen till sluten källa och erbjuder olika licensieringsmodeller.

Här följer några exempel på säkerhetskopierings- och återställningslösningar som du kan använda med AKS. Ett viktigt exempel är Microsofts fullständigt hanterade förstapartslösning med namnet Azure Kubernetes Service (AKS) Backup, som tillhandahåller en Azure-integrerad tjänst som är utformad för säkerhetskopiering och återställning av AKS-kluster och deras arbetsbelastningar. Den här listan är inte fullständig och innehåller bara några få tillgängliga alternativ.

AKS-säkerhetskopiering

AKS Backup är Azures erbjudande för att säkerhetskopiera och återställa dina AKS-kluster. Det är en enkel, Azure-intern process som gör att du kan säkerhetskopiera och återställa de containerbaserade program och data som körs i dina AKS-kluster.

AKS Backup möjliggör säkerhetskopiering på begäran eller schemalagda säkerhetskopieringar av fullständigt eller detaljerad klustertillstånd och programdata som lagras i Azure-diskbaserade beständiga volymer. Den integreras med Azure Backup Center för att tillhandahålla ett enda område i Azure Portal som kan hjälpa dig att styra, övervaka, använda och analysera säkerhetskopior i stor skala.

Se Om AKS Backup med Azure Backup för en detaljerad beskrivning av hur AKS Backup fungerar och dess funktioner.

Kasten

Kasten är en kommersiell produkt som ger driftteam ett lätthanterad och säkert system för säkerhetskopiering och återställning av Kubernetes-program. Den är tillgänglig i både en kostnadsfri version med begränsad funktionalitet och ingen support, och en betald version som innehåller fler funktioner och kundsupport.

När Kasten distribueras som en Kubernetes-operator i klustret ger det en omfattande säkerhetskopieringslösning. Den erbjuder en instrumentpanel för hantering för centraliserad kontroll och synlighet. Med Kasten kan användarna dra nytta av inkrementella och programmedvetna säkerhetskopior, vilket möjliggör effektivt dataskydd. Dessutom erbjuder Kasten funktioner för haveriberedskap. Dessa funktioner omfattar automatiserad redundans och återställning efter fel samt funktioner för datamigrering och säkerhet.

Mer information om Kastens funktionsuppsättning finns i Kasten K10-dokumentationen. Information om hur du effektivt använder Kasten med AKS-kluster finns i Installera K10 på Azure.

Velero

Velero är ett allmänt använt säkerhetskopierings- och återställningsverktyg med öppen källkod för Kubernetes. Den erbjuder en kostnadsfri och obegränsad version som är tillgänglig för alla användare, med support och underhåll som tillhandahålls av en community med projektdeltagare.

Velero körs som en distribution i klustret och tillhandahåller en omfattande uppsättning funktioner för programsäkerhetskopiering, återställning och datamigrering. Instrumentpaneler är inte tillgängliga direkt, men de kan läggas till via externa integreringar.

Mer information om dess funktionsuppsättning och hur du integrerar den med AKS-kluster finns i Velero-dokumentationen.

Installera och konfigurera AKS-säkerhetskopiering

Följ dessa steg för att installera och konfigurera AKS Backup:

  1. Se Krav för AKS-säkerhetskopiering med Azure Backup för en detaljerad beskrivning av kraven för att använda AKS Backup med ditt AKS-kluster.
  2. I stödmatrisen för AKS Backup finns en detaljerad beskrivning av tillgängligheten för AKS Backup-regionen, scenarier och begränsningar som stöds.
  3. Se Hantera AKS-säkerhetskopieringar med Hjälp av Azure Backup för vägledning om hur du registrerar nödvändiga resursproviders i dina prenumerationer och hanterar dessa registreringar.
  4. Mer information om hur du konfigurerar säkerhetskopiering och återställning för AKS-klustret med HJÄLP av AKS Backup finns i Säkerhetskopiera AKS med Hjälp av Azure Backup . Anvisningarna omfattar skapande och konfiguration av alla nödvändiga Azure-resurser, till exempel säkerhetskopieringsvalv, säkerhetskopieringsprinciper och säkerhetskopieringsinstanser.
  5. Mer information om hur du utför fullständiga återställningar eller återställningar på objektnivå av AKS-klustret från en befintlig säkerhetskopieringsinstans finns i Återställa AKS med Azure Backup .

Säkerhetskopieringsfrekvens och kvarhållning i AKS: definiera en säkerhetskopieringsprincip

Att fastställa säkerhetskopieringsfrekvensen och kvarhållningsperioden är en grundläggande aspekt av säkerhetskopierings- och återställningslösningar. Dessa parametrar definierar hur ofta säkerhetskopieringar utförs och hur länge de behålls innan de tas bort. Valet av säkerhetskopieringsfrekvens och kvarhållningsperiod för ett AKS-kluster och dess arbetsbelastningar bör överensstämma med de fördefinierade målen för Mål för återställningspunkt (RPO) och Mål för återställningstid (RTO).

I ett Kubernetes-scenario representerar RPO den maximala tillåtna mängden klustertillstånd eller dataförlust som kan tolereras. RTO anger den maximala tillåtna tiden mellan klustertillstånd eller dataförlust och återupptagande av klusteråtgärder.

Den valda säkerhetskopieringsfrekvensen och kvarhållningsperioden är en kompromiss mellan önskvärda RPO/RTO-mål, lagringskostnader och kostnader för säkerhetskopieringshantering. Det innebär att det inte finns någon konfiguration som passar alla för alla AKS-kluster och arbetsbelastningar, och den optimala konfigurationen för varje kluster eller arbetsbelastning bör i stället definieras från fall till fall för att uppfylla företagets krav, efter noggrann planering och överväganden. Relevanta faktorer att tänka på när du definierar ett AKS-klusters säkerhetskopieringsfrekvens och kvarhållningsperiod är:

  • Kritiskhet: Nivån av kritiskhet som är associerad med klustret och dess programdata för arbetsbelastning när det gäller affärskontinuitet.
  • Åtkomstmönster och ändringshastighet: Mängden klustertillstånd och data som läggs till, ändras och tas bort under en viss tidsperiod.
  • Datavolym: Mängden data som påverkar lagringskostnaderna och den tid som krävs för att slutföra säkerhetskopierings- och återställningsåtgärder.
  • Efterlevnad: Kraven för datakvarhållning och datasuveränitet baserat på interna efterlevnadsregler och branschregler.

I AKS Backup-tjänsten lagras säkerhetskopieringsfrekvensen och kvarhållningsperioden som en principresurs för säkerhetskopiering , vilket gäller både klustertillståndet och programdata från beständiga volymer.

Säkerhetskopieringsprinciper i AKS Backup stöder dagliga och timvisa säkerhetskopieringar, med kvarhållningsperioder på upp till 360 dagar, medan flera principer kan definieras och tillämpas på samma kluster.

Mer information om hur du konfigurerar säkerhetskopieringsprinciper i AKS Backup finns i Skapa en säkerhetskopieringsprincip .

Andra överväganden vid säkerhetskopiering

Tänk på följande för att säkerställa att säkerhetskopierings- och återställningslösningen uppfyller organisationens krav och principer:

  • Mål för återställningspunkt (RPO) och mål för återställningstid (RTO): Avgör om du har specifika mål för återställningspunkt och RTO som måste uppfyllas för dina säkerhetskopieringar och återställningsåtgärder.
  • Beständiga volymer (PV:er): Kontrollera om du använder beständiga volymer och se till att AKS Backup-lösningen stöder dina PV-typer. Mer information om kompatibilitet finns i stödmatrisen för AKS Backup.
  • Säkerhetskopieringsomfång: Definiera vad som behöver säkerhetskopieras, till exempel specifika namnområden, typer av resurser eller specifika data i klustret. Mer information finns i Konfigurera ett säkerhetskopieringsjobb.
  • Frekvens och kvarhållning av säkerhetskopior: Bestäm med vilken frekvens du behöver utföra säkerhetskopior och hur länge du behöver behålla dem. Den här inställningen kan konfigureras med hjälp av säkerhetskopieringsprinciper. Mer information finns i Definiera en säkerhetskopieringsprincip.
  • Klusterval: Bestäm om du behöver säkerhetskopiera alla kluster eller endast specifika produktionskluster baserat på dina krav.
  • Teståterställningsprocedur: Utför periodiska teståterställningar för att verifiera tillförlitligheten och användbarheten för din säkerhetskopieringsstrategi. Det här steget är avgörande för att säkerställa säkerhetskopierings- och återställningslösningens effektivitet. Mer information finns i Återställa ett AKS-kluster.
  • Scenarier som stöds: Kontrollera att AKS Backup-lösningen stöder ditt specifika scenario. Se stödmatrisen för AKS Backup för kompatibilitetsinformation.
  • Budgetallokeringar: Överväg om du har specifika budgetallokeringar för säkerhetskopierings- och återställningsåtgärder. Granska prisinformationen som tillhandahålls av AKS Backup-lösningen så att den överensstämmer med dina budgetkrav.

Genom att ta hänsyn till dessa andra överväganden kan du se till att din säkerhetskopierings- och återställningslösning för AKS uppfyller organisationens behov och inställningar effektivt och effektivt.

AKS-säkerhetskopieringsplats och -lagring

AKS Backup använder ett säkerhetskopieringsvalv och ett lagringskonto för att lagra olika typer av data som samlas in från ett kluster under en säkerhetskopia.

För diskbaserade beständiga volymer använder AKS Backup inkrementella ögonblicksbilder av den underliggande Azure Disk som lagras i din Azure-prenumeration.

Ett säkerhetskopieringsvalv är en säker lagringsentitet i Azure, som används för att lagra säkerhetskopierade data för arbetsbelastningar som stöds av Azure Backup, till exempel AKS-kluster. Själva Säkerhetskopieringsvalvet innehåller både säkerhetskopieringsprinciperna och de säkerhetskopierings- och återställningspunkter som skapas av säkerhetskopieringsjobb.

Azure hanterar automatiskt lagringen för ett Backup Vault. Du kan välja mellan flera redundansalternativ för data som lagras i den, som kan konfigureras när Säkerhetskopieringsvalvet skapas.

Ett lagringskonto är ett lagringsområde för dina dataobjekt i Azure och är mycket konfigurerbart. Den innehåller flera redundansalternativ mellan regioner och regioner för att säkerställa datahållbarhet. AKS Backup använder en blobcontainer i ett särskilt lagringskonto för att göra säkerhetskopior av vissa komponenter i AKS-klustret.

Inkrementella ögonblicksbilder är tidpunktssäkerhetskopior för hanterade diskar som när de tas endast består av ändringarna sedan den senaste ögonblicksbilden. Den första inkrementella ögonblicksbilden är en fullständig kopia av disken. De efterföljande inkrementella ögonblicksbilderna samlar bara in deltaändringar på diskar sedan den senaste ögonblicksbilden.

Använda AKS Backup för att migrera arbetsbelastningar mellan AKS-kluster

Du kan använda AKS Backup som en mekanism för säkerhetskopiering och återställning för specifika kluster. AKS Backup stöder även migreringsscenarier genom att låta dig ta en säkerhetskopia från ett kluster och återställa den till ett annat, till exempel:

  • Återställa ett utvecklingskluster till ett mellanlagringskluster
  • Replikera innehåll i flera kluster

Se till att ditt scenario stöds genom att läsa följande dokumentation:

Deltagare

Den här artikeln underhålls av Microsoft. Det har ursprungligen skrivits av följande medarbetare.

Huvudförfattare:

Övriga medarbetare:

Nästa steg

Läs mer om AKS Backup

Alternativ för säkerhetskopiering och återställning av AKS från tredje part