Affidabilità nella formazione della community Microsoft
Microsoft Community Training è una soluzione basata sul cloud basata su Azure in grado di offrire programmi di formazione su larga scala e diffusi con alta qualità ed efficienza. Con la formazione della community, le organizzazioni di tutte le dimensioni e i tipi possono eseguire programmi di formazione su larga scala per le loro comunità interne ed esterne. Le comunità possono includere lavoratori in prima linea, forza lavoro estesa, un ecosistema partner, una rete di volontari e beneficiari di programmi.
Questo articolo descrive il supporto per l'affidabilità in Formazione community e illustra sia la resilienza a livello di area con le zone di disponibilità che il ripristino di emergenza e la continuità aziendale. Per una panoramica più dettagliata di un principio di affidabilità in Azure, vedere Affidabilità di Azure.
Supporto della zona di disponibilità
Le zone di disponibilità sono gruppi di data center separati fisicamente all'interno di ogni area di Azure. In caso di errore di una zona, i servizi possono eseguire il failover in una delle zone rimanenti.
Per altre informazioni sulle zone di disponibilità in Azure, vedere Che cosa sono le zone di disponibilità?.
Il training della community usa le zone di disponibilità di Azure per offrire disponibilità elevata e tolleranza di errore all'interno di un'area di Azure. Il training della community offre supporto sia per il controllo che per la zona di disponibilità del piano dati:
Il piano di controllo è ridondante nella zona nelle aree primarie di disponibilità.
Il piano dati può essere zonale o ridondante della zona, a seconda di ciò che si sceglie per le proprie esigenze. È tuttavia consigliabile scegliere una distribuzione con ridondanza della zona per evitare la perdita di dati e mantenere la disponibilità del servizio durante un'interruzione della zona.
Prerequisiti
Le zone di disponibilità sono supportate per gli SKU di training della community seguenti:
- Standard (scala inferiore degli utenti)
- Premium (scalabilità elevata degli utenti)
La formazione della community è supportata solo nelle aree abbinate. Ogni area secondaria viene distribuita con una configurazione di zona. La tabella seguente illustra tutte le aree che supportano le zone di disponibilità per il training della community, insieme all'area associata.
Area primaria | Area abbinata |
---|---|
UKSouth | UKWest |
Australiaorientale | Australiasud-orientale |
EastUS | Stati Uniti occidentali |
EastUS2 | CentralUS |
NorthEurope | Europa occidentale |
Stati Uniti occidentali 3 | EastUS |
SwedenCentral | SveziaSouth |
Supporto del failover a livello di zona
Il training della community usa molti servizi di Azure di dipendenza, ad esempio il servizio app e Azure SQL. Quando si sceglie una distribuzione con ridondanza della zona, Community Training crea anche offerte ridondanti di zona di tali risorse del servizio di Azure sottostanti. Se una zona ha esito negativo, tutte le risorse, incluse le risorse di dipendenza, eseguono il failover in una delle zone integre.
Creare una risorsa con zone di disponibilità abilitate
Il training della community fornisce la configurazione per le zone di disponibilità solo al momento della creazione dell'istanza. Se si vuole modificare la configurazione della zona di disponibilità dopo la creazione dell'istanza, sarà necessario creare una nuova istanza.
Esperienza di inattività della zona
A zona. Durante un'interruzione a livello di zona, la formazione della community può comportare interruzioni complete o parziali del servizio. La misura in cui è disponibile dipende da vari fattori, ad esempio se l'intero data center è inattivo o se un servizio di dipendenza specifico non è più disponibile in tale zona.
Ridondanza della zona. Durante un'interruzione a livello di zona, non è consigliabile avere alcun impatto sulle risorse di cui è stato effettuato il provisioning. Tuttavia, è consigliabile prepararsi per una breve interruzione della comunicazione con tali risorse. In una situazione di arresto della zona, i client ricevono in genere codici di errore 409, nonché la logica di ripetizione dei tentativi di ristabilire le connessioni a intervalli appropriati. Le nuove richieste vengono indirizzate a nodi integri senza alcun impatto sull'utente. Durante le interruzioni a livello di zona, gli utenti possono creare nuove risorse e ridimensionare correttamente quelli esistenti.
Ripristino di emergenza e continuità aziendale
Il ripristino di emergenza si occupa del ripristino in caso di eventi a impatto elevato, come disastri naturali o distribuzioni non riuscite che comportano tempi di inattività e perdita di dati. Indipendentemente dalla causa, il miglior rimedio per un'emergenza è un piano di ripristino ben definito e testato e una progettazione di applicazioni che supporta attivamente tale ripristino. Prima di iniziare a pensare a un piano di ripristino di emergenza, vedere Raccomandazioni per la progettazione di una strategia di ripristino di emergenza.
Nell'ambito del ripristino di emergenza, Microsoft usa il modello di responsabilità condivisa. In un modello basato sulla responsabilità condivisa, Microsoft garantisce che l'infrastruttura di base e i servizi della piattaforma siano disponibili. Allo stesso tempo, molti servizi di Azure non replicano automaticamente i dati o eseguono il fallback da un'area in cui si è verificato un errore per effettuare la replica incrociata in un'altra area abilitata. Per questi servizi, si è responsabili della configurazione di un piano di ripristino di emergenza che funziona per il carico di lavoro. La maggior parte dei servizi eseguiti nelle offerte PaaS (Piattaforma distribuita come servizio) di Azure forniscono funzionalità e indicazioni per supportare il ripristino di emergenza ed è possibile usare funzionalità specifiche del servizio per supportare il ripristino rapido e sviluppare il piano di ripristino di emergenza.
Il team Microsoft Community Training gestisce l'intera procedura di ripristino di emergenza per la formazione della community. Il ripristino di emergenza non è attivo-attivo o attivo passivo, ma si basa invece sul ripristino dal backup più recente disponibile dei servizi di Azure. Il team di training della community crea manualmente tutte le risorse nell'area abbinata dal backup dei dati.
Nota
Il ripristino di emergenza per la formazione della community è supportato solo nelle aree abbinate.
Ripristino di emergenza nella geografia in più aree
In un'emergenza a livello di area, il piano di controllo viene sottoposto manualmente a failover nell'area abbinata. Prima del completamento del failover, è necessario prevedere una riduzione del servizio nel tempo. Dopo il failover, sono supportate solo le operazioni di sola lettura finché l'area di emergenza non torna online. Il servizio viene eseguito manualmente il failback nell'area originale dopo il ripristino online di tutte le operazioni. L'obiettivo del punto di ripristino (RPO) dovrebbe essere di 10 minuti; Obiettivo tempo di ripristino (RTO), 24 ore.
Per il piano dati, Community Training offre il ripristino di emergenza gestito da Microsoft. Per usare il ripristino di emergenza gestito, è necessario abilitare il ripristino di emergenza durante la creazione dell'istanza di Training della community in Azure. Dopo aver abilitato il ripristino di emergenza, Microsoft gestisce il backup dell'archiviazione e del database nell'area abbinata. L'obiettivo del punto di ripristino (RPO) dovrebbe essere di 12 ore; Obiettivo tempo di ripristino (RTO), 48 ore.
Nota
L'obiettivo RTO dipende dalle dimensioni del database e dell'archiviazione, dalla latenza tra l'area abbinata. Capacità del database o della macchina virtuale di archiviazione (SKU). RPO dipende dalle risorse di Azure sottostanti, ad esempio Azure SQL e Archiviazione di Azure. Per altre informazioni su RTO e RPO, vedere Panoramica del ripristino di emergenza.
Rilevamento, notifica e gestione di interruzioni
Quando un controllo integrità del training della community rileva un'interruzione di qualsiasi servizio e in qualsiasi area Microsoft richiede il consenso per il failover nell'area abbinata. Microsoft informa l'utente sulle funzionalità disponibili durante la procedura di ripristino di emergenza. Dopo che Microsoft riceve il consenso, il team di formazione della community può avviare la procedura di ripristino di emergenza.
Importante
Gli studenti non saranno in grado di utilizzare funzionalità audio/video finché l'area primaria non è operativa. È consigliabile evitare operazioni di caricamento multimediale fino a quando il sito primario non è operativo.
Resilienza della capacità e del ripristino di emergenza proattivo
Microsoft e i suoi clienti operano con il modello di responsabilità condivisa. Quando un'area è inattiva, non solo l'istanza community training viene migrata nell'area abbinata, ma anche tutti i carichi di lavoro di prodotto e clienti vengono migrati anche nell'area abbinata. Questa procedura può causare una carenza di risorse nell'area o nel data center associato. Di conseguenza, la disponibilità del ripristino di emergenza dipende dalla capacità disponibile delle risorse di Azure sottostanti.