Condividi tramite


Affidabilità in Macchine virtuali

Questo articolo contiene informazioni dettagliate sulla resilienza a livello di area della macchina virtuale con zone di disponibilità e ripristino di emergenza tra aree e continuità aziendale.

Supporto della zona di disponibilità

Le zone di disponibilità sono gruppi di data center separati fisicamente all'interno di ogni area di Azure. In caso di errore di una zona, i servizi possono eseguire il failover in una delle zone rimanenti.

Per altre informazioni sulle zone di disponibilità in Azure, vedere Che cosa sono le zone di disponibilità?.

Le macchine virtuali supportano le zone di disponibilità con tre zone di disponibilità per ogni area di Azure supportata e sono anche ridondanti della zona e di zona. Per altre informazioni, vedere Servizi di Azure con zone di disponibilità. Il cliente è responsabile della configurazione e della migrazione delle macchine virtuali per la disponibilità.

Per altre informazioni sulle opzioni di idoneità della zona di disponibilità, vedere:

Prerequisiti

Miglioramenti del contratto di servizio

Poiché le zone di disponibilità sono fisicamente separate e forniscono una fonte di alimentazione, una rete e un raffreddamento distinti, aumentano i contratti di servizio (contratti di servizio). Per altre informazioni, vedere Contratto di Servizio per Macchine virtuali.

Creare una risorsa con zone di disponibilità abilitate

Per iniziare, creare una macchina virtuale con la zona di disponibilità abilitata dalle opzioni di distribuzione seguenti:

Supporto del failover a livello di zona

È possibile configurare le macchine virtuali per eseguire il failover in un'altra zona usando il servizio Site Recovery. Per altre informazioni, vedere Site Recovery.

Tolleranza di errore

Le macchine virtuali possono eseguire il failover in un altro server in un cluster, con il riavvio del sistema operativo della macchina virtuale nel nuovo server. È consigliabile fare riferimento al processo di failover per il ripristino di emergenza, la raccolta di macchine virtuali nella pianificazione del ripristino e l'esecuzione di esercitazioni sul ripristino di emergenza per assicurarsi che la soluzione di tolleranza di errore sia corretta.

Per altre informazioni, vedere i processi di site recovery.

Esperienza di inattività della zona

Durante un'interruzione a livello di zona, è necessario prevedere una breve riduzione delle prestazioni fino a quando il servizio macchina virtuale non ribilancia la capacità sottostante per adattarsi alle zone integre. La riparazione automatica non dipende dal ripristino della zona; è previsto che lo stato di riparazione automatica del servizio gestito da Microsoft compensa una zona persa, usando la capacità di altre zone.

È anche consigliabile prepararsi per la possibilità che si verifichi un'interruzione di un'intera area. Se si verifica un'interruzione del servizio per un'intera area, le copie con ridondanza locale dei dati non saranno temporaneamente disponibili. Se la replica geografica è abilitata, altre tre copie dei BLOB e delle tabelle di Archiviazione di Azure vengono archiviate in un'area diversa. Quando si verifica un'interruzione completa a livello di area o un'emergenza in cui l'area primaria non è recuperabile, Azure esegue di nuovo il mapping di tutte le voci DNS all'area con replica geografica.

Preparazione e ripristino dell'interruzione della zona

Le indicazioni seguenti vengono fornite per le macchine virtuali di Azure durante un'interruzione del servizio dell'intera area in cui viene distribuita l'applicazione macchina virtuale di Azure:

Progettazione a bassa latenza

Per la progettazione di una soluzione di macchina virtuale a bassa latenza, sono disponibili opzioni tra aree (area secondaria), sottoscrizione incrociata (anteprima) e tra zone (anteprima). Per altre informazioni su queste opzioni, vedere i metodi di ripristino supportati.

Importante

Rifiutando esplicitamente la distribuzione con riconoscimento della zona, si rinuncia alla protezione dall'isolamento degli errori sottostanti. Uso di SKU che non supportano le zone di disponibilità o che rifiutano esplicitamente le forze di configurazione della zona di disponibilità dipendono dalle risorse che non obbediscono al posizionamento e alla separazione della zona (incluse le dipendenze sottostanti di queste risorse). Queste risorse non dovrebbero essere previste per sopravvivere a scenari di zona inattiva. Le soluzioni che sfruttano tali risorse devono definire una strategia di ripristino di emergenza e configurare un ripristino della soluzione in un'altra area.

Tecniche di distribuzione sicura

Quando si sceglie l'isolamento delle zone di disponibilità, è consigliabile usare tecniche di distribuzione sicure per gli aggiornamenti del codice dell'applicazione e delle applicazioni. Oltre a configurare Azure Site Recovery e implementare una delle seguenti tecniche di distribuzione sicura per le macchine virtuali:

Poiché Microsoft esegue periodicamente aggiornamenti di manutenzione pianificata, potrebbero esserci rare istanze quando questi aggiornamenti richiedono un riavvio della macchina virtuale per applicare gli aggiornamenti necessari all'infrastruttura sottostante. Per altre informazioni, vedere Considerazioni sulla disponibilità durante la manutenzione pianificata.

Prima di aggiornare il set successivo di nodi in un'altra zona, è necessario eseguire le attività seguenti:

  • Controllare il dashboard integrità dei servizi di Azure per individuare lo stato del servizio macchine virtuali per le aree previste.
  • Assicurarsi che la replica sia abilitata nelle macchine virtuali.

Eseguire la migrazione al supporto della zona di disponibilità

Per informazioni su come eseguire la migrazione di una macchina virtuale al supporto della zona di disponibilità, vedere Eseguire la migrazione di Macchine virtuali e set di scalabilità di macchine virtuali al supporto della zona di disponibilità.

Ripristino di emergenza e continuità aziendale tra aree

Il ripristino di emergenza si occupa del ripristino in caso di eventi a impatto elevato, come disastri naturali o distribuzioni non riuscite che comportano tempi di inattività e perdita di dati. Indipendentemente dalla causa, il miglior rimedio per un'emergenza è un piano di ripristino ben definito e testato e una progettazione di applicazioni che supporta attivamente tale ripristino. Prima di iniziare a pensare a un piano di ripristino di emergenza, vedere Raccomandazioni per la progettazione di una strategia di ripristino di emergenza.

Nell'ambito del ripristino di emergenza, Microsoft usa il modello di responsabilità condivisa. In un modello basato sulla responsabilità condivisa, Microsoft garantisce che l'infrastruttura di base e i servizi della piattaforma siano disponibili. Allo stesso tempo, molti servizi di Azure non replicano automaticamente i dati o eseguono il fallback da un'area in cui si è verificato un errore per effettuare la replica incrociata in un'altra area abilitata. Per questi servizi, si è responsabili della configurazione di un piano di ripristino di emergenza che funziona per il carico di lavoro. La maggior parte dei servizi eseguiti nelle offerte PaaS (Piattaforma distribuita come servizio) di Azure forniscono funzionalità e indicazioni per supportare il ripristino di emergenza ed è possibile usare funzionalità specifiche del servizio per supportare il ripristino rapido e sviluppare il piano di ripristino di emergenza.

È possibile usare il ripristino tra aree per ripristinare le macchine virtuali di Azure tramite aree abbinate. Con il ripristino tra aree è possibile ripristinare tutte le macchine virtuali di Azure per il punto di ripristino selezionato se il backup viene eseguito nell'area secondaria. Per altre informazioni sul ripristino tra aree, vedere la voce di riga della tabella tra aree nelle opzioni di ripristino.

Ripristino di emergenza nella geografia in più aree

In caso di interruzione del servizio a livello di area, Microsoft lavora diligentemente per ripristinare il servizio macchina virtuale. Tuttavia, è comunque necessario basarsi su altre strategie di backup specifiche dell'applicazione per ottenere il massimo livello di disponibilità. Per altre informazioni, vedere la sezione Strategie dei dati per il ripristino di emergenza.

Rilevamento, notifica e gestione di interruzioni

L'infrastruttura hardware o fisica per la macchina virtuale potrebbe non riuscire in modo imprevisto. Gli errori imprevisti possono includere errori di rete locali, errori del disco locale o altri errori a livello di rack. Quando viene rilevato, la piattaforma Azure esegue automaticamente la migrazione (guarita) della macchina virtuale a una macchina fisica integra nello stesso data center. Durante la procedura di riparazione, nelle macchine virtuali si verificano tempi di inattività (riavvio) e in alcuni casi la perdita dell'unità temporanea. Il sistema operativo e i dischi dati collegati vengono sempre conservati.

Per informazioni più dettagliate sulle interruzioni del servizio di macchine virtuali, vedere indicazioni sul ripristino di emergenza.

Configurare il ripristino di emergenza e il rilevamento di interruzioni

Quando si configura il ripristino di emergenza per le macchine virtuali, comprendere cosa offre Azure Site Recovery. Abilitare il ripristino di emergenza per le macchine virtuali con i metodi seguenti:

Ripristino di emergenza in area geografica singola

Con la configurazione del ripristino di emergenza, le macchine virtuali di Azure vengono replicate continuamente in un'area di destinazione diversa. In caso di guasto, è possibile effettuare il failover delle macchine virtuali nell'area secondaria e accedervi da lì.

Quando si esegue la replica di macchine virtuali di Azure usando Site Recovery, tutti i dischi delle macchine virtuali vengono replicati nell'area di destinazione in modo continuativo e asincrono. I punti di ripristino vengono creati ogni pochi minuti, che concede un obiettivo del punto di ripristino (RPO) nell'ordine di minuti. È possibile condurre esercitazioni sul ripristino di emergenza quante volte si vuole, senza alcun effetto sull'applicazione di produzione o sulla replica in corso. Per altre informazioni, vedere Eseguire un'esercitazione sul ripristino di emergenza in Azure.

Per altre informazioni, vedere Componenti dell'architettura delle macchine virtuali di Azure e associazione di aree.

Resilienza della capacità e del ripristino di emergenza proattivo

Microsoft e i suoi clienti operano con il modello di responsabilità condivisa. Responsabilità condivisa significa che per il ripristino di emergenza abilitato per il cliente (servizi responsabili del cliente), è necessario rivolgersi al ripristino di emergenza per qualsiasi servizio distribuito e controllato. Per garantire che il ripristino sia proattivo, è consigliabile eseguire sempre la pre-distribuzione dei database secondari perché non esiste alcuna garanzia di capacità al momento dell'impatto per coloro che non sono stati preallocati.

Per la distribuzione di macchine virtuali, è possibile usare la modalità di orchestrazione flessibile in set di scalabilità di macchine virtuali. Tutte le dimensioni delle macchine virtuali possono essere usate con la modalità di orchestrazione flessibile. La modalità di orchestrazione flessibile offre anche garanzie di disponibilità elevata (fino a 1000 macchine virtuali) distribuendo le macchine virtuali tra domini di errore all'interno di un'area o all'interno di una zona di disponibilità.

Passaggi successivi