Gestire la scalabilità orizzontale del cluster (scalabilità orizzontale) in Azure Esplora dati per soddisfare la modifica della domanda
Ridimensionare un cluster in modo appropriato è fondamentale per garantire le prestazioni di Esplora dati di Azure. Una dimensione statica del cluster può causare sottoutilizzazione o sovrautilizzazione, nessuno dei quali è ideale. Poiché la domanda in un cluster non può essere stimata con accuratezza assoluta, è preferibile ridimensionare un cluster, aggiungere e rimuovere risorse di capacità e CPU con la modifica della domanda.
Esistono due flussi di lavoro per ridimensionare un cluster di Azure Esplora dati:
- Ridimensionamento orizzontale, chiamato anche ridimensionamento e uscita.
- Ridimensionamento verticale, chiamato anche ridimensionamento e riduzione. Questo articolo illustra il flusso di lavoro di ridimensionamento orizzontale.
Configurare il ridimensionamento orizzontale
Usando il ridimensionamento orizzontale, è possibile ridimensionare automaticamente il conteggio delle istanze in base a regole e pianificazioni predefinite. Per specificare le impostazioni di scalabilità automatica per il cluster:
Nella portale di Azure passare alla risorsa cluster di Azure Esplora dati. In Impostazioni selezionare Scalabilità orizzontale.
Nella finestra Scalabilità orizzontale selezionare il metodo di scalabilità automatica desiderato: Scalabilità manuale, Scalabilità automatica ottimizzata o Scalabilità automatica personalizzata.
Scalabilità manuale
Nell'opzione scalabilità manuale il cluster ha una capacità statica che non cambia automaticamente. Selezionare la capacità statica usando la barra conteggio istanze . Il ridimensionamento del cluster rimane in corrispondenza dell'impostazione selezionata fino a quando non viene modificato.
Scalabilità automatica ottimizzata (opzione consigliata)
La scalabilità automatica ottimizzata è l'impostazione predefinita durante la creazione del cluster e il metodo di ridimensionamento consigliato. Questo metodo ottimizza le prestazioni e i costi del cluster, come indicato di seguito:
- Se il cluster è sottoutilizzato, viene ridimensionato in modo da ridurre i costi senza influire sulle prestazioni necessarie.
- Se il cluster è sovrautilizzato, viene ridimensionato per mantenere prestazioni ottimali.
Per configurare la scalabilità automatica ottimizzata:
Selezionare Scalabilità automatica ottimizzata.
Specificare un numero minimo e massimo di istanze. L'intervallo di scalabilità automatica del cluster tra questi valori è basato sul carico.
Selezionare Salva.
La scalabilità automatica ottimizzata inizia a funzionare. Le azioni possono essere visualizzate nel log attività del cluster in Azure.
Logica di scalabilità automatica ottimizzata
La scalabilità automatica ottimizzata viene gestita dalla logica predittiva o reattiva. La logica predittiva tiene traccia del modello di utilizzo del cluster e quando identifica la stagionalità con un'elevata attendibilità, gestisce il ridimensionamento del cluster. In caso contrario, la logica reattiva che tiene traccia dell'utilizzo effettivo del cluster viene usata per prendere decisioni sulle operazioni di scalabilità del cluster in base al livello corrente di utilizzo delle risorse.
Le metriche principali per i flussi predittivi e reattivi sono:
- CPU
- Fattore di utilizzo della cache
- Utilizzo inserimento
Sia la logica predittiva che reattiva sono associate ai limiti delle dimensioni del cluster, al numero minimo e massimo di istanze, come definito nella configurazione di scalabilità automatica ottimizzata. Le operazioni di scalabilità orizzontale e scalabilità frequenti del cluster sono indesiderate a causa dell'impatto sulle risorse del cluster e sul tempo necessario per l'aggiunta o la rimozione di istanze, nonché il bilanciamento della cache ad accesso frequente in tutti i nodi.
Scalabilità automatica predittiva
La logica predittiva prevede l'utilizzo del cluster per il giorno successivo in base al relativo modello di utilizzo nelle ultime settimane. La previsione viene usata per creare una pianificazione delle operazioni discalabilità orizzontale o scalabilità orizzontale per modificare le dimensioni del cluster in anticipo. Ciò consente al ridimensionamento e al bilanciamento dei dati del cluster di completare in tempo per quando il carico cambia. Questa logica è particolarmente efficace per i modelli stagionali, ad esempio picchi di utilizzo giornaliero o settimanale.
Tuttavia, negli scenari in cui si verifica un picco univoco nell'utilizzo che supera la previsione, la scalabilità automatica ottimizzata restituirà la logica reattiva. In questo caso, le operazioni di scalabilità orizzontale o di scalabilità orizzontale vengono eseguite ad hoc in base al livello più recente di utilizzo delle risorse.
Scalabilità automatica reattiva
Aumentare il numero di istanze
Quando il cluster si avvicina a uno stato di sovrautilizzazione, verrà eseguita un'operazione di scalabilità orizzontale per mantenere prestazioni ottimali. Viene eseguita un'operazione di scalabilità orizzontale quando si verifica almeno una delle condizioni seguenti:
- L'utilizzo della cache è elevato per oltre un'ora
- La CPU è elevata per oltre un'ora
- L'utilizzo dell'inserimento dati è elevato per più di un'ora
Riduci numero istanze
Quando il cluster è sottoutilizzato, verrà eseguita una scalabilità in operazione per ridurre i costi mantenendo prestazioni ottimali. Più metriche vengono usate per verificare che sia sicuro ridimensionare nel cluster.
Per assicurarsi che non sia presente alcun overload delle risorse, le metriche seguenti vengono valutate prima che venga eseguita la scalabilità :
- L'utilizzo della cache non è elevato
- L'uso della CPU è inferiore alla media
- L'utilizzo dell'inserimento dati è inferiore alla media
- Se viene usato l'inserimento in streaming, l'utilizzo dell'inserimento di streaming non è elevato
- Mantenere attiva la metrica è superiore a un minimo definito, elaborato correttamente e in tempo che indica che il cluster è reattivo
- Non esiste alcuna limitazione delle query
- Il numero di query non riuscite è inferiore a un minimo definito
Nota
La scalabilità nella logica richiede una valutazione di 1 giorno prima dell'implementazione della scalabilità ottimizzata. Questa valutazione viene eseguita una volta ogni ora. Se è necessaria una modifica immediata, usare la scalabilità manuale.
Scalabilità automatica personalizzata
Anche se la scalabilità automatica ottimizzata è l'opzione di scalabilità consigliata, è supportata anche la scalabilità automatica personalizzata di Azure. Usando la scalabilità automatica personalizzata, è possibile ridimensionare dinamicamente il cluster in base alle metriche specificate. Per configurare la scalabilità automatica personalizzata, seguire questa procedura.
Nella casella Nome impostazione scalabilità automatica immettere un nome, ad esempio Scale-out: utilizzo della cache.
Per Modalità di scalabilità selezionare Ridimensiona in base a una metrica. Questa modalità fornisce il ridimensionamento dinamico. È anche possibile selezionare Ridimensiona in un numero di istanze specifico.
Selezionare + Aggiungi una regola.
Nella sezione Scala regola a destra immettere i valori per ogni impostazione.
Criteri
Impostazione Descrizione e valore Aggregazione temporale Selezionare un criterio di aggregazione, ad esempio Media. Nome metrica Selezionare la metrica su cui si vuole basare l'operazione di ridimensionamento, ad esempio Utilizzo della cache. Statistica intervallo di tempo Scegliere tra Medio, Minimo, Massimo e Somma. Operatore Scegliere l'opzione appropriata, ad esempio Maggiore o uguale a. Soglia Scegliere un valore appropriato. Ad esempio, per l'utilizzo della cache, il 80% è un buon punto di partenza. Durata (in minuti) Scegliere un periodo di tempo appropriato da considerare per il calcolo delle metriche. Iniziare con il valore predefinito di 10 minuti. Azione
Impostazione Descrizione e valore Operazione Scegliere l'opzione appropriata per ridurre o aumentare il numero di istanze. Numero di istanze Scegliere il numero di nodi o istanze da aggiungere o rimuovere quando viene soddisfatta una condizione di metrica. Disattiva regole dopo (minuti) Scegliere un intervallo di tempo appropriato per l'attesa tra le operazioni di ridimensionamento. Iniziare con il valore predefinito di cinque minuti. Selezionare Aggiungi.
Nella sezione Limiti dell'istanza a sinistra immettere i valori per ogni impostazione.
Impostazione Descrizione e valore Minimi Numero di istanze al di sotto del quale non verrà effettuato il ridimensionamento del cluster, indipendentemente dall'utilizzo. Massimo Numero di istanze al di sopra del quale non verrà effettuato il ridimensionamento del cluster, indipendentemente dall'utilizzo. Default Numero predefinito di istanze. Questa impostazione viene usata se si verificano problemi con la lettura delle metriche delle risorse. Selezionare Salva.
È ora stato configurato il ridimensionamento orizzontale per il cluster di Esplora dati di Azure. Aggiungere un'altra regola per il ridimensionamento verticale. Se è necessaria assistenza per i problemi di ridimensionamento del cluster, aprire una richiesta di supporto nella portale di Azure.