Condividi tramite


Creare un avviso di metrica con soglie dinamiche

È possibile che non si sia certi dei numeri corretti da usare come soglie per le regole di avviso. Le soglie dinamiche applicano il Machine Learning avanzato e usano un set di algoritmi e metodi per:

  • Imparare il comportamento cronologico delle metriche.
  • Analizzare le metriche nel tempo e identificare modelli quali modelli orari, giornalieri o settimanali.
  • Riconoscere le anomalie che indicano possibili problemi di servizio.
  • Calcolare le soglie più appropriate per le metriche.

Quando si usano soglie dinamiche, non è necessario conoscere la soglia corretta per ogni metrica. Le soglie dinamiche calcolano automaticamente le soglie più appropriate.

È consigliabile configurare le regole di avviso con soglie dinamiche in queste metriche:

  • Percentuale CPU macchina virtuale
  • Tempo di esecuzione della richiesta HTTP di Application Insights

Le soglie dinamiche consentono di:

  • Creare avvisi scalabili per centinaia di serie di metriche con un’unica regola di avviso. Se sono presenti meno regole di avviso, è necessario dedicare meno tempo alla creazione e alla gestione. Gli avvisi scalabili sono particolarmente utili quando si hanno più dimensioni o più risorse, ad esempio tutte le risorse in una sottoscrizione.
  • Creare regole senza dover conoscere la soglia da configurare.
  • Configurare gli avvisi delle metriche usando concetti generali senza che sia necessaria una conoscenza approfondita del dominio della metrica.
  • Evitare soglie rumorose (bassa precisione) o ampie (basso richiamo) che non hanno un modello previsto.

È possibile usare soglie dinamiche in questi casi:

  • La maggior parte della piattaforma di Monitoraggio di Azure e delle metriche personalizzate.
  • Metriche comuni per applicazioni e infrastruttura.
  • Metriche rumorose, ad esempio CPU del computer o memoria.
  • Metriche a bassa dispersione, ad esempio disponibilità e frequenza di errore.

È possibile configurare soglie dinamiche usando:

Calcolo della soglia di avviso e anteprima

Quando viene creata una regola di avviso, le soglie dinamiche usano 10 giorni di dati cronologici per calcolare modelli stagionali orari o giornalieri. Il grafico visualizzato nell'anteprima dell'avviso riflette i dati.

Le soglie dinamiche usano continuamente tutti i dati cronologici disponibili per apprendere e apportano modifiche per essere più accurate. Dopo tre settimane, le soglie dinamiche hanno dati sufficienti per identificare i modelli settimanali, e il modello viene modificato in modo che includa la stagionalità settimanale.

Il sistema riconosce automaticamente interruzioni prolungate e le rimuove dall'algoritmo di apprendimento della soglia. Se si verifica un'interruzione prolungata, le soglie dinamiche comprendono i dati. Rilevano problemi di sistema con lo stesso livello di sensibilità che c’era prima dell'interruzione.

Considerazioni sull'uso delle soglie dinamiche

  • Per garantire un calcolo accurato della soglia, le regole di avviso che usano soglie dinamiche non attivano un avviso prima di raccogliere almeno 30 campioni di dati relativi alle metriche per tre giorni. Le nuove risorse o le risorse che non hanno dati metrici non attivano un avviso finché non sono disponibili dati sufficienti.
  • Per rilevare la stagionalità settimanale, le soglie dinamiche richiedono almeno tre settimane di dati cronologici. Alcuni modelli dettagliati, ad esempio modelli biorari o semisettimanali potrebbero non essere rilevati.
  • Se il comportamento di una metrica è stato modificato di recente, le modifiche non vengono immediatamente riflesse nei limiti superiori e inferiori della soglia dinamica. I limiti vengono calcolati in base ai dati delle metriche degli ultimi 10 giorni. Quando si visualizzano i limiti della soglia dinamica per una determinata metrica, esaminare la tendenza delle metriche nell'ultima settimana e non solo per le ultime ore o gli ultimi giorni.
  • Le soglie dinamiche sono utili per rilevare deviazioni significative rispetto a problemi che si evolvono lentamente. Le modifiche lente del comportamento probabilmente non attiveranno un avviso.
  • Non è possibile usare soglie dinamiche nelle regole di avviso che monitorano più condizioni.

Configurare soglie dinamiche

Per configurare le soglie dinamiche, seguire la procedura per la creazione di una regola di avviso. Usare queste impostazioni nella scheda Condizione:

  • Per Soglia selezionare Dinamica.
  • Per Tipo di aggregazione, è consigliabile non selezionare Massimo.
  • Per Operatoreselezionare Maggiore di, a meno che il comportamento non rappresenti l'utilizzo dell'applicazione.
  • Per Sensibilità soglia selezionare Media o Bassa per ridurre il rumore dell'avviso.
  • Per Controlla ogni, selezionare la frequenza con cui la regola di avviso controlla se la condizione viene soddisfatta. Per ridurre al minimo l'impatto dell'avviso sulla propria attività, è consigliabile usare una frequenza inferiore. Assicurarsi che questo valore sia minore o uguale al valore del periodo di ricerca.
  • Per Periodo di ricerca, impostare il periodo di tempo da esaminare ogni volta che i dati vengono controllati. Assicurarsi che questo valore sia maggiore o uguale al valore Controlla ogni.
  • Per Opzioni avanzate, scegliere il numero di violazioni che attiveranno l'avviso entro un periodo di tempo specifico. Facoltativamente, impostare la data da cui iniziare ad apprendere i dati cronologici metrici e calcolare le soglie dinamiche.

Nota

Le regole di avviso per le metriche create mediante il portale vengono generate nello stesso gruppo di risorse della risorsa di destinazione.

Grafico a soglie dinamiche

Il grafico seguente mostra una metrica, i limiti di soglia dinamica e alcuni avvisi generati quando il valore non rientra nelle soglie consentite.

Screenshot di un grafico che mostra una metrica, i relativi limiti della soglia dinamica e alcuni avvisi generati.

Usare le informazioni seguenti per interpretare il grafico:

  • Linea blu: metrica misurata nel tempo.
  • Area ombreggiata blu: intervallo consentito per la metrica. Se i valori delle metriche rimangono all'interno di questo intervallo, non viene attivato alcun avviso.
  • Punti blu: valori aggregati delle metriche. Se si seleziona parte del grafico e poi si passa il puntatore del mouse sulla linea blu, sotto il cursore viene visualizzato un punto blu, a indicare un singolo valore di metrica aggregato.
  • Casella popup con punto blu: il valore della metrica misurato (punto blu) e i valori superiori e inferiori dell'intervallo consentito.
  • Punto rosso con un cerchio nero: il primo valore della metrica al di fuori dell'intervallo consentito. Questo valore genera un avviso di metrica e lo inserisce in uno stato attivo.
  • Punti rossi: altri valori misurati all'esterno dell'intervallo consentito. Non attivano più avvisi sulle metriche, ma l'avviso rimane in stato attivo.
  • Area rossa: ora in cui il valore della metrica non rientra nell'intervallo consentito. L'avviso rimane in stato attivo purché i successivi valori misurati non siano compresi nell'intervallo consentito, ma non vengono attivati nuovi avvisi.
  • Fine dell'area rossa: ritorno ai valori consentiti. Quando la linea blu si trova all'interno dei valori consentiti, l'area rossa si arresta e la linea del valore misurato diventa blu. Lo stato dell'avviso della metrica attivato al momento del punto rosso con un cerchio nero viene impostato su risolto.

Problemi noti relativi alla sensibilità della soglia dinamica

  • Se una regola di avviso che usa soglie dinamiche è troppo rumorosa o si attiva troppo, potrebbe essere necessario ridurne la sensibilità. Usare una delle seguenti opzioni:

    • Sensibilità soglia: impostare la sensibilità su Bassa affinché la tolleranza delle deviazioni sia maggiore.
    • Numero di violazioni (in Impostazioni avanzate): configurare la regola di avviso per l'attivazione solo se si verificano diverse deviazioni entro un determinato periodo di tempo. Questa impostazione rende la regola meno soggetta alle deviazioni temporanee.
  • Si potrebbe notare che una regola di avviso che usa soglie dinamiche non viene attivata o non è sufficientemente sensibile, anche se è configurata con sensibilità elevata. Questo scenario può verificarsi quando la distribuzione della metrica è altamente irregolare. Considerare una delle soluzioni seguenti:

    • Passare al monitoraggio di una metrica complementare adatta allo scenario, se applicabile. Ad esempio, verificare la presenza di modifiche nella frequenza di esito positivo anziché nella frequenza di errori.
    • Provare a selezionare un valore diverso per Granularità aggregazione (periodo).
    • Controllare se è stata apportata una modifica drastica nel comportamento delle metriche negli ultimi 10 giorni, ad esempio un'interruzione del servizio. Una modifica brusca può influire sulle soglie superiori e inferiori calcolate per la metrica e renderle più ampie. Attendere alcuni giorni fino a quando l'interruzione non è più inclusa nel calcolo della soglia. È inoltre possibile modificare la regola di avviso per usare l'opzione Ignora dati prima di in Impostazioni avanzate.
    • Se i dati hanno una stagionalità settimanale, ma non è disponibile una cronologia sufficiente per la metrica, le soglie calcolate possono comportare limiti superiori e inferiori ampi. Ad esempio, il calcolo può trattare i giorni feriali e i fine settimana nello stesso modo e creare limiti estesi che non sempre si adattano ai dati. Questo problema dovrebbe risolversi quando sarà disponibile un numero sufficiente di dati storici. Viene quindi rilevata la stagionalità corretta e le soglie calcolate vengono aggiornate di conseguenza.
  • Quando un valore della metrica presenta grandi fluttuazioni, le soglie dinamiche potrebbero creare un modello ampio intorno ai valori delle metriche, che possono comportare un limite inferiore o superiore al previsto. Questo scenario può verificarsi quando:

    • La sensibilità è impostata su bassa.
    • La metrica presenta un comportamento irregolare con varianza elevata, che appare come picchi o cali di dati.

    Valutare la possibilità di rendere il modello meno sensibile scegliendo una sensibilità più elevata o selezionando un valore del periodo di ricerca più grande. È inoltre possibile usare l'opzione Ignora dati prima di per escludere una recente irregolarità dai dati cronologici usati per compilare il modello.

Metriche non supportate dalle soglie dinamiche

Le soglie dinamiche supportano la maggior parte delle metriche, ma le metriche seguenti non possono usare soglie dinamiche:

Tipo di risorsa Nome metrica
Microsoft.ClassicStorage/storageAccounts UsedCapacity
Microsoft.ClassicStorage/storageAccounts/blobServices BlobCapacity
Microsoft.ClassicStorage/storageAccounts/blobServices BlobCount
Microsoft.ClassicStorage/storageAccounts/blobServices IndexCapacity
Microsoft.ClassicStorage/storageAccounts/fileServices FileCapacity
Microsoft.ClassicStorage/storageAccounts/fileServices FileCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareSnapshotCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareSnapshotSize
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareQuota
Microsoft.Compute/disks Byte lettura disco composito/sec
Microsoft.Compute/disks Operazioni lettura disco composito/sec
Microsoft.Compute/disks Byte scrittura disco composito/sec
Microsoft.Compute/disks Operazioni scrittura disco composito/sec
Microsoft.ContainerService/managedClusters NodesCount
Microsoft.ContainerService/managedClusters PodCount
Microsoft.ContainerService/managedClusters CompletedJobsCount
Microsoft.ContainerService/managedClusters RestartingContainerCount
Microsoft.ContainerService/managedClusters OomKilledContainerCount
Microsoft.Devices/IotHubs TotalDeviceCount
Microsoft.Devices/IotHubs ConnectedDeviceCount
Microsoft.Devices/IotHubs TotalDeviceCount
Microsoft.Devices/IotHubs ConnectedDeviceCount
Microsoft.DocumentDB/databaseAccounts CassandraConnectionClosures
Microsoft.EventHub/clusters Dimensione
Microsoft.EventHub/namespaces Dimensione
Microsoft.IoTCentral/IoTApps connectedDeviceCount
Microsoft.IoTCentral/IoTApps provisionedDeviceCount
Microsoft.Kubernetes/connectedClusters NodesCount
Microsoft.Kubernetes/connectedClusters PodCount
Microsoft.Kubernetes/connectedClusters CompletedJobsCount
Microsoft.Kubernetes/connectedClusters RestartingContainerCount
Microsoft.Kubernetes/connectedClusters OomKilledContainerCount
Microsoft.MachineLearningServices/workspaces/onlineEndpoints RequestsPerMinute
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments DeploymentCapacity
Microsoft.Maps/accounts CreatorUsage
Microsoft.Media/mediaservices/streamingEndpoints EgressBandwidth
Microsoft.Network/applicationGateways Velocità effettiva.
Microsoft.Network/azureFirewalls Velocità effettiva.
Microsoft.Network/expressRouteGateways ExpressRouteGatewayPacketsPerSecond
Microsoft.Network/expressRouteGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/expressRouteGateways ExpressRouteGatewayFrequencyOfRoutesChanged
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayBitsPerSecond
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayPacketsPerSecond
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayFrequencyOfRoutesChanged
Microsoft.ServiceBus/namespaces Dimensione
Microsoft.ServiceBus/namespaces Messaggi
Microsoft.ServiceBus/namespaces ActiveMessages
Microsoft.ServiceBus/namespaces DeadletteredMessages
Microsoft.ServiceBus/namespaces ScheduledMessages
Microsoft.ServiceFabricMesh/applications AllocatedCpu
Microsoft.ServiceFabricMesh/applications AllocatedMemory
Microsoft.ServiceFabricMesh/applications ActualCpu
Microsoft.ServiceFabricMesh/applications ActualMemory
Microsoft.ServiceFabricMesh/applications ApplicationStatus
Microsoft.ServiceFabricMesh/applications ServiceStatus
Microsoft.ServiceFabricMesh/applications ServiceReplicaStatus
Microsoft.ServiceFabricMesh/applications ContainerStatus
Microsoft.ServiceFabricMesh/applications RestartCount
Microsoft.Storage/storageAccounts UsedCapacity
Microsoft.Storage/storageAccounts/blobServices BlobCapacity
Microsoft.Storage/storageAccounts/blobServices BlobCount
Microsoft.Storage/storageAccounts/blobServices BlobProvisionedSize
Microsoft.Storage/storageAccounts/blobServices IndexCapacity
Microsoft.Storage/storageAccounts/fileServices FileCapacity
Microsoft.Storage/storageAccounts/fileServices FileCount
Microsoft.Storage/storageAccounts/fileServices FileShareCount
Microsoft.Storage/storageAccounts/fileServices FileShareSnapshotCount
Microsoft.Storage/storageAccounts/fileServices FileShareSnapshotSize
Microsoft.Storage/storageAccounts/fileServices FileShareCapacityQuota
Microsoft.Storage/storageAccounts/fileServices FileShareProvisionedIOPS

Nel caso si vogliano inviare feedback sulle soglie dinamiche, inviare un messaggio di posta elettronica.