Partilhar via


Escolher o tipo certo de regra de alerta

Este artigo descreve os tipos de alertas do Azure Monitor que você pode criar. Ele ajuda você a entender quando usar cada tipo de alerta. Para obter mais informações sobre preços, consulte a página de preços.

Os tipos de alertas são:

Tipos de alertas do Azure Monitor

Tipo de alerta Quando utilizar o Informações de preços
Alerta de métrica Os dados métricos são armazenados no sistema já pré-calculados. Os alertas métricos são úteis quando você deseja ser alertado sobre dados que exigem pouca ou nenhuma manipulação. Use alertas de métrica se os dados que você deseja monitorar estiverem disponíveis em dados de métrica. Cada regra de alerta métrico é cobrada com base no número de séries temporais monitoradas.
Alerta de pesquisa de registo Você pode usar alertas de pesquisa de log para executar operações lógicas avançadas em seus dados. Se os dados que você deseja monitorar estiverem disponíveis em logs ou exigirem lógica avançada, você poderá usar os recursos robustos da Kusto Query Language (KQL) para manipulação de dados usando alertas de pesquisa de log. Cada regra de alerta de pesquisa de log é cobrada com base no intervalo em que a consulta de log é avaliada. Uma avaliação de consultas mais frequente resulta num custo mais elevado. Para alertas de pesquisa de log configurados para monitoramento em escala usando divisão por dimensões, o custo também depende do número de séries temporais criadas pelas dimensões resultantes da sua consulta.
Alerta do registo de atividades Os registos de atividade fornecem auditoria de todas as ações que ocorreram nos recursos. Use alertas de registro de atividades para ser alertado quando um evento específico acontecer com um recurso, como uma reinicialização, um desligamento ou a criação ou exclusão de um recurso. Os alertas de Estado de Funcionamento do Serviço e os alertas de Estado de Funcionamento dos Recursos permitem-lhe saber quando existe um problema com um dos seus serviços ou recursos. Para obter mais informações, consulte a página de preços.
Alertas do Prometheus Os alertas Prometheus são usados para alertar sobre métricas Prometheus armazenadas nos serviços gerenciados do Azure Monitor para Prometheus. As regras de alerta são baseadas na linguagem de consulta de código aberto PromQL. As regras de alerta do Prometheus só são cobradas sobre os dados consultados pelas regras. Para obter mais informações, consulte a página de preços.

Alertas de métricas

Uma regra de alerta de métrica monitora um recurso avaliando as condições nas métricas do recurso em intervalos regulares. Se as condições se cumprirem, é acionado um alerta. Uma série temporal métrica é uma série de valores métricos capturados ao longo de um período de tempo.

Você pode criar regras usando estas métricas:

As regras de alerta métrico incluem estes recursos:

  • Você pode usar várias condições em uma regra de alerta para um único recurso.
  • Você pode adicionar granularidade monitorando várias dimensões métricas.
  • Você pode usar limites dinâmicos, que são orientados pelo aprendizado de máquina.
  • Você pode configurar se os alertas de métrica são com ou sem monitoração de estado. Os alertas métricos são com monitoração de estado por padrão.

O alvo da regra de alerta métrico pode ser:

  • Um único recurso, como uma máquina virtual (VM). Para tipos de recursos suportados, consulte Recursos suportados.
  • Vários recursos do mesmo tipo na mesma região do Azure, como um grupo de recursos.

Aplicando várias condições a uma regra de alerta de métrica

Ao criar uma regra de alerta para um único recurso, você pode aplicar várias condições. Por exemplo, você pode criar uma regra de alerta para monitorar uma máquina virtual do Azure e alertar quando "Porcentagem de CPU for maior que 90%" e "O comprimento da fila for superior a 300 itens". Quando uma regra de alerta tem várias condições, o alerta é acionado quando todas as condições na regra de alerta são verdadeiras e é resolvido quando pelo menos uma das condições não é mais verdadeira por três verificações consecutivas.

Restringir o alvo usando dimensões

Para obter instruções sobre como usar dimensões em regras de alerta de métrica, consulte Monitorar várias séries temporais em uma única regra de alerta de métrica.

Monitore a mesma condição em vários recursos usando a divisão por dimensões

Para monitorar a mesma condição em vários recursos do Azure, você pode usar a divisão por dimensões. Ao usar a divisão por dimensões, você pode criar alertas centrados em recursos em escala para uma assinatura ou grupo de recursos. Os alertas são divididos em alertas separados agrupando combinações. A divisão em uma coluna de ID de recurso do Azure transforma o recurso especificado no destino do alerta.

Você também pode decidir não dividir quando quiser que uma condição seja aplicada a vários recursos no escopo. Por exemplo, talvez você queira disparar um alerta se pelo menos cinco máquinas no escopo do grupo de recursos tiverem uso de CPU superior a 80%.

Monitorar vários recursos com uma regra de alerta

Você pode monitorar em escala aplicando a mesma regra de alerta de métrica a vários recursos do mesmo tipo para recursos que existem na mesma região do Azure. Notificações individuais são enviadas para cada recurso monitorado.

As métricas de plataforma para esses serviços nas seguintes nuvens do Azure são suportadas:

Serviço Fornecedor de Recursos Azure global Administração Pública China
Máquinas virtuais "Microsoft.Compute/virtualMachines" Sim Sim Sim
Bases de dados do SQL Server "Microsoft.Sql/servidores/bancos de dados" Sim Sim Sim
Pools elásticos do SQL Server "Microsoft.Sql/servers/elasticpools" Sim Sim Sim
Pools de capacidade de arquivos NetApp "Microsoft.NetApp/netAppAccounts/capacityPools" Sim Sim Sim
Volumes de arquivos NetApp "Microsoft.NetApp/netAppAccounts/capacityPools/volumes" Sim Sim Sim
Azure Key Vault "Microsoft.KeyVault/cofres" Sim Sim Sim
Cache do Azure para Redis "Microsoft.Cache/redis" Sim Sim Sim
Dispositivos do Azure Stack Edge (Não há nenhum provedor de recursos específico para este recurso. Devido a como os dispositivos de borda de pilha funcionam, as métricas são recuperadas de vários provedores de recursos. Você pode verificar esta documentação para obter mais detalhes sobre alertas para este recurso: Revisar alertas no Azure Stack Edge) Sim Sim Sim
Cofres dos Serviços de Recuperação "Microsoft.RecoveryServices/Vaults" Sim No Não
Base de Dados do Azure para PostgreSQL – Servidor Flexível "Microsoft.DBforPostgreSQL/flexibleServers" Sim Sim Sim
Máquinas bare metal (Operador Nexus) "Microsoft.NetworkCloud/bareMetalMachines" Sim Sim Sim
Aparelhos de armazenamento (Operator Nexus) "Microsoft.NetworkCloud/storageAppliances" Sim Sim Sim
Clusters (Operador Nexus) "Microsoft.NetworkCloud/clusters" Sim Sim Sim
Dispositivos de rede (Operator Nexus) Microsoft.NetworkCloud/l2Networks, Microsoft.NetworkCloud/l3Networks Sim Sim Sim
Regras da recolha de dados "Microsoft.Insights/datacollectionrules" Sim Sim Sim

Nota

Não há suporte para alertas de métricas de vários recursos para:

  • Alertar sobre métricas de convidado de VM.
  • Alertar sobre métricas de rede de VM (Entrada de Rede Total, Saída de Rede Total, Fluxos de Entrada, Fluxos de Saída, Taxa de Criação Máxima de Fluxos de Entrada, Taxa de Criação Máxima de Fluxos de Saída).

Você pode especificar o escopo do monitoramento com uma única regra de alerta de métrica de três maneiras. Por exemplo, com VMs, você pode especificar o escopo como:

  • Uma lista de VMs em uma região do Azure dentro de uma assinatura.
  • Todas as VMs em uma região do Azure em um ou mais grupos de recursos em uma assinatura.
  • Todas as VMs em uma região do Azure em uma assinatura.

Aplique aprendizado de máquina avançado com limites dinâmicos

Os limites dinâmicos usam aprendizado de máquina avançado para:

  • Aprenda o comportamento histórico das métricas.
  • Identifique padrões e adapte-se a mudanças métricas ao longo do tempo, como padrões horários, diários ou semanais.
  • Reconhecer anomalias que indiquem possíveis problemas de serviço.
  • Calcule o limite mais apropriado para a métrica.

O aprendizado de máquina usa continuamente novos dados para aprender mais e tornar o limite mais preciso. Como o sistema se adapta ao comportamento das métricas ao longo do tempo e aos alertas com base em desvios de seu padrão, você não precisa saber o limite "certo" para cada métrica.

Os limiares dinâmicos ajudam-no a:

  • Crie alertas escaláveis para centenas de séries métricas com uma regra de alerta. Se você tiver menos regras de alerta, gastará menos tempo criando e gerenciando regras de alertas.
  • Crie regras sem ter que saber qual limite configurar.
  • Configure alertas de métricas usando conceitos de alto nível sem amplo conhecimento de domínio sobre a métrica.
  • Evite limiares ruidosos (baixa precisão) ou largos (baixa recordação) que não tenham um padrão esperado.
  • Lide com métricas barulhentas (como CPU ou memória da máquina) e métricas com baixa dispersão (como disponibilidade e taxa de erro).

Consulte limites dinâmicos para obter instruções detalhadas sobre como usar limites dinâmicos em regras de alerta métrico.

Alertas de pesquisa de registo

Uma regra de alerta de pesquisa de log monitora um recurso usando uma consulta do Log Analytics para avaliar logs de recursos em uma frequência definida. Se as condições se cumprirem, é acionado um alerta. Como você pode usar consultas do Log Analytics, pode executar operações lógicas avançadas em seus dados e usar os recursos robustos do KQL para manipular dados de log.

O destino da regra de alerta de pesquisa de log pode ser:

  • Um único recurso, como uma VM.
  • Um único contêiner de recursos, como um grupo de recursos ou uma assinatura.
  • Vários recursos que utilizam uma consulta em vários recursos.

Os alertas de pesquisa de log podem medir duas coisas diferentes, que podem ser usadas para diferentes cenários de monitoramento:

  • Linhas da tabela: o número de linhas retornadas pode ser usado para trabalhar com eventos como logs de eventos do Windows, Syslog e exceções de aplicativos.
  • Cálculo de uma coluna numérica: Os cálculos baseados em qualquer coluna numérica podem ser usados para incluir qualquer número de recursos. Um exemplo é a percentagem de CPU.

Você pode configurar se os alertas de pesquisa de log são stateful ou stateless.
Observe que os alertas de pesquisa de log com monitoração de estado têm estas limitações:

  • Podem disparar até 300 alertas por avaliação.
  • Pode ter um máximo de 5000 alertas com a fired condição de alerta.

Nota

Os alertas de pesquisa de log funcionam melhor quando você está tentando detetar dados específicos nos logs, em vez de quando você está tentando detetar uma falta de dados nos logs. Como os logs são dados semiestruturados, eles são inerentemente mais latentes do que os dados métricos em informações como uma pulsação de VM. Para evitar falhas de ignição quando você estiver tentando detetar a falta de dados nos logs, considere o uso de alertas métricos. Você pode enviar dados para o armazenamento de métricas a partir de logs usando alertas de métrica para logs.

Monitorar várias instâncias de um recurso usando dimensões

Você pode usar dimensões ao criar regras de alerta de pesquisa de log para monitorar os valores de várias instâncias de um recurso com uma regra. Por exemplo, você pode monitorar o uso da CPU em várias instâncias que executam seu site ou aplicativo. Cada instância é monitorada individualmente. As notificações são enviadas para cada instância.

Monitore a mesma condição em vários recursos usando a divisão por dimensões

Para monitorar a mesma condição em vários recursos do Azure, você pode usar a divisão por dimensões. Ao usar a divisão por dimensões, você pode criar alertas centrados em recursos em escala para uma assinatura ou grupo de recursos. Os alertas são divididos em alertas separados agrupando combinações usando colunas numéricas ou de cadeia de caracteres. A divisão na coluna ID de recurso do Azure transforma o recurso especificado no destino do alerta.

Você também pode decidir não dividir quando quiser que uma condição seja aplicada a vários recursos no escopo. Por exemplo, talvez você queira disparar um alerta se pelo menos cinco máquinas no escopo do grupo de recursos tiverem uso de CPU superior a 80%.

Usar a API para regras de alerta de pesquisa de log

Gerencie novas regras em seus espaços de trabalho usando a API ScheduledQueryRules .

Nota

Os alertas de pesquisa de log para o Log Analytics costumavam ser gerenciados usando a API de alerta do Log Analytics herdada. Saiba mais sobre como mudar para a API ScheduledQueryRules atual.

Registrar alertas de pesquisa em sua fatura do Azure

Os alertas de pesquisa de log estão listados em provedor de microsoft.insights/scheduledqueryrules recursos com:

  • Registre alertas de pesquisa no Application Insights mostrados com o nome exato do recurso, juntamente com o grupo de recursos e as propriedades de alerta.
  • Os alertas de pesquisa de log no Log Analytics são mostrados com o nome exato do recurso, juntamente com o grupo de recursos e as propriedades de alerta quando são criados usando a API scheduledQueryRules.
  • Os alertas de pesquisa de log criados a partir da API herdada do Log Analytics não são recursos do Azure rastreados e não têm nomes de recursos exclusivos impostos. Esses alertas ainda são criados como microsoft.insights/scheduledqueryrules recursos ocultos, que têm a estrutura <WorkspaceName>|<savedSearchId>|<scheduleId>|<ActionId>de nomenclatura de recursos. Os alertas de pesquisa de log na API herdada são mostrados com o nome do recurso oculto anterior, juntamente com o grupo de recursos e as propriedades de alerta.

Nota

Caracteres de recurso não suportados como <, >, %, &, ? e / são substituídos por um sublinhado (_) nos nomes de recursos ocultos. Esta alteração de caráter também se reflete nas informações de faturação.

Alertas do registo de atividades

Um alerta de registro de atividades monitora um recurso verificando os logs de atividade em busca de um novo evento de registro de atividades que corresponda às condições definidas.

Talvez você queira usar alertas de log de atividades para esses tipos de cenários:

  • Quando uma operação específica ocorre em recursos em um grupo de recursos ou assinatura específica. Por exemplo, talvez você queira ser notificado quando:
    • Uma VM em um grupo de recursos de produção é excluída.
    • Novas funções são atribuídas a um usuário em sua assinatura.
  • Ocorre um evento de Integridade do Serviço. Os eventos de Estado de Funcionamento do Serviço incluem notificações de incidentes e eventos de manutenção que se aplicam aos recursos da sua subscrição.

Você pode criar um alerta de registro de atividades em:

  • Qualquer uma das categorias de eventos do registro de atividades, exceto em eventos de alerta.
  • Qualquer evento de log de atividades em uma propriedade de nível superior no objeto JSON.

As regras de alerta do log de atividades são recursos do Azure, portanto, podem ser criadas usando um modelo do Azure Resource Manager. Eles também podem ser criados, atualizados ou excluídos no portal do Azure.

Um alerta de registo de atividades monitoriza apenas eventos na subscrição na qual o alerta é criado.

Alertas de Estado de Funcionamento do Serviço

Os alertas de Estado de Funcionamento do Serviço são um tipo de alerta de atividade. O Estado de Funcionamento do Serviço permite-lhe saber sobre interrupções, atividades de manutenção planeadas e outros avisos de saúde, porque a experiência autenticada do Estado de Funcionamento do Serviço sabe quais os serviços e recursos que utiliza atualmente.

A melhor maneira de usar a Integridade do Serviço é configurar alertas de Integridade do Serviço para notificá-lo usando seus canais de comunicação preferidos quando problemas de serviço, manutenção planejada ou outras alterações podem afetar os serviços e regiões do Azure que você usa.

Alertas de integridade do recurso

Os alertas de Estado de Funcionamento dos Recursos são um tipo de alerta de atividade. A visão geral da Integridade dos Recursos ajuda você a diagnosticar e obter suporte para problemas de serviço que afetam seus recursos do Azure. Comunica o estado de funcionamento atual e anterior dos recursos.

A Integridade do Recurso depende de sinais de diferentes serviços do Azure para avaliar se um recurso está íntegro. Se um recurso não estiver íntegro, o Resource Health analisará mais informações para determinar a origem do problema. Ele também informa sobre as ações que a Microsoft está tomando para corrigir o problema e identifica as ações que você pode tomar para resolvê-lo.

Alertas de deteção inteligentes

Depois de configurar o Application Insights para seu projeto e seu aplicativo gerar uma certa quantidade de dados, a deteção inteligente leva 24 horas para aprender o comportamento normal do seu aplicativo. O desempenho do seu aplicativo tem um padrão típico de comportamento. Algumas solicitações ou chamadas de dependência serão mais propensas a falhas do que outras, e a taxa geral de falhas pode aumentar à medida que a carga aumenta.

A deteção inteligente usa aprendizado de máquina para encontrar essas anomalias. A deteção inteligente monitoriza os dados recebidos da sua aplicação e, em particular, as taxas de falha. O Application Insights alerta automaticamente em tempo quase real se seu aplicativo Web tiver um aumento anormal na taxa de solicitações com falha.

À medida que os dados entram no Application Insights a partir do seu aplicativo Web, a deteção inteligente compara o comportamento atual com os padrões vistos nos últimos dias. Se houver um aumento anormal na taxa de falhas em comparação com o desempenho anterior, uma análise é acionada.

Para ajudá-lo a triar e diagnosticar um problema, uma análise das características das falhas e dos dados relacionados do aplicativo é fornecida nos detalhes do alerta. Há também links para o portal do Application Insights para diagnósticos adicionais. O recurso não precisa de instalação ou configuração porque usa algoritmos de aprendizado de máquina para prever a taxa de falha normal.

Embora os alertas métricos digam que pode haver um problema, a deteção inteligente inicia o trabalho de diagnóstico para você. Ele executa grande parte da análise que você teria que fazer sozinho. Você obtém os resultados bem embalados, o que ajuda você a chegar rapidamente à raiz do problema.

A deteção inteligente funciona para aplicações Web alojadas na nuvem ou nos seus próprios servidores que geram pedidos de aplicações ou dados de dependência.

Alertas do Prometheus

Os alertas Prometheus são usados para monitorar métricas armazenadas nos serviços gerenciados do Azure Monitor para Prometheus. As regras de alerta do Prometheus são configuradas como parte dos grupos de regras do Prometheus. São acionados quando o resultado de uma expressão PromQL é resolvido como verdadeiro. Os alertas Prometheus disparados são exibidos e gerenciados como outros tipos de alerta.

Próximos passos