Referência de dados de monitoramento do Azure OpenAI

Artigo
01/03/2025

Este artigo contém todas as informações de referência de monitoramento para este serviço.

Consulte Monitorar o Azure OpenAI para obter detalhes sobre os dados que você pode coletar para o Serviço OpenAI do Azure e como usá-lo.

Métricas

Esta seção lista todas as métricas de plataforma coletadas automaticamente para este serviço. Essas métricas também fazem parte da lista global de todas as métricas de plataforma com suporte no Azure Monitor.

Para obter informações sobre retenção de métricas, consulte Visão geral do Azure Monitor Metrics.

Métricas suportadas para Microsoft.CognitiveServices/accounts

Aqui estão as métricas mais importantes que achamos que você deve monitorar para o Azure OpenAI. Mais adiante neste artigo é uma lista mais longa de todas as métricas de serviços de IA do Azure disponíveis que contém mais detalhes sobre métricas nesta lista mais curta.

Solicitações do Azure OpenAI
Tokens ativos
Tokens de conclusão gerados
Horas de treinamento FineTuned processadas
Tokens de inferência processados
Tokens de prompt processados
Utilização gerenciada provisionada V2
Taxa de correspondência de cache de token de prompt
Tempo de resposta
Tempo entre tokens
Tempo até ao último byte
Tempo normalizado para o primeiro byte

Você também pode monitorar métricas de Segurança de Conteúdo usadas por outros serviços de IA do Azure.

Volume bloqueado
Volume nocivo detetado
Potencial número de usuários abusivos
Evento do Sistema de Segurança
Volume total enviado para verificação de segurança

Nota

A métrica Utilização gerenciada por provisionamento agora foi preterida e não é mais recomendada. Essa métrica foi substituída pela métrica Utilização gerenciada provisionada V2 .

As métricas de Serviços Cognitivos têm a categoria Serviços Cognitivos - Solicitações HTTP na tabela a seguir. Essas métricas são métricas herdadas que são comuns a todos os recursos dos Serviços de IA do Azure. A Microsoft não recomenda mais que você use essas métricas com o Azure OpenAI.

A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.CognitiveServices/accounts.

Nem todas as colunas podem estar presentes em todas as tabelas.
Algumas colunas podem estar além da área de visualização da página. Selecione Expandir tabela para visualizar todas as colunas disponíveis.

Cabeçalhos de tabela

Categoria - O grupo ou classificação de métricas.
Métrica - O nome para exibição da métrica conforme aparece no portal do Azure.
Nome na API REST - O nome da métrica conforme referido na API REST.
Unidade - Unidade de medida.
Agregação - O tipo de agregação padrão. Valores válidos: Média (Média), Mínima (Mín), Máxima (Máx), Total (Soma), Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Intervalos de grãos de - tempo em que a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
DS Export- Se a métrica é exportável para os Logs do Azure Monitor por meio de configurações de diagnóstico. Para obter informações sobre como exportar métricas, consulte Criar configurações de diagnóstico no Azure Monitor.

Categoria	Métrica	Nome na API REST	Unit	Agregação	Dimensões	Grãos de tempo	DS Exportação
Ocorrências de recursos	Ocorrências de recursos de ação Número de vezes que cada recurso de ação é exibido.	`ActionFeatureIdOccurrences`	Count	Total (soma)	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
Características por evento	Recursos de ação por evento Número médio de recursos de ação por evento.	`ActionFeaturesPerEvent`	Count	Média	`Mode`, `RunId`	PT1M	Sim
Ações	Ocorrências de Ação Número de vezes que cada ação é exibida.	`ActionIdOccurrences`	Count	Total (soma)	`ActionId`, `Mode`, `RunId`	PT1M	Sim
Namespaces por evento	Namespaces de ação por evento Número médio de namespaces de ação por evento.	`ActionNamespacesPerEvent`	Count	Média	`Mode`, `RunId`	PT1M	Sim
Ações	Ações por evento Número de ações por evento.	`ActionsPerEvent`	Count	Média	`Mode`, `RunId`	PT1M	Sim
Azure OpenAI - Utilização	Tokens ativos Total de tokens menos tokens armazenados em cache durante um período de tempo. Aplica-se a implantações gerenciadas por PTU e PTU. Use essa métrica para entender sua utilização baseada em TPS ou TPM para PTUs e comparar com seus benchmarks para TPS ou TPM de destino para seus cenários. Para detalhar solicitações de API, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion.	`ActiveTokens`	Count	Mínimo, Máximo, Média, Total (Soma)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Sim
SpeechServices - Utilização	Segundos de áudio transcritos Número de segundos transcritos	`AudioSecondsTranscribed`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
SpeechServices - Utilização	Segundos de áudio traduzidos Número de segundos traduzidos	`AudioSecondsTranslated`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
SpeechServices - Utilização	Avatar Model Hosting Seconds Número de segundos.	`AvatarModelHostingSeconds`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Azure OpenAI - Solicitações HTTP	Taxa de correspondência de cache de token de prompt A porcentagem dos tokens de prompt atingiu o cache, disponível para gerenciamento de PTU.	`AzureOpenAIContextTokensCacheMatchRate`	Percentagem	Mínimo, Máximo, Médio	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
Azure OpenAI - Utilização	Utilização gerenciada por provisionamento % de utilização para uma implantação gerenciada provisoriamente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Streaming vs solicitações não streaming)	`AzureOpenAIProvisionedManagedUtilization`	Percentagem	Mínimo, Máximo, Médio	`Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
Azure OpenAI - Utilização	Utilização gerenciada provisionada V2 % de utilização para uma implantação gerenciada provisoriamente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Streaming vs solicitações não streaming)	`AzureOpenAIProvisionedManagedUtilizationV2`	Percentagem	Mínimo, Máximo, Médio	`Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
Azure OpenAI - Solicitações HTTP	Solicitações do Azure OpenAI Número de chamadas feitas para a API OpenAI do Azure durante um período de tempo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar solicitações de API, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion, StatusCode (bem-sucedida, clienterrors, erros de servidor), StreamType (Streaming vs solicitações sem streaming) e operation.	`AzureOpenAIRequests`	Count	Total (soma)	`ApiName`, `OperationName`, , `Region`, `ModelDeploymentNameStreamType`, `ModelName`, `ModelVersion`,`StatusCode`	PT1M	Sim
Azure OpenAI - Solicitações HTTP	Tempo de resposta Medida de latência (capacidade de resposta) recomendada para solicitações de streaming. Aplica-se a implantações gerenciadas por PTU e PTU. Calculado como o tempo necessário para que a primeira resposta apareça depois que um usuário envia um prompt, conforme medido pelo gateway de API. Esse número aumenta à medida que o tamanho do prompt aumenta e/ou o tamanho do acerto do cache diminui. Para detalhar o tempo até a métrica de resposta, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. Nota: essa métrica é uma aproximação, pois a latência medida depende fortemente de vários fatores, incluindo chamadas simultâneas e padrão geral de carga de trabalho. Além disso, ele não leva em conta qualquer latência do lado do cliente que possa existir entre seu cliente e o ponto de extremidade da API. Consulte seu próprio registro para obter o rastreamento de latência ideal.	`AzureOpenAITimeToResponse`	Milissegundos	Mínimo, Máximo, Médio	`ApiName`, `OperationName`, , `Region`, `ModelDeploymentNameStreamType`, `ModelName`, `ModelVersion`,`StatusCode`	PT1M	Sim
Ranhuras	Estimativa da linha de base: Recompensa global Estimador da linha de base Recompensa Global.	`BaselineEstimatorOverallReward`	Count	Média	`Mode`, `RunId`	PT1M	Sim
Ranhuras	Recompensa do Slot do Estimador de Linha de Base Recompensa do estimador de linha de base por slot.	`BaselineEstimatorSlotReward`	Count	Média	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Sim
Ranhuras	Estimador Aleatório da Linha de Base Recompensa Global Estimador Aleatório da Linha de Base Recompensa Global.	`BaselineRandomEstimatorOverallReward`	Count	Média	`Mode`, `RunId`	PT1M	Sim
Ranhuras	Recompensa de Slot do Estimador Aleatório da Linha de Base Estimador Aleatório de Linha de Base Recompensa por slot.	`BaselineRandomEstimatorSlotReward`	Count	Média	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Sim
Estimativas	Contagem de eventos aleatórios da linha de base Estimativa para a contagem de eventos aleatórios na linha de base.	`BaselineRandomEventCount`	Count	Total (soma)	`Mode`, `RunId`	PT1M	Sim
Estimativas	Recompensa aleatória da linha de base Estimativa da recompensa aleatória inicial.	`BaselineRandomReward`	Count	Total (soma)	`Mode`, `RunId`	PT1M	Sim
Serviços Cognitivos - Solicitações HTTP	Chamadas bloqueadas Número de chamadas que excederam o limite de tarifa ou quota. Não use para o serviço Azure OpenAI.	`BlockedCalls`	Count	Total (soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Utilização	Contagem de inferência Serviço de Inferência Conde de Carnegie Frontdoor	`CarnegieInferenceCount`	Count	Total (soma)	`Region`, `Modality`, `Category`, `Language`, `SeverityLevel`, `UseCustomList`	PT1M	Sim
Utilização	Personagens treinados (preterido) Número total de caracteres treinados.	`CharactersTrained`	Count	Total (soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Utilização	Caracteres traduzidos (preteridos) Número total de caracteres na solicitação de texto de entrada.	`CharactersTranslated`	Count	Total (soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Serviços Cognitivos - Solicitações HTTP	Erros do cliente Número de chamadas com erro do lado do cliente (código de resposta HTTP 4xx). Não use para o serviço Azure OpenAI.	`ClientErrors`	Count	Total (soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Utilização	Transações de visão computacional Número de transações de visão computacional	`ComputerVisionTransactions`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
ContentSafety - Utilização	Contagem de chamadas para moderação de imagem Número de chamadas para moderação de imagem.	`ContentSafetyImageAnalyzeRequestCount`	Count	Total (soma)	`ApiVersion`	PT1M	Sim
ContentSafety - Utilização	Contagem de chamadas para moderação de texto Número de apelos à moderação de texto.	`ContentSafetyTextAnalyzeRequestCount`	Count	Total (soma)	`ApiVersion`	PT1M	Sim
Ocorrências de recursos	Ocorrências de recursos de contexto Número de vezes que cada recurso de contexto aparece.	`ContextFeatureIdOccurrences`	Count	Total (soma)	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
Características por evento	Recursos de contexto por evento Número de recursos de contexto por evento.	`ContextFeaturesPerEvent`	Count	Média	`Mode`, `RunId`	PT1M	Sim
Namespaces por evento	Namespaces de contexto por evento Número de namespaces de contexto por evento.	`ContextNamespacesPerEvent`	Count	Média	`Mode`, `RunId`	PT1M	Sim
Utilização	Tempo de Treino de Visão Personalizada Tempo de treinamento de Visão Personalizada	`CustomVisionTrainingTime`	Segundos	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Transações de Visão Personalizada Número de transações de previsão da Visão Personalizada	`CustomVisionTransactions`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Serviços Cognitivos - Solicitações HTTP	Dados em Tamanho dos dados recebidos em bytes. Não use para o serviço Azure OpenAI.	`DataIn`	Bytes	Total (soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Serviços Cognitivos - Solicitações HTTP	Saída de dados Tamanho dos dados de saída em bytes. Não use para o serviço Azure OpenAI.	`DataOut`	Bytes	Total (soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Utilização	Caracteres do documento traduzidos Número de caracteres no pedido de tradução de documentos.	`DocumentCharactersTranslated`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Caracteres personalizados do documento traduzidos Número de caracteres na solicitação de tradução de documentos personalizados.	`DocumentCustomCharactersTranslated`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Imagens de rosto treinadas Número de imagens treinadas. 1.000 imagens treinadas por transação.	`FaceImagesTrained`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Rostos armazenados Número de rostos armazenados, rateados diariamente. O número de faces armazenadas é relatado diariamente.	`FacesStored`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Transações faciais Número de chamadas de API feitas para o serviço Face	`FaceTransactions`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
CaracterísticaCardinalidade	Funcionalidade Cardinalidade por Ação Característica: Cardinalidade baseada em Ação.	`FeatureCardinality_Action`	Count	Média	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
CaracterísticaCardinalidade	Cardinalidade do recurso por contexto Cardinalidade do recurso com base no contexto.	`FeatureCardinality_Context`	Count	Média	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
CaracterísticaCardinalidade	Cardinalidade do recurso por slot Característica: Cardinalidade baseada no Slot.	`FeatureCardinality_Slot`	Count	Média	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
Azure OpenAI - Utilização	Horas de treinamento FineTuned processadas Número de horas de treinamento processadas em um modelo OpenAI FineTuned	`FineTunedTrainingHours`	Count	Total (soma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Azure OpenAI - Utilização	Tokens de conclusão gerados Número de tokens gerados (saída) a partir de um modelo OpenAI. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.	`GeneratedTokens`	Count	Total (soma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, `ModelVersion`	PT1M	Sim
Utilização	Imagens armazenadas Número de imagens da Visão Personalizada armazenadas.	`ImagesStored`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Serviços Cognitivos - Solicitações HTTP	Latência Latência em milissegundos. Não use para o serviço Azure OpenAI.	`Latency`	Milissegundos	Média	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Utilização	Eventos aprendidos Número de Eventos Aprendidos.	`LearnedEvents`	Count	Total (soma)	`IsMatchBaseline`, `Mode`, `RunId`	PT1M	Sim
Utilização	Pedidos de Fala LUIS Número de solicitações de compreensão de fala para intenção do LUIS	`LUISSpeechRequests`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Pedidos de texto LUIS Número de pedidos de texto LUIS	`LUISTextRequests`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Recompensas Correspondentes Número de recompensas correspondentes.	`MatchedRewards`	Count	Total (soma)	`Mode`, `RunId`	PT1M	Sim
Utilização	Eventos não ativados Número de eventos ignorados.	`NonActivatedEvents`	Count	Total (soma)	`Mode`, `RunId`	PT1M	Sim
Ranhuras	Faixas horárias Número de slots por evento.	`NumberOfSlots`	Count	Média	`Mode`, `RunId`	PT1M	Sim
SpeechServices - Utilização	Número de perfis de oradores Número de perfis de oradores inscritos. Rateado de hora em hora.	`NumberofSpeakerProfiles`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Recompensas Observadas Número de recompensas observadas.	`ObservedRewards`	Count	Total (soma)	`Mode`, `RunId`	PT1M	Sim
Utilização	Caracteres de sincronização de documentos traduzidos Número de caracteres na solicitação de tradução de documentos (síncrona).	`OneDocumentCharactersTranslated`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Ranhuras	Estimador Online Recompensa Geral Estimador Online Recompensa Geral.	`OnlineEstimatorOverallReward`	Count	Média	`Mode`, `RunId`	PT1M	Sim
Ranhuras	Recompensa de Slot Estimador Online Estimador Online Recompensa por slot.	`OnlineEstimatorSlotReward`	Count	Média	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Sim
Estimativas	Contagem de Eventos Online Estimativa para contagem de eventos online.	`OnlineEventCount`	Count	Total (soma)	`Mode`, `RunId`	PT1M	Sim
Estimativas	Recompensa Online Estimativa para recompensa online.	`OnlineReward`	Count	Total (soma)	`Mode`, `RunId`	PT1M	Sim
Utilização	Caracteres processados Número de caracteres processados pelo leitor imersivo.	`ProcessedCharacters`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Registros de texto de integridade processados Número de registos de texto de saúde processados	`ProcessedHealthTextRecords`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Imagens processadas Número de imagens processadas	`ProcessedImages`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Páginas processadas Número de páginas processadas	`ProcessedPages`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Azure OpenAI - Utilização	Tokens de prompt processados Número de tokens de prompt processados (entrada) em um modelo OpenAI. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.	`ProcessedPromptTokens`	Count	Total (soma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, `ModelVersion`	PT1M	Sim
Utilização	Registros de texto processados Contagem de registros de texto.	`ProcessedTextRecords`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Registros de texto de controle de qualidade Número de registos de texto processados	`QuestionAnsweringTextRecords`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
ContentSafety - Riscos e Segurança	Contagem de usuários potencialmente abusiva Número de utilizadores potencialmente abusivos detetados ao longo de um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: ModelDeploymentName.	`RAIAbusiveUsersCount`	Count	Total (soma)	`Region`, `ModelDeploymentName`	PT1M	Sim
ContentSafety - Riscos e Segurança	Volume nocivo detetado Número de chamadas feitas para a API OpenAI do Azure e detetadas como prejudiciais (modelo de bloco e modo de anotação) pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType.	`RAIHarmfulRequests`	Count	Total (soma)	`Region`, `ModelDeploymentName`, , `ModelName`, `ApiNameModelVersion`, `TextType`, `Category`,`Severity`	PT1M	Sim
ContentSafety - Riscos e Segurança	Volume bloqueado Número de chamadas feitas para a API OpenAI do Azure e rejeitadas pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType.	`RAIRejectedRequests`	Count	Total (soma)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`, `TextType`, `Category`	PT1M	Sim
ContentSafety - Riscos e Segurança	Evento do Sistema de Segurança Evento do sistema para riscos e monitoramento de segurança. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: EventType.	`RAISystemEvent`	Count	Média	`Region`, `EventType`	PT1M	Sim
ContentSafety - Riscos e Segurança	Volume total enviado para verificação de segurança Número de chamadas feitas para a API OpenAI do Azure e detetadas pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName.	`RAITotalRequests`	Count	Total (soma)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`	PT1M	Sim
Serviços Cognitivos - Solicitações HTTP	Limite de taxa O ratelimit atual da chave ratelimit. Não use para o serviço Azure OpenAI.	`Ratelimit`	Count	Total (soma)	`Region`, `RatelimitKey`	PT1M	Sim
Recompensas	Recompensa média por evento Recompensa média por evento.	`Reward`	Count	Média	`BaselineAction`, `ChosenActionId`, `MatchesBaseline`, `NonDefaultReward`, `Mode`, `RunId`	PT1M	Sim
Serviços Cognitivos - Solicitações HTTP	Erros do servidor Número de chamadas com erro interno do serviço (código de resposta HTTP 5xx). Não use para o serviço Azure OpenAI.	`ServerErrors`	Count	Total (soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Ocorrências de recursos	Ocorrências de recursos de slot Número de vezes que cada recurso de slot aparece.	`SlotFeatureIdOccurrences`	Count	Total (soma)	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
Características por evento	Características das ranhuras por evento Número médio de recursos de slots por evento.	`SlotFeaturesPerEvent`	Count	Média	`Mode`, `RunId`	PT1M	Sim
Ranhuras	Ocorrências de Slots Número de vezes que cada ranhura é apresentada.	`SlotIdOccurrences`	Count	Total (soma)	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Sim
Namespaces por evento	Namespaces de slot por evento Número médio de namespaces de slot por evento.	`SlotNamespacesPerEvent`	Count	Média	`Mode`, `RunId`	PT1M	Sim
Recompensas	Recompensa por Slots Recompensa por slot.	`SlotReward`	Count	Média	`BaselineActionId`, `ChosenActionId`, , `MatchesBaseline`, `SlotIdNonDefaultReward`, `SlotIndex`, `Mode`,`RunId`	PT1M	Sim
SpeechServices - Utilização	Transações de reconhecimento de alto-falante Número de transações de reconhecimento de alto-falante	`SpeakerRecognitionTransactions`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
SpeechServices - Utilização	Horas de hospedagem do modelo de fala Número de horas de hospedagem do modelo de fala	`SpeechModelHostingHours`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Duração da sessão de fala (preterido) Duração total da sessão de fala em segundos.	`SpeechSessionDuration`	Segundos	Total (soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Serviços Cognitivos - Solicitações HTTP	Chamadas bem-sucedidas Número de chamadas bem-sucedidas. Não use para o serviço Azure OpenAI.	`SuccessfulCalls`	Count	Total (soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Serviços Cognitivos - SLI	DisponibilidadeTarifa Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros do Servidor)/Total de Chamadas. Os erros do servidor incluem quaisquer respostas >HTTP =500. Não use para o serviço Azure OpenAI.	`SuccessRate`	Percentagem	Mínimo, Máximo, Médio	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Não
SpeechServices - Utilização	Caracteres sintetizados Número de caracteres.	`SynthesizedCharacters`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Caracteres de texto traduzidos Número de caracteres na solicitação de tradução de texto recebida.	`TextCharactersTranslated`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Caracteres personalizados de texto traduzidos Número de caracteres na solicitação de tradução de texto personalizado recebida.	`TextCustomCharactersTranslated`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Utilização	Caracteres treinados em texto Número de caracteres treinados usando tradução de texto.	`TextTrainedCharacters`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Azure OpenAI - Utilização	Tokens de inferência processados Número de tokens de inferência processados em um modelo OpenAI. Calculado como tokens de prompt (entrada) mais tokens gerados (saída). Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.	`TokenTransaction`	Count	Total (soma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, `ModelVersion`	PT1M	Sim
Serviços Cognitivos - Solicitações HTTP	Total de chamadas Número total de chamadas. Não use para o serviço Azure OpenAI.	`TotalCalls`	Count	Total (soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Serviços Cognitivos - Solicitações HTTP	Total de erros Número total de chamadas com resposta de erro (código de resposta HTTP 4xx ou 5xx). Não use para o serviço Azure OpenAI.	`TotalErrors`	Count	Total (soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Utilização	Total de Eventos Número de eventos.	`TotalEvents`	Count	Total (soma)	`Mode`, `RunId`	PT1M	Sim
Serviços Cognitivos - Solicitações HTTP	Total de chamadas de token Número total de chamadas de token.	`TotalTokenCalls`	Count	Total (soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Utilização	Total de transações (preterido) Número total de transações.	`TotalTransactions`	Count	Total (soma)	<nenhum>	PT1M	Sim
Estimativas	Contagem de eventos da linha de base do usuário Estimativa para a contagem de eventos da linha de base definida pelo usuário.	`UserBaselineEventCount`	Count	Total (soma)	`Mode`, `RunId`	PT1M	Sim
Estimativas	Recompensa da linha de base do usuário Estimativa da recompensa de base definida pelo utilizador.	`UserBaselineReward`	Count	Total (soma)	`Mode`, `RunId`	PT1M	Sim
SpeechServices - Utilização	Segundos de vídeo sintetizados Número de segundos sintetizados	`VideoSecondsSynthesized`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
SpeechServices - Utilização	Horas de hospedagem do modelo de voz Número de Horas.	`VoiceModelHostingHours`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
SpeechServices - Utilização	Minutos de treinamento do modelo de voz Número de minutos.	`VoiceModelTrainingMinutes`	Count	Total (soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim

Dimensões métricas

Para obter informações sobre o que são dimensões métricas, consulte Métricas multidimensionais.

Este serviço tem as seguintes dimensões associadas às suas métricas.

ApiName
Nome do recurso
ModelDeploymentName
ModelName
Versão do Modelo
OperationName
País/Região
StatusCode
StreamType
UsageChannel

Registos do recurso

Esta seção lista os tipos de logs de recursos que você pode coletar para este serviço. A seção extrai da lista de todos os tipos de categoria de logs de recursos com suporte no Azure Monitor.

Logs de recursos suportados para Microsoft.CognitiveServices/accounts

Categoria	Nome de exibição da categoria	Tabela de registo	Suporta plano de log básico	Suporta a transformação do tempo de ingestão	Custos de exportação
`Audit`	Registos de Auditoria	AzureDiagnostics Logs de vários recursos do Azure.	No	No	Não
`RequestResponse`	Registos de Pedidos e Respostas	AzureDiagnostics Logs de vários recursos do Azure.	No	No	Não
`Trace`	Logs de rastreamento	AzureDiagnostics Logs de vários recursos do Azure.	No	No	Não

Tabelas de Logs do Azure Monitor

Esta seção lista as tabelas de Logs do Azure Monitor relevantes para este serviço, que estão disponíveis para consulta pelo Log Analytics usando consultas Kusto. As tabelas contêm dados de log de recursos e possivelmente mais, dependendo do que é coletado e roteado para elas.

Azure OpenAI microsoft.cognitiveservices/accounts

Registo de atividades

A tabela vinculada lista as operações que podem ser registradas no log de atividades desse serviço. Essas operações são um subconjunto de todas as operações possíveis do provedor de recursos no log de atividades.

Para obter mais informações sobre o esquema de entradas do log de atividades, consulte Esquema do log de atividades.

AI + operações de provedor de recursos de aprendizado de máquina

Consulte Monitor Azure OpenAI para obter uma descrição do monitoramento do Azure OpenAI.
Consulte Monitorar recursos do Azure com o Azure Monitor para obter detalhes sobre o monitoramento de recursos do Azure.

Partilhar via

Referência de dados de monitoramento do Azure OpenAI

Métricas

Métricas suportadas para Microsoft.CognitiveServices/accounts

Dimensões métricas

Registos do recurso

Logs de recursos suportados para Microsoft.CognitiveServices/accounts

Tabelas de Logs do Azure Monitor

Azure OpenAI microsoft.cognitiveservices/accounts

Registo de atividades

Comentários

Recursos adicionais

Partilhar via

Referência de dados de monitoramento do Azure OpenAI

Métricas

Métricas suportadas para Microsoft.CognitiveServices/accounts

Dimensões métricas

Registos do recurso

Logs de recursos suportados para Microsoft.CognitiveServices/accounts

Tabelas de Logs do Azure Monitor

Azure OpenAI microsoft.cognitiveservices/accounts

Registo de atividades

Conteúdos relacionados

Comentários

Recursos adicionais