Referência de dados de monitoramento do Azure OpenAI
Este artigo contém todas as informações de referência de monitoramento para este serviço.
Consulte Monitorar o Azure OpenAI para obter detalhes sobre os dados que você pode coletar para o Serviço OpenAI do Azure e como usá-lo.
Métricas
Esta seção lista todas as métricas de plataforma coletadas automaticamente para este serviço. Essas métricas também fazem parte da lista global de todas as métricas de plataforma com suporte no Azure Monitor.
Para obter informações sobre retenção de métricas, consulte Visão geral do Azure Monitor Metrics.
Métricas suportadas para Microsoft.CognitiveServices/accounts
Aqui estão as métricas mais importantes que achamos que você deve monitorar para o Azure OpenAI. Mais adiante neste artigo é uma lista mais longa de todas as métricas de serviços de IA do Azure disponíveis que contém mais detalhes sobre métricas nesta lista mais curta.
Solicitações do Azure OpenAI
Tokens ativos
Tokens de conclusão gerados
Horas de treinamento FineTuned processadas
Tokens de inferência processados
Tokens de prompt processados
Utilização gerenciada provisionada V2
Taxa de correspondência de cache de token de prompt
Tempo de resposta
Tempo entre tokens
Tempo até ao último byte
Tempo normalizado para o primeiro byte
Você também pode monitorar métricas de Segurança de Conteúdo usadas por outros serviços de IA do Azure.
- Volume bloqueado
- Volume nocivo detetado
- Potencial número de usuários abusivos
- Evento do Sistema de Segurança
- Volume total enviado para verificação de segurança
Nota
A métrica Utilização gerenciada por provisionamento agora foi preterida e não é mais recomendada. Essa métrica foi substituída pela métrica Utilização gerenciada provisionada V2 .
As métricas de Serviços Cognitivos têm a categoria Serviços Cognitivos - Solicitações HTTP na tabela a seguir. Essas métricas são métricas herdadas que são comuns a todos os recursos dos Serviços de IA do Azure. A Microsoft não recomenda mais que você use essas métricas com o Azure OpenAI.
A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.CognitiveServices/accounts.
- Nem todas as colunas podem estar presentes em todas as tabelas.
- Algumas colunas podem estar além da área de visualização da página. Selecione Expandir tabela para visualizar todas as colunas disponíveis.
Cabeçalhos de tabela
- Categoria - O grupo ou classificação de métricas.
- Métrica - O nome para exibição da métrica conforme aparece no portal do Azure.
- Nome na API REST - O nome da métrica conforme referido na API REST.
- Unidade - Unidade de medida.
- Agregação - O tipo de agregação padrão. Valores válidos: Média (Média), Mínima (Mín), Máxima (Máx), Total (Soma), Contagem.
- Dimensões - Dimensões disponíveis para a métrica.
- Intervalos de grãos de - tempo em que a métrica é amostrada. Por exemplo,
PT1M
indica que a métrica é amostrada a cada minuto,PT30M
a cada 30 minutos,PT1H
a cada hora e assim por diante. - DS Export- Se a métrica é exportável para os Logs do Azure Monitor por meio de configurações de diagnóstico. Para obter informações sobre como exportar métricas, consulte Criar configurações de diagnóstico no Azure Monitor.
Categoria | Métrica | Nome na API REST | Unit | Agregação | Dimensões | Grãos de tempo | DS Exportação |
---|---|---|---|---|---|---|---|
Ocorrências de recursos | Ocorrências de recursos de ação Número de vezes que cada recurso de ação é exibido. |
ActionFeatureIdOccurrences |
Count | Total (soma) | FeatureId , Mode , RunId |
PT1M | Sim |
Características por evento | Recursos de ação por evento Número médio de recursos de ação por evento. |
ActionFeaturesPerEvent |
Count | Média | Mode , RunId |
PT1M | Sim |
Ações | Ocorrências de Ação Número de vezes que cada ação é exibida. |
ActionIdOccurrences |
Count | Total (soma) | ActionId , Mode , RunId |
PT1M | Sim |
Namespaces por evento | Namespaces de ação por evento Número médio de namespaces de ação por evento. |
ActionNamespacesPerEvent |
Count | Média | Mode , RunId |
PT1M | Sim |
Ações | Ações por evento Número de ações por evento. |
ActionsPerEvent |
Count | Média | Mode , RunId |
PT1M | Sim |
Azure OpenAI - Utilização | Tokens ativos Total de tokens menos tokens armazenados em cache durante um período de tempo. Aplica-se a implantações gerenciadas por PTU e PTU. Use essa métrica para entender sua utilização baseada em TPS ou TPM para PTUs e comparar com seus benchmarks para TPS ou TPM de destino para seus cenários. Para detalhar solicitações de API, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. |
ActiveTokens |
Count | Mínimo, Máximo, Média, Total (Soma) | Region , ModelDeploymentName , ModelName , ModelVersion |
PT1M | Sim |
SpeechServices - Utilização | Segundos de áudio transcritos Número de segundos transcritos |
AudioSecondsTranscribed |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
SpeechServices - Utilização | Segundos de áudio traduzidos Número de segundos traduzidos |
AudioSecondsTranslated |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
SpeechServices - Utilização | Avatar Model Hosting Seconds Número de segundos. |
AvatarModelHostingSeconds |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Azure OpenAI - Solicitações HTTP | Taxa de correspondência de cache de token de prompt A porcentagem dos tokens de prompt atingiu o cache, disponível para gerenciamento de PTU. |
AzureOpenAIContextTokensCacheMatchRate |
Percentagem | Mínimo, Máximo, Médio | Region , ModelDeploymentName , ModelName , ModelVersion |
PT1M | Não |
Azure OpenAI - Utilização | Utilização gerenciada por provisionamento % de utilização para uma implantação gerenciada provisoriamente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Streaming vs solicitações não streaming) |
AzureOpenAIProvisionedManagedUtilization |
Percentagem | Mínimo, Máximo, Médio | Region , StreamType , ModelDeploymentName , ModelName , ModelVersion |
PT1M | Não |
Azure OpenAI - Utilização | Utilização gerenciada provisionada V2 % de utilização para uma implantação gerenciada provisoriamente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Streaming vs solicitações não streaming) |
AzureOpenAIProvisionedManagedUtilizationV2 |
Percentagem | Mínimo, Máximo, Médio | Region , StreamType , ModelDeploymentName , ModelName , ModelVersion |
PT1M | Não |
Azure OpenAI - Solicitações HTTP | Solicitações do Azure OpenAI Número de chamadas feitas para a API OpenAI do Azure durante um período de tempo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar solicitações de API, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion, StatusCode (bem-sucedida, clienterrors, erros de servidor), StreamType (Streaming vs solicitações sem streaming) e operation. |
AzureOpenAIRequests |
Count | Total (soma) | ApiName , OperationName , , Region , ModelDeploymentName StreamType , ModelName , ModelVersion ,StatusCode |
PT1M | Sim |
Azure OpenAI - Solicitações HTTP | Tempo de resposta Medida de latência (capacidade de resposta) recomendada para solicitações de streaming. Aplica-se a implantações gerenciadas por PTU e PTU. Calculado como o tempo necessário para que a primeira resposta apareça depois que um usuário envia um prompt, conforme medido pelo gateway de API. Esse número aumenta à medida que o tamanho do prompt aumenta e/ou o tamanho do acerto do cache diminui. Para detalhar o tempo até a métrica de resposta, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. Nota: essa métrica é uma aproximação, pois a latência medida depende fortemente de vários fatores, incluindo chamadas simultâneas e padrão geral de carga de trabalho. Além disso, ele não leva em conta qualquer latência do lado do cliente que possa existir entre seu cliente e o ponto de extremidade da API. Consulte seu próprio registro para obter o rastreamento de latência ideal. |
AzureOpenAITimeToResponse |
Milissegundos | Mínimo, Máximo, Médio | ApiName , OperationName , , Region , ModelDeploymentName StreamType , ModelName , ModelVersion ,StatusCode |
PT1M | Sim |
Ranhuras | Estimativa da linha de base: Recompensa global Estimador da linha de base Recompensa Global. |
BaselineEstimatorOverallReward |
Count | Média | Mode , RunId |
PT1M | Sim |
Ranhuras | Recompensa do Slot do Estimador de Linha de Base Recompensa do estimador de linha de base por slot. |
BaselineEstimatorSlotReward |
Count | Média | SlotId , SlotIndex , Mode , RunId |
PT1M | Sim |
Ranhuras | Estimador Aleatório da Linha de Base Recompensa Global Estimador Aleatório da Linha de Base Recompensa Global. |
BaselineRandomEstimatorOverallReward |
Count | Média | Mode , RunId |
PT1M | Sim |
Ranhuras | Recompensa de Slot do Estimador Aleatório da Linha de Base Estimador Aleatório de Linha de Base Recompensa por slot. |
BaselineRandomEstimatorSlotReward |
Count | Média | SlotId , SlotIndex , Mode , RunId |
PT1M | Sim |
Estimativas | Contagem de eventos aleatórios da linha de base Estimativa para a contagem de eventos aleatórios na linha de base. |
BaselineRandomEventCount |
Count | Total (soma) | Mode , RunId |
PT1M | Sim |
Estimativas | Recompensa aleatória da linha de base Estimativa da recompensa aleatória inicial. |
BaselineRandomReward |
Count | Total (soma) | Mode , RunId |
PT1M | Sim |
Serviços Cognitivos - Solicitações HTTP | Chamadas bloqueadas Número de chamadas que excederam o limite de tarifa ou quota. Não use para o serviço Azure OpenAI. |
BlockedCalls |
Count | Total (soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Utilização | Contagem de inferência Serviço de Inferência Conde de Carnegie Frontdoor |
CarnegieInferenceCount |
Count | Total (soma) | Region , Modality , Category , Language , SeverityLevel , UseCustomList |
PT1M | Sim |
Utilização | Personagens treinados (preterido) Número total de caracteres treinados. |
CharactersTrained |
Count | Total (soma) | ApiName , OperationName , Region |
PT1M | Sim |
Utilização | Caracteres traduzidos (preteridos) Número total de caracteres na solicitação de texto de entrada. |
CharactersTranslated |
Count | Total (soma) | ApiName , OperationName , Region |
PT1M | Sim |
Serviços Cognitivos - Solicitações HTTP | Erros do cliente Número de chamadas com erro do lado do cliente (código de resposta HTTP 4xx). Não use para o serviço Azure OpenAI. |
ClientErrors |
Count | Total (soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Utilização | Transações de visão computacional Número de transações de visão computacional |
ComputerVisionTransactions |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
ContentSafety - Utilização | Contagem de chamadas para moderação de imagem Número de chamadas para moderação de imagem. |
ContentSafetyImageAnalyzeRequestCount |
Count | Total (soma) | ApiVersion |
PT1M | Sim |
ContentSafety - Utilização | Contagem de chamadas para moderação de texto Número de apelos à moderação de texto. |
ContentSafetyTextAnalyzeRequestCount |
Count | Total (soma) | ApiVersion |
PT1M | Sim |
Ocorrências de recursos | Ocorrências de recursos de contexto Número de vezes que cada recurso de contexto aparece. |
ContextFeatureIdOccurrences |
Count | Total (soma) | FeatureId , Mode , RunId |
PT1M | Sim |
Características por evento | Recursos de contexto por evento Número de recursos de contexto por evento. |
ContextFeaturesPerEvent |
Count | Média | Mode , RunId |
PT1M | Sim |
Namespaces por evento | Namespaces de contexto por evento Número de namespaces de contexto por evento. |
ContextNamespacesPerEvent |
Count | Média | Mode , RunId |
PT1M | Sim |
Utilização | Tempo de Treino de Visão Personalizada Tempo de treinamento de Visão Personalizada |
CustomVisionTrainingTime |
Segundos | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Transações de Visão Personalizada Número de transações de previsão da Visão Personalizada |
CustomVisionTransactions |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Serviços Cognitivos - Solicitações HTTP | Dados em Tamanho dos dados recebidos em bytes. Não use para o serviço Azure OpenAI. |
DataIn |
Bytes | Total (soma) | ApiName , OperationName , Region |
PT1M | Sim |
Serviços Cognitivos - Solicitações HTTP | Saída de dados Tamanho dos dados de saída em bytes. Não use para o serviço Azure OpenAI. |
DataOut |
Bytes | Total (soma) | ApiName , OperationName , Region |
PT1M | Sim |
Utilização | Caracteres do documento traduzidos Número de caracteres no pedido de tradução de documentos. |
DocumentCharactersTranslated |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Caracteres personalizados do documento traduzidos Número de caracteres na solicitação de tradução de documentos personalizados. |
DocumentCustomCharactersTranslated |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Imagens de rosto treinadas Número de imagens treinadas. 1.000 imagens treinadas por transação. |
FaceImagesTrained |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Rostos armazenados Número de rostos armazenados, rateados diariamente. O número de faces armazenadas é relatado diariamente. |
FacesStored |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Transações faciais Número de chamadas de API feitas para o serviço Face |
FaceTransactions |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
CaracterísticaCardinalidade | Funcionalidade Cardinalidade por Ação Característica: Cardinalidade baseada em Ação. |
FeatureCardinality_Action |
Count | Média | FeatureId , Mode , RunId |
PT1M | Sim |
CaracterísticaCardinalidade | Cardinalidade do recurso por contexto Cardinalidade do recurso com base no contexto. |
FeatureCardinality_Context |
Count | Média | FeatureId , Mode , RunId |
PT1M | Sim |
CaracterísticaCardinalidade | Cardinalidade do recurso por slot Característica: Cardinalidade baseada no Slot. |
FeatureCardinality_Slot |
Count | Média | FeatureId , Mode , RunId |
PT1M | Sim |
Azure OpenAI - Utilização | Horas de treinamento FineTuned processadas Número de horas de treinamento processadas em um modelo OpenAI FineTuned |
FineTunedTrainingHours |
Count | Total (soma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Azure OpenAI - Utilização | Tokens de conclusão gerados Número de tokens gerados (saída) a partir de um modelo OpenAI. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
GeneratedTokens |
Count | Total (soma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region , ModelVersion |
PT1M | Sim |
Utilização | Imagens armazenadas Número de imagens da Visão Personalizada armazenadas. |
ImagesStored |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Serviços Cognitivos - Solicitações HTTP | Latência Latência em milissegundos. Não use para o serviço Azure OpenAI. |
Latency |
Milissegundos | Média | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Utilização | Eventos aprendidos Número de Eventos Aprendidos. |
LearnedEvents |
Count | Total (soma) | IsMatchBaseline , Mode , RunId |
PT1M | Sim |
Utilização | Pedidos de Fala LUIS Número de solicitações de compreensão de fala para intenção do LUIS |
LUISSpeechRequests |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Pedidos de texto LUIS Número de pedidos de texto LUIS |
LUISTextRequests |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Recompensas Correspondentes Número de recompensas correspondentes. |
MatchedRewards |
Count | Total (soma) | Mode , RunId |
PT1M | Sim |
Utilização | Eventos não ativados Número de eventos ignorados. |
NonActivatedEvents |
Count | Total (soma) | Mode , RunId |
PT1M | Sim |
Ranhuras | Faixas horárias Número de slots por evento. |
NumberOfSlots |
Count | Média | Mode , RunId |
PT1M | Sim |
SpeechServices - Utilização | Número de perfis de oradores Número de perfis de oradores inscritos. Rateado de hora em hora. |
NumberofSpeakerProfiles |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Recompensas Observadas Número de recompensas observadas. |
ObservedRewards |
Count | Total (soma) | Mode , RunId |
PT1M | Sim |
Utilização | Caracteres de sincronização de documentos traduzidos Número de caracteres na solicitação de tradução de documentos (síncrona). |
OneDocumentCharactersTranslated |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Ranhuras | Estimador Online Recompensa Geral Estimador Online Recompensa Geral. |
OnlineEstimatorOverallReward |
Count | Média | Mode , RunId |
PT1M | Sim |
Ranhuras | Recompensa de Slot Estimador Online Estimador Online Recompensa por slot. |
OnlineEstimatorSlotReward |
Count | Média | SlotId , SlotIndex , Mode , RunId |
PT1M | Sim |
Estimativas | Contagem de Eventos Online Estimativa para contagem de eventos online. |
OnlineEventCount |
Count | Total (soma) | Mode , RunId |
PT1M | Sim |
Estimativas | Recompensa Online Estimativa para recompensa online. |
OnlineReward |
Count | Total (soma) | Mode , RunId |
PT1M | Sim |
Utilização | Caracteres processados Número de caracteres processados pelo leitor imersivo. |
ProcessedCharacters |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Registros de texto de integridade processados Número de registos de texto de saúde processados |
ProcessedHealthTextRecords |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Imagens processadas Número de imagens processadas |
ProcessedImages |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Páginas processadas Número de páginas processadas |
ProcessedPages |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Azure OpenAI - Utilização | Tokens de prompt processados Número de tokens de prompt processados (entrada) em um modelo OpenAI. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
ProcessedPromptTokens |
Count | Total (soma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region , ModelVersion |
PT1M | Sim |
Utilização | Registros de texto processados Contagem de registros de texto. |
ProcessedTextRecords |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Registros de texto de controle de qualidade Número de registos de texto processados |
QuestionAnsweringTextRecords |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
ContentSafety - Riscos e Segurança | Contagem de usuários potencialmente abusiva Número de utilizadores potencialmente abusivos detetados ao longo de um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: ModelDeploymentName. |
RAIAbusiveUsersCount |
Count | Total (soma) | Region , ModelDeploymentName |
PT1M | Sim |
ContentSafety - Riscos e Segurança | Volume nocivo detetado Número de chamadas feitas para a API OpenAI do Azure e detetadas como prejudiciais (modelo de bloco e modo de anotação) pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType. |
RAIHarmfulRequests |
Count | Total (soma) | Region , ModelDeploymentName , , ModelName , ApiName ModelVersion , TextType , Category ,Severity |
PT1M | Sim |
ContentSafety - Riscos e Segurança | Volume bloqueado Número de chamadas feitas para a API OpenAI do Azure e rejeitadas pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType. |
RAIRejectedRequests |
Count | Total (soma) | Region , ModelDeploymentName , ModelName , ModelVersion , ApiName , TextType , Category |
PT1M | Sim |
ContentSafety - Riscos e Segurança | Evento do Sistema de Segurança Evento do sistema para riscos e monitoramento de segurança. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: EventType. |
RAISystemEvent |
Count | Média | Region , EventType |
PT1M | Sim |
ContentSafety - Riscos e Segurança | Volume total enviado para verificação de segurança Número de chamadas feitas para a API OpenAI do Azure e detetadas pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName. |
RAITotalRequests |
Count | Total (soma) | Region , ModelDeploymentName , ModelName , ModelVersion , ApiName |
PT1M | Sim |
Serviços Cognitivos - Solicitações HTTP | Limite de taxa O ratelimit atual da chave ratelimit. Não use para o serviço Azure OpenAI. |
Ratelimit |
Count | Total (soma) | Region , RatelimitKey |
PT1M | Sim |
Recompensas | Recompensa média por evento Recompensa média por evento. |
Reward |
Count | Média | BaselineAction , ChosenActionId , MatchesBaseline , NonDefaultReward , Mode , RunId |
PT1M | Sim |
Serviços Cognitivos - Solicitações HTTP | Erros do servidor Número de chamadas com erro interno do serviço (código de resposta HTTP 5xx). Não use para o serviço Azure OpenAI. |
ServerErrors |
Count | Total (soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Ocorrências de recursos | Ocorrências de recursos de slot Número de vezes que cada recurso de slot aparece. |
SlotFeatureIdOccurrences |
Count | Total (soma) | FeatureId , Mode , RunId |
PT1M | Sim |
Características por evento | Características das ranhuras por evento Número médio de recursos de slots por evento. |
SlotFeaturesPerEvent |
Count | Média | Mode , RunId |
PT1M | Sim |
Ranhuras | Ocorrências de Slots Número de vezes que cada ranhura é apresentada. |
SlotIdOccurrences |
Count | Total (soma) | SlotId , SlotIndex , Mode , RunId |
PT1M | Sim |
Namespaces por evento | Namespaces de slot por evento Número médio de namespaces de slot por evento. |
SlotNamespacesPerEvent |
Count | Média | Mode , RunId |
PT1M | Sim |
Recompensas | Recompensa por Slots Recompensa por slot. |
SlotReward |
Count | Média | BaselineActionId , ChosenActionId , , MatchesBaseline , SlotId NonDefaultReward , SlotIndex , Mode ,RunId |
PT1M | Sim |
SpeechServices - Utilização | Transações de reconhecimento de alto-falante Número de transações de reconhecimento de alto-falante |
SpeakerRecognitionTransactions |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
SpeechServices - Utilização | Horas de hospedagem do modelo de fala Número de horas de hospedagem do modelo de fala |
SpeechModelHostingHours |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Duração da sessão de fala (preterido) Duração total da sessão de fala em segundos. |
SpeechSessionDuration |
Segundos | Total (soma) | ApiName , OperationName , Region |
PT1M | Sim |
Serviços Cognitivos - Solicitações HTTP | Chamadas bem-sucedidas Número de chamadas bem-sucedidas. Não use para o serviço Azure OpenAI. |
SuccessfulCalls |
Count | Total (soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Serviços Cognitivos - SLI | DisponibilidadeTarifa Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros do Servidor)/Total de Chamadas. Os erros do servidor incluem quaisquer respostas >HTTP =500. Não use para o serviço Azure OpenAI. |
SuccessRate |
Percentagem | Mínimo, Máximo, Médio | ApiName , OperationName , Region , RatelimitKey |
PT1M | Não |
SpeechServices - Utilização | Caracteres sintetizados Número de caracteres. |
SynthesizedCharacters |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Caracteres de texto traduzidos Número de caracteres na solicitação de tradução de texto recebida. |
TextCharactersTranslated |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Caracteres personalizados de texto traduzidos Número de caracteres na solicitação de tradução de texto personalizado recebida. |
TextCustomCharactersTranslated |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Utilização | Caracteres treinados em texto Número de caracteres treinados usando tradução de texto. |
TextTrainedCharacters |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Azure OpenAI - Utilização | Tokens de inferência processados Número de tokens de inferência processados em um modelo OpenAI. Calculado como tokens de prompt (entrada) mais tokens gerados (saída). Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
TokenTransaction |
Count | Total (soma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region , ModelVersion |
PT1M | Sim |
Serviços Cognitivos - Solicitações HTTP | Total de chamadas Número total de chamadas. Não use para o serviço Azure OpenAI. |
TotalCalls |
Count | Total (soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Serviços Cognitivos - Solicitações HTTP | Total de erros Número total de chamadas com resposta de erro (código de resposta HTTP 4xx ou 5xx). Não use para o serviço Azure OpenAI. |
TotalErrors |
Count | Total (soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Utilização | Total de Eventos Número de eventos. |
TotalEvents |
Count | Total (soma) | Mode , RunId |
PT1M | Sim |
Serviços Cognitivos - Solicitações HTTP | Total de chamadas de token Número total de chamadas de token. |
TotalTokenCalls |
Count | Total (soma) | ApiName , OperationName , Region |
PT1M | Sim |
Utilização | Total de transações (preterido) Número total de transações. |
TotalTransactions |
Count | Total (soma) | <nenhum> | PT1M | Sim |
Estimativas | Contagem de eventos da linha de base do usuário Estimativa para a contagem de eventos da linha de base definida pelo usuário. |
UserBaselineEventCount |
Count | Total (soma) | Mode , RunId |
PT1M | Sim |
Estimativas | Recompensa da linha de base do usuário Estimativa da recompensa de base definida pelo utilizador. |
UserBaselineReward |
Count | Total (soma) | Mode , RunId |
PT1M | Sim |
SpeechServices - Utilização | Segundos de vídeo sintetizados Número de segundos sintetizados |
VideoSecondsSynthesized |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
SpeechServices - Utilização | Horas de hospedagem do modelo de voz Número de Horas. |
VoiceModelHostingHours |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
SpeechServices - Utilização | Minutos de treinamento do modelo de voz Número de minutos. |
VoiceModelTrainingMinutes |
Count | Total (soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Dimensões métricas
Para obter informações sobre o que são dimensões métricas, consulte Métricas multidimensionais.
Este serviço tem as seguintes dimensões associadas às suas métricas.
- ApiName
- Nome do recurso
- ModelDeploymentName
- ModelName
- Versão do Modelo
- OperationName
- País/Região
- StatusCode
- StreamType
- UsageChannel
Registos do recurso
Esta seção lista os tipos de logs de recursos que você pode coletar para este serviço. A seção extrai da lista de todos os tipos de categoria de logs de recursos com suporte no Azure Monitor.
Logs de recursos suportados para Microsoft.CognitiveServices/accounts
Categoria | Nome de exibição da categoria | Tabela de registo | Suporta plano de log básico | Suporta a transformação do tempo de ingestão | Consultas de exemplo | Custos de exportação |
---|---|---|---|---|---|---|
Audit |
Registos de Auditoria | AzureDiagnostics Logs de vários recursos do Azure. |
No | No | Não | |
RequestResponse |
Registos de Pedidos e Respostas | AzureDiagnostics Logs de vários recursos do Azure. |
No | No | Não | |
Trace |
Logs de rastreamento | AzureDiagnostics Logs de vários recursos do Azure. |
No | No | Não |
Tabelas de Logs do Azure Monitor
Esta seção lista as tabelas de Logs do Azure Monitor relevantes para este serviço, que estão disponíveis para consulta pelo Log Analytics usando consultas Kusto. As tabelas contêm dados de log de recursos e possivelmente mais, dependendo do que é coletado e roteado para elas.
Azure OpenAI microsoft.cognitiveservices/accounts
Registo de atividades
A tabela vinculada lista as operações que podem ser registradas no log de atividades desse serviço. Essas operações são um subconjunto de todas as operações possíveis do provedor de recursos no log de atividades.
Para obter mais informações sobre o esquema de entradas do log de atividades, consulte Esquema do log de atividades.
Conteúdos relacionados
- Consulte Monitor Azure OpenAI para obter uma descrição do monitoramento do Azure OpenAI.
- Consulte Monitorar recursos do Azure com o Azure Monitor para obter detalhes sobre o monitoramento de recursos do Azure.