Informations de référence sur les données de monitoring d’Azure OpenAI
Cet article contient toutes les informations de référence de surveillance pour ce service.
Consultez Monitor Azure OpenAI pour plus d’informations sur les données que vous pouvez collecter pour Azure OpenAI Service et comment l’utiliser.
Métriques
Cette section répertorie toutes les métriques de plateforme collectées automatiquement pour App Service. Ces métriques font également partie de la liste globale de toutes les métriques de plateforme prises en charge dans Azure Monitor.
Pour plus d’informations sur les métriques de surveillance, consultez la section Présentation des métriques Azure Monitor.
Métriques prises en charge pour Microsoft.CognitiveServices/accounts
Voici les métriques les plus importantes que nous pensons que vous devez surveiller pour Azure OpenAI. Plus loin dans cet article est une liste plus longue de toutes les métriques des services Azure AI disponibles qui contiennent plus de détails sur les métriques de cette liste plus courte.
- Demandes Azure OpenAI
- Jetons actifs
- Jetons d’achèvement générés
- Heures de formation FineTuned traitées
- Jetons d’inférence traités
- Jetons d’invite traités
- Utilisation managée provisionnée V2
- Taux de correspondance du cache du jeton d’invite
- Temps de réponse
- Durée entre les jetons
Vous pouvez également surveiller les métriques de sécurité du contenu utilisées par d’autres services Azure AI.
- Volume bloqué
- Volume dangereux détecté
- Nombre potentiel d’utilisateurs abusifs
- Événement du système de sécurité
- Volume total envoyé pour vérification de sécurité
Remarque
La métrique d’utilisation gérée par l’approvisionnement est désormais déconseillée et n’est plus recommandée. Cette métrique a été remplacée par la métrique d’utilisation managée provisionnée V2.
Les métriques Cognitive Services ont la catégorie Cognitive Services - Requêtes HTTP dans le tableau suivant. Ces métriques sont des métriques héritées communes à toutes les ressources Azure AI Services. Microsoft ne vous recommande plus d’utiliser ces métriques avec Azure OpenAI.
Le tableau suivant répertorie les métriques disponibles pour le type de ressource Microsoft.CognitiveServices/accounts.
- Toutes les colonnes peuvent ne pas être présentes dans chaque table.
- Certaines colonnes peuvent dépasser la zone d’affichage de la page. Sélectionnez Développer la table pour afficher toutes les colonnes disponibles.
Titres du tableau
- Catégorie : le groupe de métriques ou classification.
- Métrique : nom complet de la métrique tel qu’il apparaît dans le portail Azure.
- Nom dans l’API REST : le nom de la métrique comme appelé dans l’API REST.
- Unité : unité de mesure.
- Agrégation : le type d’agrégation par défaut. Valeurs valides : Moyen (moy), Minimum (min), Maximum (max), Total (somme), Nombre.
- Dimensions - Dimensions disponibles pour la métrique.
- Fragments de temps - Intervalles auxquels la métrique est échantillonnée. Par exemple,
PT1M
indique que la métrique est échantillonnée toutes les minutes,PT30M
toutes les 30 minutes,PT1H
toutes les heures, et ainsi de suite. - Exportation DS : indique si la métrique est exportable vers les journaux Azure Monitor via les paramètres de diagnostic. Pour plus d’informations sur l’exportation des métriques, consultez Créer des paramètres de diagnostic dans Azure Monitor.
Catégorie | Métrique | Nom dans l’API REST | Unité | Agrégation | Dimensions | Fragments de temps | Exportation DS |
---|---|---|---|---|---|---|---|
Occurrences de fonctionnalités | Occurrences des fonctionnalités d’action Nombre de fois où chaque fonctionnalité d’action apparaît. |
ActionFeatureIdOccurrences |
Count | Total (Somme) | FeatureId , , Mode RunId |
PT1M | Oui |
Fonctionnalités par événement | Fonctionnalités d’action par événement Nombre moyen de fonctionnalités d’action par événement. |
ActionFeaturesPerEvent |
Count | Average | Mode , RunId |
PT1M | Oui |
Actions | Occurrences d’action Nombre de fois où chaque action apparaît. |
ActionIdOccurrences |
Count | Total (Somme) | ActionId , , Mode RunId |
PT1M | Oui |
Espaces de noms par événement | Espaces de noms d’action par événement Nombre moyen d’espaces de noms d’action par événement. |
ActionNamespacesPerEvent |
Count | Average | Mode , RunId |
PT1M | Oui |
Actions | Actions par événement Nombre d’actions par événement. |
ActionsPerEvent |
Count | Average | Mode , RunId |
PT1M | Oui |
Azure OpenAI - Utilisation | Jetons actifs Nombre total de jetons moins les jetons mis en cache sur une période donnée. S’applique aux PTU et aux déploiements gérés par PTU. Utilisez cette métrique pour comprendre votre utilisation basée sur TPS ou TPM pour les PTU et la comparer à vos benchmarks pour le TPM ou TPS cible pour vos scénarios. Pour décomposer les demandes d’API, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et ModelVersion. |
ActiveTokens |
Count | Minimum, Maximum, Average, Total (Somme) | Region , , ModelDeploymentName ModelName , ,ModelVersion |
PT1M | Oui |
SpeechServices - Utilisation | Secondes audio transcrites Nombre de secondes transcrites |
AudioSecondsTranscribed |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
SpeechServices - Utilisation | Secondes audio traduites Nombre de secondes traduites |
AudioSecondsTranslated |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
SpeechServices - Utilisation | Secondes d’hébergement du modèle d’avatar Nombre de secondes. |
AvatarModelHostingSeconds |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Azure OpenAI - Requêtes HTTP | Taux de correspondance du cache du jeton d’invite Pourcentage des jetons d’invite atteint le cache, avaiable pour géré par PTU. |
AzureOpenAIContextTokensCacheMatchRate |
Pourcentage | Minimum, Maximum, Moyenne | Region , , ModelDeploymentName ModelName , ,ModelVersion |
PT1M | Non |
Azure OpenAI - Utilisation | Utilisation managée provisionnée % d’utilisation d’un déploiement géré par proxy, calculé en tant que (processeurs ptus consommés/ processeurs déployés) x 100. Lorsque l’utilisation est supérieure ou égale à 100 %, les appels sont limités et le code d’erreur 429 est retourné. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (streaming et demandes de diffusion en continu) |
AzureOpenAIProvisionedManagedUtilization |
Pourcentage | Minimum, Maximum, Moyenne | Region , , StreamType ModelDeploymentName , , ModelName ModelVersion |
PT1M | Non |
Azure OpenAI - Utilisation | Utilisation managée provisionnée V2 % d’utilisation d’un déploiement géré par proxy, calculé en tant que (processeurs ptus consommés/ processeurs déployés) x 100. Lorsque l’utilisation est supérieure ou égale à 100 %, les appels sont limités et le code d’erreur 429 est retourné. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (streaming et demandes de diffusion en continu) |
AzureOpenAIProvisionedManagedUtilizationV2 |
Pourcentage | Minimum, Maximum, Moyenne | Region , , StreamType ModelDeploymentName , , ModelName ModelVersion |
PT1M | Non |
Azure OpenAI - Requêtes HTTP | Demandes Azure OpenAI Nombre d’appels effectués à l’API Azure OpenAI sur une période donnée. S’applique aux déploiements PTU, gérés par PTU et avec paiement à l’utilisation. Pour décomposer les demandes d’API, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion, StatusCode (réussite, clienterrors, erreurs de serveur), StreamType (streaming et demandes de non-diffusion en continu) et opération. |
AzureOpenAIRequests |
Count | Total (Somme) | ApiName , OperationName , , StreamType Region , ModelDeploymentName , ModelName , , ModelVersion ,StatusCode |
PT1M | Oui |
Azure OpenAI - Requêtes HTTP | Temps de réponse Mesure de latence recommandée (réactivité) pour les requêtes de diffusion en continu. S’applique aux PTU et aux déploiements gérés par PTU. Calculé comme temps nécessaire pour que la première réponse apparaisse après qu’un utilisateur envoie une invite, comme mesuré par la passerelle API. Ce nombre augmente à mesure que la taille de l’invite augmente et/ou que la taille du cache atteinte diminue. Pour répartir le temps de réponse, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et ModelVersion. Remarque : cette métrique est une approximation, car la latence mesurée dépend fortement de plusieurs facteurs, notamment les appels simultanés et le modèle de charge de travail global. En outre, elle ne tient pas compte d’une latence côté client qui peut exister entre votre client et le point de terminaison de l’API. Reportez-vous à votre propre journalisation pour un suivi de latence optimal. |
AzureOpenAITimeToResponse |
Millisecondes | Minimum, Maximum, Moyenne | ApiName , OperationName , , StreamType Region , ModelDeploymentName , ModelName , , ModelVersion ,StatusCode |
PT1M | Oui |
Slots | Estimation globale de l’estimateur de référence Estimation de la récompense de référence globale. |
BaselineEstimatorOverallReward |
Count | Average | Mode , RunId |
PT1M | Oui |
Slots | Récompense de l’emplacement estimateur de référence Estimation de la récompense de référence par emplacement. |
BaselineEstimatorSlotReward |
Count | Average | SlotId , , SlotIndex Mode , ,RunId |
PT1M | Oui |
Slots | Récompense globale de l’estimateur aléatoire de référence Estimation de la récompense de référence aléatoire globale. |
BaselineRandomEstimatorOverallReward |
Count | Average | Mode , RunId |
PT1M | Oui |
Slots | Récompense de l’estimateur aléatoire de référence Estimation de la récompense aléatoire de référence par emplacement. |
BaselineRandomEstimatorSlotReward |
Count | Average | SlotId , , SlotIndex Mode , ,RunId |
PT1M | Oui |
Estimations | Nombre d’événements aléatoires planifiés Estimation du nombre d’événements aléatoires de référence. |
BaselineRandomEventCount |
Count | Total (Somme) | Mode , RunId |
PT1M | Oui |
Estimations | Récompense aléatoire de référence Estimation de la récompense aléatoire de référence. |
BaselineRandomReward |
Count | Total (Somme) | Mode , RunId |
PT1M | Oui |
Cognitive Services - Requêtes HTTP | Appels bloqués Nombre d’appels ayant dépassé la limite de débit ou de quota. N’utilisez pas le service Azure OpenAI. |
BlockedCalls |
Count | Total (Somme) | ApiName , , OperationName Region , ,RatelimitKey |
PT1M | Oui |
Utilisation | Nombre d’inférences Nombre d’inférences de Carnegie Frontdoor Service |
CarnegieInferenceCount |
Count | Total (Somme) | Region , , Modality , Language Category , , SeverityLevel UseCustomList |
PT1M | Oui |
Utilisation | Caractères entraînés (déconseillés) Nombre total de caractères formés. |
CharactersTrained |
Count | Total (Somme) | ApiName , , OperationName Region |
PT1M | Oui |
Utilisation | Caractères traduits (déconseillés) Nombre total de caractères dans la requête de texte entrante. |
CharactersTranslated |
Count | Total (Somme) | ApiName , , OperationName Region |
PT1M | Oui |
Cognitive Services - Requêtes HTTP | Erreurs du client Nombre d’appels avec erreur côté client (code de réponse HTTP : 4xx). N’utilisez pas le service Azure OpenAI. |
ClientErrors |
Count | Total (Somme) | ApiName , , OperationName Region , ,RatelimitKey |
PT1M | Oui |
Utilisation | transactions Vision par ordinateur Nombre de transactions Vision par ordinateur |
ComputerVisionTransactions |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
ContentSafety - Utilisation | Nombre d’appels pour la modération d’image Nombre d’appels pour la modération d’images. |
ContentSafetyImageAnalyzeRequestCount |
Count | Total (Somme) | ApiVersion |
PT1M | Oui |
ContentSafety - Utilisation | Nombre d’appels pour la modération du texte Nombre d’appels pour la modération de texte. |
ContentSafetyTextAnalyzeRequestCount |
Count | Total (Somme) | ApiVersion |
PT1M | Oui |
Occurrences de fonctionnalités | Occurrences de fonctionnalités de contexte Nombre de fois où chaque fonctionnalité de contexte apparaît. |
ContextFeatureIdOccurrences |
Count | Total (Somme) | FeatureId , , Mode RunId |
PT1M | Oui |
Fonctionnalités par événement | Fonctionnalités de contexte par événement Nombre de fonctionnalités de contexte par événement. |
ContextFeaturesPerEvent |
Count | Average | Mode , RunId |
PT1M | Oui |
Espaces de noms par événement | Espaces de noms de contexte par événement Nombre d’espaces de noms de contexte par événement. |
ContextNamespacesPerEvent |
Count | Average | Mode , RunId |
PT1M | Oui |
Utilisation | Temps d’entraînement Custom Vision Durée d’entraînement de Custom Vision |
CustomVisionTrainingTime |
Secondes | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Custom Vision Transactions Nombre de transactions de prédiction Custom Vision |
CustomVisionTransactions |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Cognitive Services - Requêtes HTTP | Données entrantes Taille des données entrantes en octets. N’utilisez pas le service Azure OpenAI. |
DataIn |
Octets | Total (Somme) | ApiName , , OperationName Region |
PT1M | Oui |
Cognitive Services - Requêtes HTTP | Données sortantes Taille des données sortantes en octets. N’utilisez pas le service Azure OpenAI. |
DataOut |
Octets | Total (Somme) | ApiName , , OperationName Region |
PT1M | Oui |
Utilisation | Caractères de document traduits Nombre de caractères dans la demande de traduction de documentation. |
DocumentCharactersTranslated |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Caractères personnalisés de document traduits Nombre de caractères dans la demande de traduction de documentation personnalisé. |
DocumentCustomCharactersTranslated |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Images visage entraînées Nombre d’images entraînées. 1 000 images entraînées par transaction. |
FaceImagesTrained |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Visages stockés Nombre de visages stockés, calculé au prorata du taux journalier. Le nombre de visages stockés est indiqué quotidiennement. |
FacesStored |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Transactions visage Nombre d’appels d’API effectués au service Visage |
FaceTransactions |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
FeatureCardinality | Cardinalité des caractéristiques par action Cardinalité des caractéristiques basée sur l’action. |
FeatureCardinality_Action |
Count | Average | FeatureId , , Mode RunId |
PT1M | Oui |
FeatureCardinality | Cardinalité des caractéristiques par contexte Cardinalité des caractéristiques basée sur le contexte. |
FeatureCardinality_Context |
Count | Average | FeatureId , , Mode RunId |
PT1M | Oui |
FeatureCardinality | Cardinalité des fonctionnalités par emplacement Cardinalité des caractéristiques basée sur l’emplacement. |
FeatureCardinality_Slot |
Count | Average | FeatureId , , Mode RunId |
PT1M | Oui |
Azure OpenAI - Utilisation | Heures de formation FineTuned traitées Nombre d’heures de formation traitées sur un modèle FineTuned OpenAI |
FineTunedTrainingHours |
Count | Total (Somme) | ApiName , , ModelDeploymentName FeatureName , , UsageChannel Region |
PT1M | Oui |
Azure OpenAI - Utilisation | Jetons d’achèvement générés Nombre de jetons générés (sortie) à partir d’un modèle OpenAI. S’applique aux déploiements PTU, gérés par PTU et avec paiement à l’utilisation. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName et ModelName. |
GeneratedTokens |
Count | Total (Somme) | ApiName , , ModelDeploymentName , UsageChannel FeatureName , , Region ModelVersion |
PT1M | Oui |
Utilisation | Images stockées Nombre d’images Custom Vision stockées. |
ImagesStored |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Cognitive Services - Requêtes HTTP | Latence Latence en millisecondes. N’utilisez pas le service Azure OpenAI. |
Latency |
Millisecondes | Average | ApiName , , OperationName Region , ,RatelimitKey |
PT1M | Oui |
Utilisation | Événements appris Nombre d’événements appris. |
LearnedEvents |
Count | Total (Somme) | IsMatchBaseline , , Mode RunId |
PT1M | Oui |
Utilisation | Demandes vocales LUIS Nombre de demandes de compréhension de conversion de sortie orale en intention LUIS |
LUISSpeechRequests |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Demandes de texte LUIS Nombre de demandes de texte LUIS |
LUISTextRequests |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Récompenses mises en correspondance Nombre de récompenses en correspondance. |
MatchedRewards |
Count | Total (Somme) | Mode , RunId |
PT1M | Oui |
Utilisation | Événements non activés Nombre d’événements ignorés. |
NonActivatedEvents |
Count | Total (Somme) | Mode , RunId |
PT1M | Oui |
Slots | Emplacements Nombre d’emplacements par événement. |
NumberOfSlots |
Count | Average | Mode , RunId |
PT1M | Oui |
SpeechServices - Utilisation | Nombre de profils d’orateur Nombre de profils d’orateur inscrits. Au prorata horaire. |
NumberofSpeakerProfiles |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Récompenses observées Nombre de récompenses observées. |
ObservedRewards |
Count | Total (Somme) | Mode , RunId |
PT1M | Oui |
Utilisation | Caractères de synchronisation de documents traduits Nombre de caractères dans la requête de traduction de documents (synchrone). |
OneDocumentCharactersTranslated |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Slots | Estimation globale de l’estimateur en ligne Estimation de la récompense en ligne globale. |
OnlineEstimatorOverallReward |
Count | Average | Mode , RunId |
PT1M | Oui |
Slots | Récompense de l’emplacement estimateur en ligne Estimation de la récompense en ligne par emplacement. |
OnlineEstimatorSlotReward |
Count | Average | SlotId , , SlotIndex Mode , ,RunId |
PT1M | Oui |
Estimations | Nombre d’événements en ligne Estimation du nombre d’événements en ligne. |
OnlineEventCount |
Count | Total (Somme) | Mode , RunId |
PT1M | Oui |
Estimations | Récompense en ligne Estimation de la récompense en ligne. |
OnlineReward |
Count | Total (Somme) | Mode , RunId |
PT1M | Oui |
Utilisation | Caractères traités Nombre de caractères traités par le Lecteur immersif. |
ProcessedCharacters |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Enregistrements de texte d’intégrité traités Nombre d’enregistrements texte d’intégrité traités |
ProcessedHealthTextRecords |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Images traitées Nombre d’images traitées |
ProcessedImages |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Pages traitées Nombre de pages traitées |
ProcessedPages |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Azure OpenAI - Utilisation | Jetons d’invite traités Nombre de jetons d’invite traités (entrée) sur un modèle OpenAI. S’applique aux déploiements PTU, gérés par PTU et avec paiement à l’utilisation. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName et ModelName. |
ProcessedPromptTokens |
Count | Total (Somme) | ApiName , , ModelDeploymentName , UsageChannel FeatureName , , Region ModelVersion |
PT1M | Oui |
Utilisation | Enregistrements de texte traités Nombre d’enregistrements texte. |
ProcessedTextRecords |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Enregistrements de texte qaïa Nombre d’enregistrements texte traités |
QuestionAnsweringTextRecords |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
ContentSafety - Risques et sécurité | Nombre d’utilisateurs potentiellement abusifs Nombre d’utilisateurs potentiellement abusifs détectés sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement par la dimension suivante : ModelDeploymentName. |
RAIAbusiveUsersCount |
Count | Total (Somme) | Region , ModelDeploymentName |
PT1M | Oui |
ContentSafety - Risques et sécurité | Volume dangereux détecté Nombre d’appels effectués à l’API Azure OpenAI et détectés comme dangereux (modèle de bloc et mode annoté) par le filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et TextType. |
RAIHarmfulRequests |
Count | Total (Somme) | Region , ModelDeploymentName , , ModelVersion ModelName , ApiName , TextType , , Category ,Severity |
PT1M | Oui |
ContentSafety - Risques et sécurité | Volume bloqué Nombre d’appels effectués à l’API Azure OpenAI et rejetés par le filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et TextType. |
RAIRejectedRequests |
Count | Total (Somme) | Region , ModelDeploymentName , , ModelVersion ModelName , ApiName , , TextType ,Category |
PT1M | Oui |
ContentSafety - Risques et sécurité | Événement du système de sécurité Événement système pour la surveillance des risques et de la sécurité. Vous pouvez ajouter un filtre ou appliquer un fractionnement par la dimension suivante : EventType. |
RAISystemEvent |
Count | Average | Region , EventType |
PT1M | Oui |
ContentSafety - Risques et sécurité | Volume total envoyé pour vérification de sécurité Nombre d’appels effectués à l’API Azure OpenAI et détectés par le filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName. |
RAITotalRequests |
Count | Total (Somme) | Region , , ModelDeploymentName ModelName , , ModelVersion ApiName |
PT1M | Oui |
Cognitive Services - Requêtes HTTP | Limite de débit Valeur ratelimit actuelle de la clé ratelimit. N’utilisez pas le service Azure OpenAI. |
Ratelimit |
Count | Total (Somme) | Region , RatelimitKey |
PT1M | Oui |
Des récompenses | Récompense moyenne par événement Récompense moyenne par événement. |
Reward |
Count | Average | BaselineAction , , ChosenActionId , NonDefaultReward MatchesBaseline , , Mode RunId |
PT1M | Oui |
Cognitive Services - Requêtes HTTP | Erreurs de serveur Nombre d’appels avec erreur interne du service (code de réponse HTTP : 5xx). N’utilisez pas le service Azure OpenAI. |
ServerErrors |
Count | Total (Somme) | ApiName , , OperationName Region , ,RatelimitKey |
PT1M | Oui |
Occurrences de fonctionnalités | Occurrences des fonctionnalités d’emplacement Nombre de fois où chaque fonctionnalité d’emplacement apparaît. |
SlotFeatureIdOccurrences |
Count | Total (Somme) | FeatureId , , Mode RunId |
PT1M | Oui |
Fonctionnalités par événement | Fonctionnalités d’emplacement par événement Nombre moyen de fonctionnalités d’emplacement par événement. |
SlotFeaturesPerEvent |
Count | Average | Mode , RunId |
PT1M | Oui |
Slots | Occurrences d’emplacement Nombre de fois où chaque emplacement apparaît. |
SlotIdOccurrences |
Count | Total (Somme) | SlotId , , SlotIndex Mode , ,RunId |
PT1M | Oui |
Espaces de noms par événement | Espaces de noms d’emplacement par événement Nombre moyen d’espaces de noms d’emplacement par événement. |
SlotNamespacesPerEvent |
Count | Average | Mode , RunId |
PT1M | Oui |
Des récompenses | Récompense de l’emplacement Récompense par emplacement. |
SlotReward |
Count | Average | BaselineActionId , ChosenActionId , , NonDefaultReward MatchesBaseline , SlotId , SlotIndex , , Mode ,RunId |
PT1M | Oui |
SpeechServices - Utilisation | Transactions de reconnaissance de l’orateur Nombre de transactions de reconnaissance de l’orateur |
SpeakerRecognitionTransactions |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
SpeechServices - Utilisation | Heures d’hébergement du modèle Speech Nombre d’heures d’hébergement du modèle vocal |
SpeechModelHostingHours |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Durée de session Speech (déconseillée) Durée totale de la session vocale en secondes. |
SpeechSessionDuration |
Secondes | Total (Somme) | ApiName , , OperationName Region |
PT1M | Oui |
Cognitive Services - Requêtes HTTP | Appels réussis Nombre d’appels réussis. N’utilisez pas le service Azure OpenAI. |
SuccessfulCalls |
Count | Total (Somme) | ApiName , , OperationName Region , ,RatelimitKey |
PT1M | Oui |
Cognitive Services - SLI | AvailabilityRate Pourcentage de disponibilité avec le calcul suivant : (Nombre total d’appels - Erreurs de serveur)/Nombre total d’appels. Les erreurs de serveur incluent les réponses HTTP >=500. N’utilisez pas le service Azure OpenAI. |
SuccessRate |
Pourcentage | Minimum, Maximum, Moyenne | ApiName , , OperationName Region , ,RatelimitKey |
PT1M | Non |
SpeechServices - Utilisation | Caractères synthétisés Nombre de caractères. |
SynthesizedCharacters |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Caractères de texte traduits Nombre de caractères dans la demande de traduction de texte entrante. |
TextCharactersTranslated |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Caractères personnalisés de texte traduits Nombre de caractères dans la demande de traduction de texte personnalisée entrante. |
TextCustomCharactersTranslated |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Utilisation | Caractères entraînés par le texte Nombre de caractères entraînés à l’aide de la traduction de texte. |
TextTrainedCharacters |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Azure OpenAI - Utilisation | Jetons d’inférence traités Nombre de jetons d’inférence traités sur un modèle OpenAI. Calculé en tant que jetons d’invite (entrée) plus jetons générés (sortie). S’applique aux déploiements PTU, gérés par PTU et avec paiement à l’utilisation. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName et ModelName. |
TokenTransaction |
Count | Total (Somme) | ApiName , , ModelDeploymentName , UsageChannel FeatureName , , Region ModelVersion |
PT1M | Oui |
Cognitive Services - Requêtes HTTP | Nombre total d’appels Nombre total d’appels. N’utilisez pas le service Azure OpenAI. |
TotalCalls |
Count | Total (Somme) | ApiName , , OperationName Region , ,RatelimitKey |
PT1M | Oui |
Cognitive Services - Requêtes HTTP | Nombre total d’erreurs Nombre total d’appels avec réponse d’erreur (code de réponse HTTP : 4xx ou 5xx). N’utilisez pas le service Azure OpenAI. |
TotalErrors |
Count | Total (Somme) | ApiName , , OperationName Region , ,RatelimitKey |
PT1M | Oui |
Utilisation | Nombre total d'événements Nombre d’événements. |
TotalEvents |
Count | Total (Somme) | Mode , RunId |
PT1M | Oui |
Cognitive Services - Requêtes HTTP | Nombre total d’appels de jetons Nombre total d’appels de jeton. |
TotalTokenCalls |
Count | Total (Somme) | ApiName , , OperationName Region |
PT1M | Oui |
Utilisation | Total des transactions (déconseillées) Nombre total de transactions. |
TotalTransactions |
Count | Total (Somme) | <aucune> | PT1M | Oui |
Estimations | Nombre d’événements de référence utilisateur Estimation du nombre d’événements de référence définis par l’utilisateur. |
UserBaselineEventCount |
Count | Total (Somme) | Mode , RunId |
PT1M | Oui |
Estimations | Récompense de référence de l’utilisateur Estimation de la récompense de référence définie par l’utilisateur. |
UserBaselineReward |
Count | Total (Somme) | Mode , RunId |
PT1M | Oui |
SpeechServices - Utilisation | Secondes de vidéo synthétisées Nombre de secondes synthétisées |
VideoSecondsSynthesized |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
SpeechServices - Utilisation | Heures d’hébergement du modèle vocal Nombre d’heures. |
VoiceModelHostingHours |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
SpeechServices - Utilisation | Minutes d’entraînement du modèle vocal Nombre de minutes. |
VoiceModelTrainingMinutes |
Count | Total (Somme) | ApiName , , FeatureName UsageChannel , ,Region |
PT1M | Oui |
Dimensions de métrique
Pour plus d’informations sur les dimensions de métrique, consultez Métriques multidimensionnelles.
Ce service a les dimensions suivantes associées à ses métriques.
- ApiName
- FeatureName
- ModelDeploymentName
- ModelName
- ModelVersion
- NomOpération
- Région
- StatusCode
- StreamType
- UsageChannel
Journaux d’activité de ressources
Cette section répertorie les types de journaux d’activité de ressources que vous pouvez collecter pour ce service. La section extrait la liste de tous les types de catégorie de journaux d’activité de ressources pris en charge dans Azure Monitor.
Journaux de ressources pris en charge pour Microsoft.CognitiveServices/accounts
Category | Nom complet de la catégorie | Table de journal | Prend en charge le plan de journal de base | Prend en charge la transformation de la durée d’ingestion | Exemples de requêtes | Coûts d’exportation |
---|---|---|---|---|---|---|
Audit |
Journaux d’audit | AzureDiagnostics Journaux d’activité de plusieurs ressources Azure. |
Non | Non | Non | |
RequestResponse |
Journaux d’activité des requêtes et des réponses | AzureDiagnostics Journaux d’activité de plusieurs ressources Azure. |
Non | Non | Non | |
Trace |
Journaux de suivi | AzureDiagnostics Journaux d’activité de plusieurs ressources Azure. |
Non | Non | Non |
Tables Azure Monitor Logs
Cette section répertorie les tables de journaux Azure Monitor pertinentes pour ce service, disponibles pour une requête par l’analytique des journaux d’activité à l’aide de requêtes Kusto. Les tables contiennent les données du journal des ressources et éventuellement d’autres données en fonction de ce qui est collecté et acheminé vers elles.
Azure OpenAI microsoft.cognitiveservices/accounts
Journal d’activité
La table liée répertorie les opérations qui peuvent être enregistrées dans le journal d’activité de ce service. Ces opérations constituent un sous-ensemble de toutes les opérations possibles du fournisseur de ressources dans le journal d’activité.
Pour plus d’informations sur le schéma des entrées du journal d’activité, consultez Schéma du journal d’activité.
Contenu connexe
- Consultez Monitor Azure OpenAI pour obtenir une description de la surveillance d’Azure OpenAI .
- Pour plus d’informations sur la supervision des ressources Azure, consultez Superviser des ressources Azure avec Azure Monitor.