Azure OpenAI Überwachungsdatenreferenz
Dieser Artikel enthält alle Referenzinformationen zur Überwachung dieses Dienstes.
Details zu den Daten, die Sie für den Azure OpenAI-Dienst sammeln können, finden Sie unter "Überwachen von Azure OpenAI " und deren Verwendung.
Metriken
In diesem Abschnitt werden alle automatisch erfassten Plattformmetriken für diesen Dienst aufgeführt. Diese Metriken sind auch Teil der globalen Liste aller in Azure Monitor unterstützten Plattformmetriken.
Informationen zur Aufbewahrung von Metriken finden Sie unter Überblick über Metriken in Azure Monitor.
Unterstützte Metriken für Microsoft.CognitiveServices/Accounts
Hier sind die wichtigsten Metriken, die wir für Azure OpenAI überwachen sollten. Später in diesem Artikel finden Sie eine längere Liste aller verfügbaren Azure AI-Dienstmetriken, die weitere Details zu Metriken in dieser kürzeren Liste enthalten.
Azure OpenAI-Anforderungen
Aktive Token
Generierte Abschlusstoken
Verarbeitete FineTuned-Trainingsstunden
Verarbeitete Rückschlusstoken
Verarbeitete Eingabeaufforderungstoken
Bereitgestellte verwaltete Auslastung V2
Übereinstimmungsrate für den Eingabeaufforderungstokencache
Zeit für Antwort
Zeit zwischen Token
Zeit bis zum letzten Byte
Normalisierte Zeit bis zum ersten Byte
Sie können auch Inhaltssicherheitsmetriken überwachen, die von anderen Azure AI-Diensten verwendet werden.
- Blockiertes Volume
- Schädliches Volume erkannt
- Potenzielle Missbräuchliche Benutzeranzahl
- Safety System-Ereignis
- Gesamtvolumen, das zur Sicherheitsüberprüfung gesendet wurde
Hinweis
Die Metrik Provisioned-managed Utilization ist jetzt veraltet und wird nicht mehr empfohlen. Diese Metrik wurde durch die Metrik Provisioned-managed Utilization V2 ersetzt.
Cognitive Services-Metriken weisen die Kategorie Cognitive Services - HTTP-Anforderungen in der folgenden Tabelle auf. Diese Metriken sind Legacymetriken, die allen Azure AI Services-Ressourcen gemeinsam sind. Microsoft empfiehlt nicht mehr, diese Metriken mit Azure OpenAI zu verwenden.
In der folgenden Tabelle sind die Metriken aufgeführt, die für den Ressourcentyp "Microsoft.CognitiveServices/accounts" verfügbar sind.
- Möglicherweise sind nicht alle Spalten in jeder Tabelle vorhanden.
- Einige Spalten können über den Anzeigebereich der Seite hinausgehen. Wählen Sie Tabelle erweitern aus, um alle verfügbaren Spalten anzuzeigen.
Tabellenüberschriften
- Kategorie – Die Metrikgruppe oder -klassifizierung.
- Metrik – Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
- Name in REST-API: Der Metrikname im REST-API
- Einheit – Abrechnungseinheit.
- Aggregation – Der Standard-Aggregationstyp. Gültige Werte: Mittelwert (Avg), Minimum (Min), Maximum (Max), Gesamt (Sum), Anzahl
- Dimensionen - Für die Metrik verfügbare Dimensionen.
- Aggregationsintervall - Intervalle, in denen die Metrik gesampelt wird.
PT1M
bedeutet zum Beispiel, dass die Metrik jede Minute abgerufen wird,PT30M
alle 30 Minuten,PT1H
jede Stunde usw. - DS-Export – Gibt an, ob die Metrik über Diagnose-Einstellungen in Azure Monitor-Protokolle exportiert werden kann. Informationen zum Exportieren von Metriken finden Sie unter Diagnoseeinstellungen in Azure Monitor erstellen.
Kategorie | Metrik | Name in der REST-API | Einheit | Aggregation | Dimensionen | Aggregationsintervalle | DS-Export |
---|---|---|---|---|---|---|---|
Auftreten von Features | Aktionsfeatureinstanzen Gibt an, wie häufig jedes Aktionsfeature ausgeführt wird. |
ActionFeatureIdOccurrences |
Count | Gesamt (Summe) | FeatureId , Mode RunId |
PT1M | Ja |
Features pro Ereignis | Aktionsfeatures pro Ereignis Durchschnittliche Anzahl von Aktionsfeatures pro Ereignis. |
ActionFeaturesPerEvent |
Count | Average | Mode , RunId |
PT1M | Ja |
Aktionen | Auftreten von Aktionen Gibt an, wie häufig jede Aktion ausgeführt wird. |
ActionIdOccurrences |
Count | Gesamt (Summe) | ActionId , Mode RunId |
PT1M | Ja |
Namespaces pro Ereignis | Aktionsnamespaces pro Ereignis Durchschnittliche Anzahl von Aktionsnamespaces pro Ereignis. |
ActionNamespacesPerEvent |
Count | Average | Mode , RunId |
PT1M | Ja |
Aktionen | Aktionen pro Ereignis Anzahl von Aktionen pro Ereignis. |
ActionsPerEvent |
Count | Average | Mode , RunId |
PT1M | Ja |
Azure OpenAI – Verwendung | Aktive Token Gesamtzahl der Token abzüglich der zwischengespeicherten Token über einen bestimmten Zeitraum. Gilt für PTU und PTU-verwaltete Bereitstellungen. Verwenden Sie diese Metrik, um ihre TPS- oder TPM-basierte Auslastung für PTUs zu verstehen und mit Ihren Benchmarks für Ziel-TPS oder -TPM für Ihre Szenarien zu vergleichen. Um API-Anforderungen aufzuschlüsseln, können Sie einen Filter hinzufügen oder die Aufteilung anhand der folgenden Dimensionen anwenden: ModelDeploymentName, ModelName und ModelVersion. |
ActiveTokens |
Count | Minimum, Maximum, Average, Total (Summe) | Region , , ModelDeploymentName ModelName ModelVersion |
PT1M | Ja |
SpeechServices – Verwendung | Audio Sekunden transkribiert Anzahl der transkribierten Sekunden |
AudioSecondsTranscribed |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
SpeechServices – Verwendung | Übersetzte Audio sekunden Anzahl der übersetzten Sekunden |
AudioSecondsTranslated |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
SpeechServices – Verwendung | Hostingsekunden des Avatarmodells Anzahl der Sekunden. |
AvatarModelHostingSeconds |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Azure OpenAI – HTTP-Anforderungen | Übereinstimmungsrate für den Eingabeaufforderungstokencache Der Prozentsatz der Eingabeaufforderungstoken trifft auf den Cache, der für PTU verwaltet werden kann. |
AzureOpenAIContextTokensCacheMatchRate |
Percent | Minimum, Maximum, Mittelwert | Region , , ModelDeploymentName ModelName ModelVersion |
PT1M | No |
Azure OpenAI – Verwendung | Bereitstellungsverwaltete Nutzung Auslastung % für eine provisoned-verwaltete Bereitstellung, berechnet als (PTUs verbraucht / PTUs bereitgestellt) x 100. Wenn die Auslastung größer oder gleich 100 % ist, werden Aufrufe gedrosselt und der Fehlercode 429 zurückgegeben. Um diese Metrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder durch die folgenden Dimensionen aufteilen: ModelDeploymentName, ModelName, ModelVersion und StreamType (Streaming vs Non-Streaming Requests) |
AzureOpenAIProvisionedManagedUtilization |
Percent | Minimum, Maximum, Mittelwert | Region , , StreamType ModelDeploymentName , , ModelName ModelVersion |
PT1M | No |
Azure OpenAI – Verwendung | Bereitgestellte verwaltete Auslastung V2 Auslastung % für eine provisoned-verwaltete Bereitstellung, berechnet als (PTUs verbraucht / PTUs bereitgestellt) x 100. Wenn die Auslastung größer oder gleich 100 % ist, werden Aufrufe gedrosselt und der Fehlercode 429 zurückgegeben. Um diese Metrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder durch die folgenden Dimensionen aufteilen: ModelDeploymentName, ModelName, ModelVersion und StreamType (Streaming vs Non-Streaming Requests) |
AzureOpenAIProvisionedManagedUtilizationV2 |
Percent | Minimum, Maximum, Mittelwert | Region , , StreamType ModelDeploymentName , , ModelName ModelVersion |
PT1M | No |
Azure OpenAI – HTTP-Anforderungen | Azure OpenAI-Anforderungen Anzahl der Aufrufe an die Azure OpenAI-API über einen bestimmten Zeitraum. Gilt für PTU-, PTU-verwaltete und pay-as-you-go-Bereitstellungen. Um API-Anforderungen aufzuschlüsseln, können Sie einen Filter hinzufügen oder die Aufteilung anhand der folgenden Dimensionen anwenden: ModelDeploymentName, ModelName, ModelVersion, StatusCode (erfolgreich, Clientfehler, Serverfehler), StreamType (Streaming vs non-streaming requests) und Operation. |
AzureOpenAIRequests |
Count | Gesamt (Summe) | ApiName , , OperationName Region , StreamType , ModelDeploymentName , ModelName , , ModelVersion StatusCode |
PT1M | Ja |
Azure OpenAI – HTTP-Anforderungen | Zeit für Antwort Empfohlenes Maß für die Latenzzeit (Reaktionszeit) bei Streaming-Anforderungen. Gilt für PTU und PTU-verwaltete Bereitstellungen. Wird berechnet als Zeit, die benötigt wird, bis die erste Antwort erscheint, nachdem ein*e Benutzer*in einen Prompt gesendet hat, wie vom API-Gateway gemessen. Diese Zahl erhöht sich, wenn die Prompt-Größe zunimmt und/oder die Cachetreffergröße abnimmt. Um die Zeit für die Reaktionsmetrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder die Aufteilung durch die folgenden Dimensionen anwenden: ModelDeploymentName, ModelName und ModelVersion. Hinweis: Bei dieser Metrik handelt es sich um einen Näherungswert, da die gemessene Latenz stark von mehreren Faktoren abhängt, einschließlich gleichzeitiger Anrufe und des gesamten Workload-Musters. Darüber hinaus wird keine clientseitige Latenz berücksichtigt, die zwischen Ihrem Client und dem API-Endpunkt bestehen kann. Bitte beachten Sie Ihre eigene Protokollierung für eine optimale Latenzverfolgung. |
AzureOpenAITimeToResponse |
Millisekunden | Minimum, Maximum, Mittelwert | ApiName , , OperationName Region , StreamType , ModelDeploymentName , ModelName , , ModelVersion StatusCode |
PT1M | Ja |
Slots | Baseline Estimator Overall Rewards Gesamtbelohnung für Baseline-Schätzung. |
BaselineEstimatorOverallReward |
Count | Average | Mode , RunId |
PT1M | Ja |
Slots | Baseline Estimator Slot Rewards Baselineschätzung-Belohnung nach Slot. |
BaselineEstimatorSlotReward |
Count | Average | SlotId , , SlotIndex Mode RunId |
PT1M | Ja |
Slots | Geplante zufällige Schätzwert-Gesamtprämie Gesamtbelohnung für Baseline-Zufallsschätzung. |
BaselineRandomEstimatorOverallReward |
Count | Average | Mode , RunId |
PT1M | Ja |
Slots | Baseline Random Estimator Slot Rewards Baseline-Zufallsschätzung-Belohnung nach Slot. |
BaselineRandomEstimatorSlotReward |
Count | Average | SlotId , , SlotIndex Mode RunId |
PT1M | Ja |
Schätzungen | Geplante Zufallsereignisanzahl Geschätzte Anzahl der zufälligen Baselineereignisse. |
BaselineRandomEventCount |
Count | Gesamt (Summe) | Mode , RunId |
PT1M | Ja |
Schätzungen | Geplante zufällige Belohnung Schätzung der zufälligen Baselinebelohnung. |
BaselineRandomReward |
Count | Gesamt (Summe) | Mode , RunId |
PT1M | Ja |
Cognitive Services – HTTP-Anforderungen | Blockierte Anrufe Anzahl von Aufrufen, die das Raten- oder Kontingentlimit überschritten haben Verwenden Sie nicht für den Azure OpenAI-Dienst. |
BlockedCalls |
Count | Gesamt (Summe) | ApiName , , OperationName Region RatelimitKey |
PT1M | Ja |
Verbrauch | Rückschlussanzahl Rückschlussanzahl des Carnegie Frontdoor-Diensts |
CarnegieInferenceCount |
Count | Gesamt (Summe) | Region , , Modality Category , Language , , SeverityLevel UseCustomList |
PT1M | Ja |
Verbrauch | Trainierte Zeichen (veraltet) Gesamtzahl trainierter Zeichen |
CharactersTrained |
Count | Gesamt (Summe) | ApiName , OperationName Region |
PT1M | Ja |
Verbrauch | Übersetzte Zeichen (veraltet) Gesamtanzahl von Zeichen in einer eingehenden Textanforderung |
CharactersTranslated |
Count | Gesamt (Summe) | ApiName , OperationName Region |
PT1M | Ja |
Cognitive Services – HTTP-Anforderungen | Clientfehler Anzahl von Aufrufen mit Fehler auf Clientseite (HTTP-Antwortcode 4xx) Verwenden Sie nicht für den Azure OpenAI-Dienst. |
ClientErrors |
Count | Gesamt (Summe) | ApiName , , OperationName Region RatelimitKey |
PT1M | Ja |
Verbrauch | maschinelles Sehen Transaktionen Anzahl der Transaktionen für maschinelles Sehen |
ComputerVisionTransactions |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
ContentSafety – Nutzung | Anrufanzahl für Bildmoderation Anzahl der Aufrufe für die Bildmoderation. |
ContentSafetyImageAnalyzeRequestCount |
Count | Gesamt (Summe) | ApiVersion |
PT1M | Ja |
ContentSafety – Nutzung | Anrufanzahl für Textmoderation Anzahl der Aufrufe für die Textmoderation. |
ContentSafetyTextAnalyzeRequestCount |
Count | Gesamt (Summe) | ApiVersion |
PT1M | Ja |
Auftreten von Features | Vorkommen des Kontextfeatures Gibt an, wie häufig jedes Kontextfeature ausgeführt wird. |
ContextFeatureIdOccurrences |
Count | Gesamt (Summe) | FeatureId , Mode RunId |
PT1M | Ja |
Features pro Ereignis | Kontextfeatures pro Ereignis Anzahl der Kontextfeatures pro Ereignis. |
ContextFeaturesPerEvent |
Count | Average | Mode , RunId |
PT1M | Ja |
Namespaces pro Ereignis | Kontextnamespaces pro Ereignis Anzahl der Kontextnamespaces pro Ereignis. |
ContextNamespacesPerEvent |
Count | Average | Mode , RunId |
PT1M | Ja |
Verbrauch | Benutzerdefinierte Vision-Schulungszeit Trainingszeit für Custom Vision |
CustomVisionTrainingTime |
Sekunden | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Benutzerdefinierte Vision-Transaktionen Anzahl der Vorhersagetransaktionen für Custom Vision |
CustomVisionTransactions |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Cognitive Services – HTTP-Anforderungen | Eingehende Daten Menge eingehender Daten in Byte Verwenden Sie nicht für den Azure OpenAI-Dienst. |
DataIn |
Byte | Gesamt (Summe) | ApiName , OperationName Region |
PT1M | Ja |
Cognitive Services – HTTP-Anforderungen | Ausgehende Daten Menge ausgehender Daten in Byte Verwenden Sie nicht für den Azure OpenAI-Dienst. |
DataOut |
Byte | Gesamt (Summe) | ApiName , OperationName Region |
PT1M | Ja |
Verbrauch | Übersetzte Dokumentzeichen Anzahl der Zeichen in einer Dokumentübersetzungsanforderung |
DocumentCharactersTranslated |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Übersetzte benutzerdefinierte Zeichen für Dokumente Anzahl der Zeichen in einer Anforderung zur benutzerdefinierten Dokumentübersetzung |
DocumentCustomCharactersTranslated |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Gesichtsbilder trainiert Anzahl der trainierten Bilder; 1\.000 Bilder pro Transaktion trainiert |
FaceImagesTrained |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Gespeicherte Gesichter Anzahl der gespeicherten Gesichter, wird täglich anteilig berechnet; die Anzahl der gespeicherten Gesichter wird täglich gemeldet |
FacesStored |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Transaktionen im Gesicht Anzahl der API-Aufrufe an den Gesichtserkennungsdienst |
FaceTransactions |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
FeatureCardinalität | Featurekardinalität nach Aktion Featurekardinalität basierend auf der Aktion. |
FeatureCardinality_Action |
Count | Average | FeatureId , Mode RunId |
PT1M | Ja |
FeatureCardinalität | Featurekardinalität nach Kontext Featurekardinalität basierend auf dem Kontext. |
FeatureCardinality_Context |
Count | Average | FeatureId , Mode RunId |
PT1M | Ja |
FeatureCardinalität | Feature-Kardinalität nach Slot Featurekardinalität basierend auf dem Slot. |
FeatureCardinality_Slot |
Count | Average | FeatureId , Mode RunId |
PT1M | Ja |
Azure OpenAI – Verwendung | Verarbeitete Feinabstimmungsschulungsstunden Anzahl der in einem OpenAI FineTuned-Modell verarbeiteten Trainingsstunden |
FineTunedTrainingHours |
Count | Gesamt (Summe) | ApiName , , ModelDeploymentName FeatureName , , UsageChannel Region |
PT1M | Ja |
Azure OpenAI – Verwendung | Generierte Abschlusstoken Anzahl der von einem OpenAI-Modell generierten Token (Ausgabe). Gilt für PTU-, PTU-verwaltete und pay-as-you-go-Bereitstellungen. Um diese Metrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder durch die folgenden Dimensionen aufteilen: ModelDeploymentName und ModelName. |
GeneratedTokens |
Count | Gesamt (Summe) | ApiName , , ModelDeploymentName FeatureName , UsageChannel , , Region ModelVersion |
PT1M | Ja |
Verbrauch | Gespeicherte Bilder Anzahl der in Custom Vision gespeicherten Bilder |
ImagesStored |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Cognitive Services – HTTP-Anforderungen | Latenz Latenz in Millisekunden Verwenden Sie nicht für den Azure OpenAI-Dienst. |
Latency |
Millisekunden | Average | ApiName , , OperationName Region RatelimitKey |
PT1M | Ja |
Verbrauch | Gelernte Ereignisse Anzahl erfasster Ereignisse. |
LearnedEvents |
Count | Gesamt (Summe) | IsMatchBaseline , Mode RunId |
PT1M | Ja |
Verbrauch | LUIS-Sprachanforderungen Anzahl der LUIS-Anforderungen zum Verstehen der Sprach-Absichts-Umsetzung |
LUISSpeechRequests |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | LUIS-Textanforderungen Anzahl der LUIS-Textanforderungen |
LUISTextRequests |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Abgeglichene Prämien Anzahl übereinstimmender Belohnungen. |
MatchedRewards |
Count | Gesamt (Summe) | Mode , RunId |
PT1M | Ja |
Verbrauch | Nicht aktivierte Ereignisse Anzahl von übersprungenen Ereignissen. |
NonActivatedEvents |
Count | Gesamt (Summe) | Mode , RunId |
PT1M | Ja |
Slots | Slots Anzahl der Slots pro Ereignis. |
NumberOfSlots |
Count | Average | Mode , RunId |
PT1M | Ja |
SpeechServices – Verwendung | Anzahl der Sprecherprofile Anzahl der registrierten Sprecherprofile; wird anteilig stündlich berechnet |
NumberofSpeakerProfiles |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Beobachtete Belohnungen Anzahl beobachteter Belohnungen. |
ObservedRewards |
Count | Gesamt (Summe) | Mode , RunId |
PT1M | Ja |
Verbrauch | Übersetzte Dokumentsynchronisierungszeichen Anzahl der Zeichen in dokumentübersetzungsanforderung (synchron). |
OneDocumentCharactersTranslated |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Slots | Online-Schätzer Gesamtprämie Gesamtbelohnung für Online-Schätzung. |
OnlineEstimatorOverallReward |
Count | Average | Mode , RunId |
PT1M | Ja |
Slots | Online-Schätzplatz-Belohnung Onlineschätzung-Belohnung nach Slot. |
OnlineEstimatorSlotReward |
Count | Average | SlotId , , SlotIndex Mode RunId |
PT1M | Ja |
Schätzungen | Onlineereignisanzahl Geschätzte Anzahl der Onlineereignisse. |
OnlineEventCount |
Count | Gesamt (Summe) | Mode , RunId |
PT1M | Ja |
Schätzungen | Online-Belohnung Schätzung für Onlinebelohnung. |
OnlineReward |
Count | Gesamt (Summe) | Mode , RunId |
PT1M | Ja |
Verbrauch | Verarbeitete Zeichen Anzahl der vom Immersive Reader verarbeiteten Zeichen |
ProcessedCharacters |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Verarbeitete Integritätstextdatensätze Anzahl der verarbeiteten Textdatensätze zur Integrität |
ProcessedHealthTextRecords |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Verarbeitete Bilder Anzahl der verarbeiteten Bilder |
ProcessedImages |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Verarbeitete Seiten Anzahl der verarbeiteten Seiten |
ProcessedPages |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Azure OpenAI – Verwendung | Verarbeitete Aufforderungstoken Anzahl der in einem OpenAI-Modell verarbeiteten Eingabeaufforderungstoken (Eingabe). Gilt für PTU-, PTU-verwaltete und pay-as-you-go-Bereitstellungen. Um diese Metrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder durch die folgenden Dimensionen aufteilen: ModelDeploymentName und ModelName. |
ProcessedPromptTokens |
Count | Gesamt (Summe) | ApiName , , ModelDeploymentName FeatureName , UsageChannel , , Region ModelVersion |
PT1M | Ja |
Verbrauch | Verarbeitete Textdatensätze Anzahl von Textdatensätzen. |
ProcessedTextRecords |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | QA-Texteinträge Anzahl der verarbeiteten Textdatensätze |
QuestionAnsweringTextRecords |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
ContentSafety – Risiken& Sicherheit | Anzahl potenziell missbräuchlicher Benutzer Die Anzahl der potenziell missbräuchlichen Benutzer, die über einen bestimmten Zeitraum erkannt wurden. Sie können einen Filter hinzufügen oder die Aufteilung durch die folgende Dimension anwenden: ModelDeploymentName. |
RAIAbusiveUsersCount |
Count | Gesamt (Summe) | Region , ModelDeploymentName |
PT1M | Ja |
ContentSafety – Risiken& Sicherheit | Schädliches Volume erkannt Anzahl der Aufrufe an die Azure OpenAI-API und erkannt als schädlich (sowohl Blockmodell als auch Kommentarmodus) durch Inhaltsfilter, der über einen bestimmten Zeitraum angewendet wird. Sie können einen Filter hinzufügen oder die Aufteilung durch die folgenden Dimensionen anwenden: ModelDeploymentName, ModelName und TextType. |
RAIHarmfulRequests |
Count | Gesamt (Summe) | Region , , ModelDeploymentName ModelName , ModelVersion , ApiName , TextType , , Category Severity |
PT1M | Ja |
ContentSafety – Risiken& Sicherheit | Blockiertes Volume Anzahl der Aufrufe an die Azure OpenAI-API und abgelehnt durch Inhaltsfilter, der über einen bestimmten Zeitraum angewendet wurde. Sie können einen Filter hinzufügen oder die Aufteilung durch die folgenden Dimensionen anwenden: ModelDeploymentName, ModelName und TextType. |
RAIRejectedRequests |
Count | Gesamt (Summe) | Region , , ModelDeploymentName ModelName , ModelVersion , ApiName , , TextType Category |
PT1M | Ja |
ContentSafety – Risiken& Sicherheit | Safety System-Ereignis Systemereignis für Risiko- und Sicherheitsüberwachung. Sie können einen Filter hinzufügen oder eine Aufteilung anwenden, indem Sie die folgende Dimension verwenden: EventType. |
RAISystemEvent |
Count | Average | Region , EventType |
PT1M | Ja |
ContentSafety – Risiken& Sicherheit | Gesamtvolumen, das zur Sicherheitsüberprüfung gesendet wurde Anzahl der Aufrufe an die Azure OpenAI-API und erkannt durch Inhaltsfilter, der über einen bestimmten Zeitraum angewendet wird. Sie können einen Filter hinzufügen oder die Aufteilung durch die folgenden Dimensionen anwenden: ModelDeploymentName, ModelName. |
RAITotalRequests |
Count | Gesamt (Summe) | Region , , ModelDeploymentName ModelName , , ModelVersion ApiName |
PT1M | Ja |
Cognitive Services – HTTP-Anforderungen | Zinslimit Die aktuelle Ratenbegrenzung des Ratelimit-Schlüssels. Verwenden Sie nicht für den Azure OpenAI-Dienst. |
Ratelimit |
Count | Gesamt (Summe) | Region , RatelimitKey |
PT1M | Ja |
Prämien | Durchschnittliche Belohnung pro Ereignis Durchschnittliche Belohnung pro Ereignis. |
Reward |
Count | Average | BaselineAction , , ChosenActionId MatchesBaseline , NonDefaultReward , , Mode RunId |
PT1M | Ja |
Cognitive Services – HTTP-Anforderungen | Serverfehler Anzahl von Aufrufen mit internem Dienstfehler (HTTP-Antwortcode 5xx) Verwenden Sie nicht für den Azure OpenAI-Dienst. |
ServerErrors |
Count | Gesamt (Summe) | ApiName , , OperationName Region RatelimitKey |
PT1M | Ja |
Auftreten von Features | Steckplatzfunktionsinstanzen Gibt an, wie häufig jedes Slotfeature ausgeführt wird. |
SlotFeatureIdOccurrences |
Count | Gesamt (Summe) | FeatureId , Mode RunId |
PT1M | Ja |
Features pro Ereignis | Slot-Features pro Ereignis Durchschnittliche Anzahl von Slotfeatures pro Ereignis. |
SlotFeaturesPerEvent |
Count | Average | Mode , RunId |
PT1M | Ja |
Slots | Slot-Vorkommen Gibt an, wie häufig jeder Slot ausgeführt wird. |
SlotIdOccurrences |
Count | Gesamt (Summe) | SlotId , , SlotIndex Mode RunId |
PT1M | Ja |
Namespaces pro Ereignis | Slot-Namespaces pro Ereignis Durchschnittliche Anzahl von Slotnamespaces pro Ereignis. |
SlotNamespacesPerEvent |
Count | Average | Mode , RunId |
PT1M | Ja |
Prämien | Slot-Belohnung Belohnung pro Slot. |
SlotReward |
Count | Average | BaselineActionId , , ChosenActionId MatchesBaseline , NonDefaultReward , SlotId , SlotIndex , , Mode RunId |
PT1M | Ja |
SpeechServices – Verwendung | Sprechererkennungstransaktionen Anzahl von Transaktionen zur Sprechererkennung |
SpeakerRecognitionTransactions |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
SpeechServices – Verwendung | Hostingstunden des Sprachmodells Anzahl der Hostingstunden des Sprachmodells |
SpeechModelHostingHours |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Dauer der Sprachsitzung (veraltet) Gesamtdauer der Sprachsitzung in Sekunden |
SpeechSessionDuration |
Sekunden | Gesamt (Summe) | ApiName , OperationName Region |
PT1M | Ja |
Cognitive Services – HTTP-Anforderungen | Erfolgreiche Anrufe Anzahl erfolgreicher Aufrufe Verwenden Sie nicht für den Azure OpenAI-Dienst. |
SuccessfulCalls |
Count | Gesamt (Summe) | ApiName , , OperationName Region RatelimitKey |
PT1M | Ja |
Cognitive Services - SLI | AvailabilityRate Verfügbarkeitsprozentsatz bei der folgenden Berechnung: (Aufrufe gesamt – Serverfehler)/Aufrufe gesamt. Serverfehler umfassen alle HTTP-Antworten >=500. Verwenden Sie nicht für den Azure OpenAI-Dienst. |
SuccessRate |
Percent | Minimum, Maximum, Mittelwert | ApiName , , OperationName Region RatelimitKey |
PT1M | No |
SpeechServices – Verwendung | Synthetisierte Zeichen Anzahl von Zeichen. |
SynthesizedCharacters |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Übersetzte Textzeichen Anzahl der Zeichen in eingehenden Textübersetzungsanforderungen |
TextCharactersTranslated |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Übersetzte benutzerdefinierte Textzeichen Anzahl der Zeichen in eingehenden benutzerdefinierten Textübersetzungsanforderungen |
TextCustomCharactersTranslated |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Verbrauch | Trainierte Textzeichen Anzahl der mithilfe der Textübersetzung trainierten Zeichen |
TextTrainedCharacters |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Azure OpenAI – Verwendung | Verarbeitete Ableitungstoken Anzahl der in einem OpenAI-Modell verarbeiteten Ableitungstoken. Berechnet als Eingabeaufforderungstoken (Eingabe) plus generierten Token (Ausgabe). Gilt für PTU-, PTU-verwaltete und pay-as-you-go-Bereitstellungen. Um diese Metrik aufzuschlüsseln, können Sie einen Filter hinzufügen oder durch die folgenden Dimensionen aufteilen: ModelDeploymentName und ModelName. |
TokenTransaction |
Count | Gesamt (Summe) | ApiName , , ModelDeploymentName FeatureName , UsageChannel , , Region ModelVersion |
PT1M | Ja |
Cognitive Services – HTTP-Anforderungen | Gesamtanzahl der Anrufe Gesamtanzahl von Aufrufen Verwenden Sie nicht für den Azure OpenAI-Dienst. |
TotalCalls |
Count | Gesamt (Summe) | ApiName , , OperationName Region RatelimitKey |
PT1M | Ja |
Cognitive Services – HTTP-Anforderungen | Fehler gesamt Gesamtzahl von Aufrufen mit Fehlerantwort (HTTP-Antwortcode 4xx oder 5xx) Verwenden Sie nicht für den Azure OpenAI-Dienst. |
TotalErrors |
Count | Gesamt (Summe) | ApiName , , OperationName Region RatelimitKey |
PT1M | Ja |
Verbrauch | Ereignisse insgesamt Anzahl der Ereignisse. |
TotalEvents |
Count | Gesamt (Summe) | Mode , RunId |
PT1M | Ja |
Cognitive Services – HTTP-Anforderungen | Tokenaufrufe insgesamt Gesamtanzahl von Tokenaufrufen |
TotalTokenCalls |
Count | Gesamt (Summe) | ApiName , OperationName Region |
PT1M | Ja |
Verbrauch | Gesamtzahl der Transaktionen (veraltet) Gesamtanzahl von Transaktionen |
TotalTransactions |
Count | Gesamt (Summe) | <none> | PT1M | Ja |
Schätzungen | Anzahl der Benutzer baseline-Ereignisse Geschätzte Anzahl der benutzerdefinierten Baselineereignisse. |
UserBaselineEventCount |
Count | Gesamt (Summe) | Mode , RunId |
PT1M | Ja |
Schätzungen | Benutzerbasisplan-Belohnung Schätzung der benutzerdefinierten Baselinebelohnung. |
UserBaselineReward |
Count | Gesamt (Summe) | Mode , RunId |
PT1M | Ja |
SpeechServices – Verwendung | Synthetisierte Videosekunden Anzahl der synthetisierten Sekunden |
VideoSecondsSynthesized |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
SpeechServices – Verwendung | Hostingstunden des Stimmmodells Anzahl der Stunden. |
VoiceModelHostingHours |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
SpeechServices – Verwendung | Trainingsminuten des Stimmmodells Anzahl der Minuten. |
VoiceModelTrainingMinutes |
Count | Gesamt (Summe) | ApiName , , FeatureName UsageChannel Region |
PT1M | Ja |
Metrikdimensionen
Informationen darüber, was metrische Dimensionen sind, finden Sie unter Mehrdimensionale Metriken.
Bei diesem Dienst gelten die folgenden Dimensionen für die zugehörigen Metriken.
- ApiName
- FeatureName
- ModelDeploymentName
- ModelName
- ModelVersion
- Vorgangsname
- Region
- StatusCode
- StreamType
- UsageChannel
Ressourcenprotokolle
In diesem Abschnitt werden die Ressourcenprotokolltypen aufgeführt, die für diesen Service erfasst werden können. Der Abschnitt wird aus der Liste aller in Azure Monitor unterstützten Kategorietypen für Ressourcenprotokolle gezogen.
Unterstützte Ressourcenprotokolle für Microsoft.CognitiveServices/Konten
Kategorie | Anzeigename der Kategorie | Protokolltabelle | Unterstützt grundlegenden Protokollplan | Unterstützt die Erfassungszeittransformation | Beispielabfragen | Exportkosten |
---|---|---|---|---|---|---|
Audit |
Überwachungsprotokolle | AzureDiagnostics Protokolle aus mehreren Azure-Ressourcen. |
No | Nr. | No | |
RequestResponse |
Anforderungs- und Antwortprotokolle | AzureDiagnostics Protokolle aus mehreren Azure-Ressourcen. |
No | Nr. | No | |
Trace |
Ablaufverfolgungsprotokolle | AzureDiagnostics Protokolle aus mehreren Azure-Ressourcen. |
No | Nr. | No |
Tabellen in Azure Monitor-Protokollen
Dieser Abschnitt bezieht sich die für diesen Service relevanten Azure-Monitor-Protokolltabellen, die für die Abfrage durch Protokollanalyse mit Kusto-Abfragen zur Verfügung stehen. Diese Tabellen enthalten Ressourcenprotokolldaten und möglicherweise mehr, je nachdem, was erfasst und an sie weitergeleitet wird.
Azure OpenAI microsoft.cognitiveservices/accounts
Aktivitätsprotokoll
In der verknüpften Tabelle sind die Vorgänge aufgeführt, die im Aktivitätsprotokoll für diesen Dienst aufgezeichnet werden können. Diese Operationen sind eine Teilmenge aller möglichen Ressourcenanbietervorgänge im Aktivitätsprotokoll.
Weitere Informationen zum Schema von Aktivitätsprotokolleinträgen finden Sie unter Ereignisschema des Azure-Aktivitätsprotokolls.
Zugehöriger Inhalt
- Eine Beschreibung der Überwachung von Azure OpenAI finden Sie unter Überwachen von Azure OpenAI .
- Weitere Informationen zur Überwachung von Azure-Ressourcen finden Sie unter Überwachen von Azure-Ressourcen mit Azure Monitor.