Freigeben über


Überwachen von Abfrageanforderungen in Azure KI Search

In diesem Artikel erfahren Sie, wie Sie Abfrageleistung und -volumen mit integrierten Metriken und Ressourcenprotokollierung messen. Außerdem wird erläutert, wie die Abfragezeichenfolgen abgerufen werden, die von Anwendungsbenutzern eingegeben werden.

Im Azure-Portal werden grundlegende Metriken zur Abfragelatenz, Abfragelast (Queries Per Second, QPS) und Drosselung angezeigt. Auf historische Daten, die in diese Metriken einfließen, kann im Azure-Portal 30 Tage lang zugegriffen werden. Zur längeren Aufbewahrung oder zur Erstellung von Berichten für operative Daten und Abfragezeichenfolgen müssen Sie eine Diagnoseeinstellung hinzufügen, die eine Speicheroption für die Beibehaltung von protokollierten Vorgängen und Metriken festlegt. Es wird empfohlen, einen Log Analytics-Arbeitsbereich als Ziel für protokollierte Vorgänge zu verwenden. Kusto-Abfragen und die Datenuntersuchung verwenden einen Log Analytics-Arbeitsbereich als Ziel.

Zu den Bedingungen, die die Integrität der Datenmessung maximieren, gehören:

  • Verwenden Sie einen abrechenbaren Dienst (einen Dienst, der entweder im Basic- oder Standard-Tarif erstellt wurde). Der kostenlose Tarif (Free) wird von mehreren Abonnenten gemeinsam genutzt, wodurch eine gewisse Volatilität durch wechselnde Auslastungen entsteht.

  • Verwenden Sie, wenn möglich, ein einzelnes Replikat und eine Partition, um eine eigenständige und isolierte Umgebung zu erstellen. Wenn Sie mehrere Replikate verwenden, werden Abfragemetriken als Durchschnitt mehrerer Knoten angegeben, wodurch die Genauigkeit der Ergebnisse sinken kann. Gleichermaßen bedeuten mehrere Partitionen, dass Daten aufgeteilt werden, wodurch einige Partitionen möglicherweise unterschiedliche Daten aufweisen, wenn gleichzeitig die Indizierung ausgeführt wird. Wenn Sie die Abfrageleistung optimieren, bieten ein einzelner Knoten und eine Partition eine stabilere Umgebung für Tests.

Tipp

Mit zusätzlichem clientseitigem Code und Application Insights können Sie auch Durchklick-Daten (Clickthrough) erfassen, um einen tieferen Einblick in die Interessen Ihrer Anwendungsbenutzer zu erhalten. Weitere Informationen finden Sie unter Datenverkehrsanalyse durchsuchen.

Abfragevolumen (QPS)

Das Volumen wird als Suchabfragen pro Sekunde (QPS) gemessen, einer integrierten Metrik, die als Durchschnitt, Anzahl, Minimal- oder Maximalwerte für Abfragen angegeben werden kann, die innerhalb eines einminütigen Zeitfensters ausgeführt werden. Einminütige Intervalle (TimeGrain = „PT1M“) für Metriken sind im Systems festgelegt.

Weitere Informationen zur Metrik SearchQueriesPerSecond finden Sie unter Suchabfragen pro Sekunde.

Abfrageleistung

Dienstweite Abfrageleistung wird als Suchlatenz und gedrosselte Abfragen gemessen.

Wartezeit bei Suchvorgängen

Die Suchlatenz gibt an, wie lange eine Abfrage benötigt, bis sie abgeschlossen ist. Weitere Informationen zur SearchLatency-Metrik finden Sie unter Suchlatenz.

Betrachten Sie das folgende Beispiel für die Metrik Suchlatenz: Bei einer Stichprobe von 86 Abfragen betrug die durchschnittliche Dauer 23,26 Millisekunden. Ein Minimalwert von 0 gibt an, dass einige Abfragen gelöscht wurden. Die längste Abfrage hat 1000 Millisekunden gedauert. Die Gesamtausführungszeit betrug 2 Sekunden.

Latenzaggregationen

Gedrosselte Abfragen

Gedrosselte Abfragen sind Abfragen, die nicht verarbeitet, sondern gelöscht werden. In den meisten Fällen ist die Drosselung ein normaler Bestandteil der Dienstausführung. Sie weisen nicht unbedingt darauf hin, dass etwas nicht stimmt. Weitere Informationen zur Metrik ThrottledSearchQueriesPercentage finden Sie unter Prozentsatz der gedrosselten Suchabfragen.

Im folgenden Screenshot gibt die erste Zahl die Anzahl (bzw. die Anzahl der an das Protokoll gesendeten Metriken) an. Andere Aggregationen, die im oberen Bereich oder beim Zeigen auf die Metrik angezeigt werden, sind Durchschnitts-, Höchst- und Gesamtwert. In diesem Beispiel wurden keine Anforderungen gelöscht.

Gedrosselte Aggregationen

Erkunden von Metriken im Azure-Portal

Um einen schnellen Überblick über die aktuellen Zahlen zu erhalten, werden auf der Registerkarte Überwachung auf der Seite „Übersicht“ des Diensts drei Metriken (Suchlatenz, Suchabfragen pro Sekunde (pro Sucheinheit), Gedrosselte Suchabfragen in Prozent) in bestimmten Intervallen angezeigt, gemessen in Stunden, Tagen und Wochen, mit der Option, den Aggregationstyp zu ändern.

Zur tiefer gehenden Untersuchung öffnen Sie den Metrik-Explorer aus dem Menü Überwachung, um Daten überlagern, vergrößern und visualisieren und so Trends oder Anomalien untersuchen zu können. Weitere Informationen zum Metrik-Explorer erhalten Sie in diesem Tutorial zum Erstellen eines Metrikdiagramms.

  1. Wählen Sie im Abschnitt „Überwachung“ die Option Metriken aus, um den Metrik-Explorer mit dem auf Ihren Suchdienst festgelegt Bereich zu öffnen.

  2. Wählen Sie unter „Metrik“ eine Metrik aus der Dropdownliste aus, und überprüfen Sie die Liste der verfügbaren Aggregationen für einen bevorzugten Typ. Die Aggregation definiert, wie Stichproben der Werte in den einzelnen Zeitintervallen genommen werden.

    Metrik-Explorer für QPS-Metrik

  3. Legen Sie in der oberen rechten Ecke das Zeitintervall fest.

  4. Wählen Sie eine Visualisierung aus. Der Standardwert ist ein Liniendiagramm.

  5. Überlagern Sie mehrere Aggregationen, indem Sie Metrik hinzufügen und unterschiedliche Aggregationen auswählen.

  6. Vergrößern Sie einen relevanten Bereich im Liniendiagramm. Platzieren Sie den Mauszeiger am Anfang des Bereichs, halten Sie die linke Maustaste gedrückt, ziehen Sie den Mauszeiger zur anderen Seite des Bereichs, und lassen Sie die Maustaste wieder los. Im Diagramm wird dieser Zeitbereich vergrößert.

Zurückgeben von Abfragezeichenfolgen, die von Benutzern eingegeben werden

Wenn Sie die Ressourcenprotokollierung aktivieren, erfasst das System Abfrageanforderungen in der Tabelle AzureDiagnostics. Voraussetzung hierfür ist, dass Sie bereits ein Ziel für protokollierte Vorgänge angegeben haben (entweder einen Log Analytics-Arbeitsbereich oder eine andere Speicheroption).

  1. Wählen Sie im Abschnitt „Überwachung“ die Option Protokolle aus, um in Log Analytics ein leeres Abfragefenster zu öffnen.

  2. Führen Sie den folgenden Ausdruck aus, um nach Query.Search-Vorgängen zu suchen und ein tabellarisches Resultset zurückzugeben, das aus dem Vorgangsnamen, der Abfragezeichenfolge, dem abgefragten Index und der Anzahl gefundener Dokumente besteht. Die letzten beiden Anweisungen schließen aus einer leeren oder nicht angegebenen Suche bestehende Abfragezeichenfolgen über einen Beispielindex aus, wodurch unnötige Informationen in den Ergebnissen reduziert werden.

       AzureDiagnostics
    | project OperationName, Query_s, IndexName_s, Documents_d
    | where OperationName == "Query.Search"
    | where Query_s != "?api-version=2024-07-01&search=*"
    | where IndexName_s != "realestate-us-sample-index"
    
  3. Legen Sie optional einen Spaltenfilter auf Query_s fest, um eine bestimmte Syntax oder Zeichenfolge zu durchsuchen. Beispielsweise können Sie nach ist gleich ?api-version=2024-07-01&search=*&%24filter=HotelName filtern.

    Protokollierte Abfragezeichenfolgen

Diese Technik funktioniert zwar für die Ad-hoc-Untersuchung, durch Erstellen eines Berichts können Sie die Abfragezeichenfolgen jedoch in einem Layout konsolidieren und darstellen, das für die Analyse besser geeignet ist.

Ermitteln von Abfragen mit langer Ausführungsdauer

Fügen Sie eine Spalte für die Dauer hinzu, um die Zahlen für alle Abfragen zu erhalten, nicht nur für die, die als Metrik abgefragt werden. Durch Sortieren dieser Daten können Sie erkennen, welche Abfragen am längsten dauern.

  1. Wählen Sie im Abschnitt „Überwachung“ die Option Protokolle aus, um nach Protokollinformationen abzufragen.

  2. Führen Sie die folgende grundlegende Abfrage aus, um Abfragen sortiert nach Dauer in Millisekunden zurückzugeben. Die längsten Abfragen stehen oben.

    AzureDiagnostics
    | project OperationName, resultSignature_d, DurationMs, Query_s, Documents_d, IndexName_s
    | where OperationName == "Query.Search"
    | sort by DurationMs
    

    Sortieren von Abfragen nach Dauer

Erstellen einer Metrikwarnung

Eine Metrikwarnung legt einen Schwellenwert für das Senden einer Benachrichtigung oder Auslösen einer vorab festgelegten Korrekturmaßnahme fest. Neben Warnungen im Zusammenhang mit der Abfrageausführung können Sie auch Warnungen für Ressourcenintegrität, Änderungen der Suchdienstkonfiguration, Skillausführung und Dokumentverarbeitung (Indizierung) erstellen.

Alle Schwellenwerte sind benutzerdefiniert. Sie sollten daher wissen, durch welche Aktivitätsebene die Warnung ausgelöst werden soll.

Bei der Abfrageüberwachung ist es üblich, eine Metrikwarnung für die Wartezeit bei Suchvorgängen und gedrosselte Abfragen zu erstellen. Wenn Sie wissen, wann Abfragen gelöscht werden, können Sie nach Abhilfemaßnahmen suchen, die die Last verringern oder die Kapazität erhöhen. Wenn z. B. gedrosselte Abfragen während der Indizierung zunehmen, können Sie diese verschieben, bis die Abfrageaktivität nachlässt.

Wenn Sie bis an die Grenzen einer bestimmten Replikat-/Partitionskonfiguration gehen, ist es auch hilfreich, Warnungen für Abfragevolumen-Schwellenwerte (Queries Per Second, QPS) einzurichten.

  1. Wählen Sie unter Überwachung die Option Warnungen und dann Warnungsregel erstellen aus.

  2. Wählen Sie unter „Bedingung“ die Option Hinzufügen aus.

  3. Konfigurieren Sie die Signallogik. Wählen Sie als Signaltyp Metriken und dann das Signal aus.

  4. Nachdem Sie das Signal ausgewählt haben, können Sie ein Diagramm zur Visualisierung von Verlaufsdaten verwenden, um eine fundierte Entscheidung über das weitere Vorgehen bei der Einrichtung von Bedingungen zu treffen.

  5. Scrollen Sie als nächstes nach unten zur Warnungslogik. Als „Proof-of-Concept“ könnten Sie für Testzwecke einen künstlich niedrigen Wert angeben.

  6. Geben Sie als nächstes eine Aktionsgruppe an, oder erstellen Sie eine. Dies ist die Antwort, die aufgerufen wird, wenn der Schwellenwert erreicht ist. Es kann eine Pushbenachrichtigung oder eine automatische Antwort sein.

  7. Zuletzt geben Sie die Warnungsdetails an. Benennen und beschreiben Sie die Warnung, weisen Sie einen Schweregrad zu, und geben Sie an, ob die Regel in einem aktivierten oder deaktivierten Zustand erstellt werden soll.

Wenn Sie eine E-Mail-Benachrichtigung angegeben haben, erhalten Sie eine E-Mail von „Microsoft Azure“ mit der Betreffzeile „Azure: Aktivierter Schweregrad: 3 <your rule name>“.

Nächste Schritte

Fall noch nicht geschehen, überprüfen Sie die Grundlagen der Überwachung von Suchdiensten, um mehr über die gesamte Palette an Überwachungsfunktionen zu erfahren.