Freigeben über


Grenzwerte für den Azure KI Search-Dienst

Die Grenzwerte für Speicher, Workloads und Mengen von Indizes und anderen Objekten hängen davon ab, ob die Erstellung von Azure KI Search im Tarif Free, Basic, Standard oder Storage Optimized erfolgt.

  • Free ist ein mehrinstanzenfähiger, gemeinsam genutzter Dienst, der Teil Ihres Azure-Abonnements ist.

  • Basic bietet dedizierte Computeressourcen für Produktionsworkloads mit geringerem Umfang, teilen sich jedoch bestimmte Netzwerkinfrastruktur mit anderen Mandanten.

  • Standard wird auf dedizierten Computern ausgeführt. Sie bieten höhere Speicher- und Verarbeitungskapazität auf jeder Ebene. Standard ist in vier Ebenen verfügbar: S1, S2, S3 und S3 HD. S3 High Density (S3 HD) ist für Mehrinstanzenfähigkeit und große Mengen von kleinen Indizes (3.000 Indizes pro Dienst) konzipiert. S3 HD bietet kein Indexerfeature, und die Datenerfassung muss APIs nutzen, die Daten aus der Quelle an den Index übermitteln.

  • Storage Optimized wird auf dedizierten Computern mit mehr Gesamtspeicher, Speicherbandbreite und Arbeitsspeicher als Standard ausgeführt. Dieser Tarif ist für große Indizes konzipiert, die nur langsam geändert werden. „Storage Optimized“ gibt es auf zwei Ebenen: L1 und L2.

Grenzwerte für Abonnements

Sie können mehrere abrechenbare Suchdienste (Basic und höher) bis zur maximalen Anzahl zulässiger Dienste in den einzelnen Ebenen pro Region erstellen. Beispielsweise können Sie in einem Abonnement bis zu 16 Dienste für die Basic-Ebene und weitere 16 Dienste für die S1-Ebene im selben Abonnement und in derselben Region erstellen. Anschließend können Sie zusätzliche 16 Basic-Dienste in einer anderen Region für insgesamt 32 Basisdienste im selben Abonnement erstellen. Weitere Informationen zu Tarifen finden Sie unter Auswählen eines Tarifs (oder einer SKU) für Azure KI-Suche.

Die Obergrenze für die maximale Anzahl von Diensten kann auf Anfrage angehoben werden. Senden Sie eine Supportanfrage, wenn Sie in einem Abonnement weitere Dienste benötigen.

Ressource Free 1 Basic S1 S2 S3 S3 HD L1 L2
Maximale Dienste pro Region 1 16 16 8 6 6 6 6
Maximale Anzahl der Sucheinheiten (Search Units, SU)2 N/V 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 Sie können einen kostenlosen Suchdienst pro Azure-Abonnement nutzen. Der Free-Tarif basiert auf einer Infrastruktur, die gemeinsam mit anderen Kund*innen genutzt wird. Da die Hardware nicht dediziert ist, wird das Hochskalieren nicht unterstützt, und der Speicher ist auf 50 MB beschränkt. Ein kostenloser Suchdienst kann nach längerer Inaktivität gelöscht werden, um Platz für weitere Dienste zu schaffen.

2 Sucheinheiten (SU) sind Abrechnungseinheiten, die entweder als Replikat oder Partition zugeordnet werden. Sie benötigen beide. Weitere Informationen zu SU-Kombinationen finden Sie unter Schätzen und Verwalten der Kapazität eines Suchdiensts.

Diensteinschränkungen

In der folgenden Tabelle werden SLA sowie Partitions- und Replikatanzahl auf Dienstebene behandelt.

Resource Kostenlos Basic S1 S2 S3 S3 HD L1 L2
Vereinbarung zum Servicelevel (SLA) No Ja Ja Ja Ja Ja Ja Ja
Partitionen N/V 3 1 12 12 12 3 12 12
Replikate 3 12 12 12 12 12 12

1 Der Basic-Tarif unterstützt drei Partitionen und drei Replikate für insgesamt neun Sucheinheiten (Search Units, SU) bei neuen Suchdiensten, die nach dem 3. April 2024 erstellt wurden. Ältere Basic-Dienste sind auf eine Partition und drei Replikate beschränkt.

Ein Suchdienst unterliegt einem maximalen Speichergrenzwert (Partitionsgröße multipliziert mit der Anzahl der Partitionen) oder einem harten Grenzwert für die maximale Anzahl von Indizes oder Indexer, je nachdem, welcher Wert zuerst erreicht wird.

Vereinbarungen auf Serviceebene (Service Level Agreements, SLAs) gelten für abrechnende Dienste mit mindestens zwei Replikaten für Abfrageworkloads oder drei oder mehr Replikate für Abfrage- und Indizierungsworkloads. Die Anzahl der Partitionen wird für eine SLA nicht berücksichtigt. Weitere Informationen finden Sie unter Zuverlässigkeit in Azure KI Search.

Kostenlose Dienste verfügen nicht über feste Partitionen oder Replikate, und sie teilen Ressourcen für andere Abonnenten.

Partitionsspeicher (GB)

Die Speichergrenzwerte pro Dienst variieren abhängig von zwei Faktoren: Datum der Diensterstellung und Region. Für neuere Dienste gelten in den meisten unterstützten Regionen höhere Grenzwerte.

Die Tabelle zeigt den Verlauf von Speicherkontingenterhöhungen in GB im Laufe der Zeit. Im April 2024 wurden in den Regionen, die in den Fußnoten aufgeführt sind, höhere Kapazitätspartitionen online geschaltet. Die höhere Kapazität ist auf neue Suchdienste beschränkt. Derzeit steht kein direktes Upgrade zur Verfügung.

Diensterstellungsdatum Grundlegend S1 S2 S3/HD L1 L2
Vor dem 3. April 2024 2 25 100 200 1\.024 2\.048
3. April 2024 bis 17. Mai 2024 1 15 160 512 1.024 1\.024 2\.048
Nach dem 17. Mai 2024 2 15 160 512 1\.024 2.048 4.096

1 Speicher mit höherer Kapazität für Basic, S1, S2, S3 in diesen Regionen. Nord-, Mittel- und Südamerika: Brasilien, Süden, Kanada, Mitte, Kanada, Osten, USA, Osten, USA, Osten 2,USA, Mitte, USA, Norden-Mitte, USA, Süden-Mitte, USA, Westen, USA, Westen 2, USA, Westen 3, USA, Westen-Mitte. Europa: Frankreich, Mitte. Italien, Norden, Europa, Norden, Norwegen, Osten, Polen, Mitte, Schweiz, Norden, Schweden, Mitte, Vereinigtes Königreich, Süden, Vereinigtes Königreich, Westen. Naher Osten: VAE, Norden Afrika: Südafrika, Norden Asien-Pazifik: Australien, Osten, Australien, Südosten, Indien, Mitte, Jio Indien, Westen, Asien, Osten, Asien, Südosten, Japan, Osten, Japan, Westen, Südkorea, Mitte, Südkorea, Süden.

2 Speicher mit höherer Kapazität für L1 und L2. Mehr Regionen bieten höhere Kapazität unter den einzelnen abzurechnenden Tarifen. Europa: Deutschland, Norden, Deutschland, Westen-Mitte, Schweiz, Westen. Azure Government: Texas, Arizona, Virginia. Afrika: Südafrika, Norden. Asien-Pazifik: China, Norden 3, China, Osten 3.

In einigen wenigen Regionen wird noch ältere Infrastruktur verwendet, für die die Grenzwerte vom 3. April gelten. Überprüfen Sie vor dem Erstellen eines neuen Diensts die unterstützten Regionen, um sicherzustellen, dass die Region Ihrer Wahl die zusätzliche Kapazität bietet.

Indexgrenzwerte

Resource Kostenlos Basic: 1 S1 S2 S3 S3 HD L1 L2
Maximale Anzahl von Indizes 3 5 oder 15 50 200 200 1000 pro Partition oder 3000 pro Dienst 10 10
Maximale Anzahl der einfachen Felder pro Index 2 1.000 100 1000 1000 1000 1000 1000 1000
Maximale Dimensionen pro Vektorfeld 4098 4098 4098 4098 4098 4098 4098 4098
Maximale Anzahl der komplexen Sammlungen pro Index 40 40 40 40 40 40 40 40
Maximale Anzahl der Elemente in allen komplexen Sammlungen pro Dokument 3 3000 3000 3000 3000 3000 3000 3000 3000
Maximale Tiefe der komplexen Felder 10 10 10 10 10 10 10 10
Maximale Anzahl von Vorschlägen pro Index 1 1 1 1 1 1 1 1
Maximale Anzahl von Bewertungsprofilen pro Index 100 100 100 100 100 100 100 100
Maximale Anzahl von Funktionen pro Profil 8 8 8 8 8 8 8 8
Maximale Indexgröße 4 1,88 TB* 2,34 TB* 100 GB

1 Basic-Dienste, die vor Dezember 2017 erstellt wurden, haben niedrigere Grenzwerte (5 statt 15) für Indizes. Der Basic-Tarif ist der einzige Tarif mit einem unteren Grenzwert von 100 Feldern pro Index.

2 Die Obergrenze für Felder umfasst Felder der ersten Ebene und geschachtelte Unterfelder in einer komplexen Sammlung. Wenn ein Index beispielsweise 15 Felder enthält und über zwei komplexe Sammlungen mit jeweils fünf Unterfeldern verfügt, beträgt die Feldanzahl Ihres Index 25. Indizes mit sehr vielen Feldern können langsam sein. Beschränken Sie Felder und Attribute auf die benötigten Felder, und führen Sie Indizierungs- und Abfragetests durch, um sicherzustellen, dass die Leistung akzeptabel ist.

3 Es gilt Obergrenze für Elemente, da eine hohe Anzahl von diesen Elementen den für Ihren Index erforderlichen Speicherplatz erheblich erhöht. Ein Element einer komplexen Sammlung ist als Member dieser Sammlung definiert. Angenommen, es gibt ein Hotel-Dokument mit einer komplexen Sammlung „Rooms“, dann wird jedes Zimmer in der Sammlung „Rooms“ als ein Element angesehen. Bei einer Indizierung kann die Indizierungs-Engine maximal 3,000 Elemente sicher im gesamten Dokument verarbeiten. Dieser Grenzwert wurde in api-version=2019-05-06 eingeführt und gilt nur für komplexe Sammlungen, nicht für Zeichenfolgensammlungen oder komplexe Felder.

4 Auf den meisten Ebenen ist die maximale Indexgröße alle verfügbaren Speicher für Ihren Suchdienst. Bei S2, S3 und S3 HD ist die maximale Größe eines indexes die in der Tabelle angegebene Zahl. Gilt für Suchdienste, die nach dem 3. April 2024 erstellt wurden.

Wenn Ihr Dienst in einem leistungsfähigeren Cluster bereitgestellt wird, kann es zu Abweichungen bei den maximalen Grenzwerten kommen. Die hier gezeigten Grenzwerte stellen den kleinsten gemeinsamen Nenner dar. Indizes, die gemäß den oben genannten Spezifikationen erstellt wurden, können über äquivalente Dienstebenen hinweg in jede Region portiert werden.

Dokumentgrenzwerte

Die maximale Anzahl von Dokumenten pro Index beträgt:

  • 24 Milliarden bei Basic, S1, S2, S3
  • 2 Milliarden bei S3 HD
  • 288 Milliarden bei L1 HD
  • 576 Milliarden bei L2 HD

Jede Instanz einer komplexen Sammlung zählt für diesen Grenzwert als separates Dokument.

Die maximale Größe jedes Dokuments beträgt ca. 16 MB. Die Dokumentgröße ist tatsächlich eine Begrenzung der Größe der Anforderungsnutzlast für die Indizierungs-API, die 16 MB beträgt. Diese Nutzlast kann ein einzelnes Dokument oder eine Reihe von Dokumenten sein. Für einen Batch mit einem einzelnen Dokument beträgt die maximale Dokumentgröße 16 MB von JSON.

Die Dokumentgröße gilt für Pushmodus-Indizierung, die Dokumente in einen Suchdienst hochlädt. Wenn Sie einen Indexer für Pullmodus-Indizierung verwenden, können die Quelldateien eine beliebige Dateigröße haben, vorbehaltlich der Indexerbeschränkungen. Für den Blob-Indexer sind die Dateigrößenbeschränkungen für höhere Ebenen größer. Die S1-Begrenzung beträgt z. B. 128 MB, die S2-Begrenzung beträgt 256 MB usw.

Denken Sie bei der Schätzung der Dokumentgröße daran, nur die Felder zu indizieren, die einen Mehrwert für Ihre Suchszenarien darstellen, und schließen Sie alle Quellfelder aus, die in den von Ihnen geplanten Abfragen keinen Zweck erfüllen.

Größenbeschränkungen für Vektorindizes

Wenn Sie Dokumente mit Vektorfeldern indizieren, erstellt Azure KI-Suche interne Vektorindizes unter Verwendung der von Ihnen angegebenen Algorithmusparameter. Die Größe dieser Vektorindizes wird durch den Speicher eingeschränkt, der für die Vektorsuche Ihrer Dienstebene (oder SKU) reserviert ist. Anleitungen zum Verwalten und Maximieren des Vektorspeichers finden Sie unter Vektorindexgröße und Einhalten von Grenzwerten.

Vektorgrenzwerte variieren je nach:

Höhere Vektorgrenzwerte ab April 2024 gelten für neue Suchdienste in Regionen mit der zusätzlichen Kapazität (dies sind die meisten).

Die folgende Tabelle zeigt den Verlauf von Vektorkontingenterhöhungen in GB im Laufe der Zeit. Das Kontingent gilt pro Partition. Wenn Sie also einen neuen Dienst der Ebene „Standard“ (S1) auf sechs Partitionen skalieren, beträgt das Gesamtvektorkontingent 35 multipliziert mit 6.

Diensterstellungsdatum Grundlegend S1 S2 S3/HD L1 L2
Vor dem 1. Juli 2023 1 0.5 1 6 12 12 36
1. Juli 2023 bis 3. April 2024 2 1 3 12 36 12 36
3. April 2024 bis 17. Mai 2024 3 5 35 150 300 12 36
Nach dem 17. Mai 2024 4 5 35 150 300 150 300

1 Anfängliche Vektorgrenzwerte während der frühen Vorschau

2 Vektorgrenzwerte während des späteren Vorschauzeitraums. Drei Regionen verfügten nicht über die höheren Grenzwerte: „Deutschland, Westen-Mitte“, „Indien, Westen“ und „Katar, Mitte“.

3 Höheres Vektorkontingent basierend auf den größeren Partitionen für unterstützte Dienstebenen und Regionen.

4 Höheres Vektorkontingent für weitere Ebenen und Regionen basierend auf Aktualisierungen der Partitionsgrößen

Der Dienst erzwingt ein Vektorindexgrößenkontingent für jede Partition in Ihrem Suchdienst. Jede zusätzliche Partition erhöht das verfügbare Kontingent für die Vektorindexgröße. Dieses Kontingent ist eine feste Grenze, um sicherzustellen, dass Ihr Dienst fehlerfrei bleibt, was bedeutet, dass weitere Indizierungsversuche, nachdem der Grenzwert überschritten wurde, scheitern. Sie können die Indizierung fortsetzen, nachdem Sie etwas von dem Kontingent freigegeben haben, indem Sie entweder einige Vektordokumente löschen oder Partitionen hochskalieren.

Wichtig

Höhere Vektorgrenzwerte sind an größere Partitionen gebunden. Für Regionen, die ältere Infrastrukturen verwendet, gelten die Grenzwerte von Juli bis April. In der Liste der Regionen finden Sie den Status für Partitionsspeichergrenzwerte.

Indexergrenzwerte

Es gibt eine maximale Ausführungsdauer, um den Dienst als Ganzes ausgewogen und stabil zu gestalten, aber größere Datensätze benötigen möglicherweise mehr Indizierungszeit, als das Maximum zulässt. Wenn ein Indizierungsauftrag nicht innerhalb der maximal zulässigen Zeit abgeschlossen werden kann, versuchen Sie, den Auftrag nach einem Zeitplan auszuführen. Der Planer verfolgt den Indizierungsstatus. Wenn ein geplanter Indizierungsauftrag aus irgendeinem Grund unterbrochen wird, kann der Indexer den Auftrag bei der nächsten geplanten Ausführung an der Stelle fortsetzen, an der er unterbrochen wurde.

Resource Free 1 Basic 2 S1 S2 S3 S3 HD 3 L1 L2
Maximale Anzahl von Indexern 3 5 oder 15 50 200 200 Nicht zutreffend 10 10
Maximale Datenquellen 3 5 oder 15 50 200 200 Nicht zutreffend 10 10
Maximale Qualifikationsgruppen 4 3 5 oder 15 50 200 200 Nicht zutreffend 10 10
Maximale Indizierungslast pro Aufruf 10.000 Dokumente Nur durch maximale Dokumentanzahl beschränkt Nur durch maximale Dokumentanzahl beschränkt Nur durch maximale Dokumentanzahl beschränkt Nur durch maximale Dokumentanzahl beschränkt Nicht zutreffend Keine Begrenzung Keine Begrenzung
Minimaler Zeitplan 5 Minuten 5 Minuten 5 Minuten 5 Minuten 5 Minuten 5 Minuten 5 Minuten 5 Minuten
Maximale Ausführungsdauer 5 1–3 oder 3–10 Minuten. 2 oder 24 Stunden 2 oder 24 Stunden 2 oder 24 Stunden 2 oder 24 Stunden Nicht zutreffend 2 oder 24 Stunden 2 oder 24 Stunden
Blobindexer: maximale Blobgröße, MB 16 16 128 256 256 Nicht zutreffend 256 256
Blobindexer: maximale Anzahl der Zeichen des aus einem Blob extrahierten Inhalts 6 32.000 64.000 4 Millionen 8 Millionen 16 Millionen Nicht zutreffend 4 Millionen 4 Millionen

1 Die maximale Indexerausführungszeit bei Diensten im Free-Tarif beträgt drei Minuten für Blobquellen und eine Minute für alle anderen Datenquellen. Indizierungsaufruf erfolgt einmal alle 180 Sekunden. Für eine KI-Indizierung, die Azure KI Services aufruft, gilt bei den kostenlosen Diensten ein Limit von 20 kostenlosen Transaktionen pro Indexer pro Tag. Dabei ist eine Transaktion als ein Dokument definiert, das die Anreicherungspipeline erfolgreich durchläuft (Tipp: Sie können einen Indexer zurücksetzen, um seinen Zähler zurückzusetzen).

2 Basic-Dienste, die vor Dezember 2017 erstellt wurden, haben niedrigere Grenzwerte (5 statt 15) für Indexer, Datenquellen und Qualifikationsgruppen.

3 S3 HD-Dienste bieten keine Indexerunterstützung.

4 Maximal 30 Fähigkeiten pro Qualifikationsgruppe.

5 Hinweis zur maximalen Dauer von zwei oder 24 Stunden für Indexer: Ein Maximum von zwei Stunden ist am gängigsten und sollte als Planungsgrundlage verwendet werden. Es bezieht sich auf Indexer, die in der öffentlichen Umgebung ausgeführt werden und verwendet werden, um rechenintensive Verarbeitung auszulagern und mehr Ressourcen für Abfragen freizulassen. Der Begrenzung von 24 Stunden gilt, wenn Sie den Indexer so konfigurieren, dass er in einer privaten Umgebung ausgeführt wird, wobei nur die Infrastruktur verwendet wird, die Ihrem Suchdienst zugeordnet ist. Beachten Sie, dass einige ältere Indexer in der öffentlichen Umgebung nicht ausgeführt werden können, und diese Indexer immer über einen Verarbeitungsbereich von 24-Stunden verfügen. Wenn bei Ihnen ungeplante Indexer vorhanden sind, die 24 Stunden lang kontinuierlich ausgeführt werden, können Sie davon ausgehen, dass diese Indexer nicht zur neueren Infrastruktur migriert werden konnten. Im Allgemeinen legen Sie für Indizierungsaufträge, die nicht innerhalb von zwei Stunden abgeschlossen werden können, den Indexer auf einen 5-Minuten-Zeitplan fest, damit er schnell an der Stelle fortgesetzt werden kann, an der er unterbrochen wurde. Im Free-Tarif ist die maximale Laufzeit von 3 bis 10 Minuten für Indexer mit Skillsets vorgesehen.

6 Die maximale Anzahl von Zeichen basiert auf Unicode-Codeeinheiten, insbesondere UTF-16.

Hinweis

Wie unter Indexgrenzwerte beschrieben, erzwingen Indexer die Obergrenze von 3.000 Elementen auch für alle komplexen Sammlungen pro Dokument – ab der neuesten allgemein verfügbaren API-Version, die komplexe Typen (2019-05-06) unterstützt. Dies bedeutet, dass dieser Grenzwert für Sie nicht gilt, wenn Sie Ihren Indexer mit einer früheren API-Version erstellt haben. Zur Sicherstellung der maximalen Kompatibilität wird ein Indexer, der mit einer früheren API-Version erstellt und dann mit API-Version 2019-05-06 oder höher aktualisiert wurde, trotzdem von der Begrenzung ausgenommen. Kunden sollten sich dieser negativen Auswirkungen, die wie oben erwähnt mit der Verwendung sehr komplexer Sammlungen verbunden sind, bewusst sein. Wir empfehlen Ihnen dringend, für die Erstellung aller neuen Indexer die neueste allgemein verfügbare API-Version zu nutzen.

Indexer haben über private Endpunkte, die über die API für freigegebene Private Link-Ressourcen verwaltet werden, Zugriff auf Azure-Ressourcen. In diesem Abschnitt werden die Grenzwerte für diese Funktion beschrieben.

Resource Kostenlos Basic S1 S2 S3 S3 HD L1 L2
Unterstützung für den Indexer des privaten Endpunkts Nein Ja Ja Ja Ja Keine Ja Ja
Unterstützung für private Endpunkte für Indexer mit einem Skillset1 Nein Nr. Nein Ja Ja Keine Ja Ja
Unterstützung für private Endpunkte für Indexer mit einem Skillset und integrierter Vektorisierung1 No Ja Ja Ja Ja Keine Ja Ja
Maximale Anzahl privater Endpunkte Nicht zutreffend 10 oder 30 100 400 400 Nicht zutreffend 20 20
Maximale Anzahl unterschiedlicher Ressourcentypen3 N/V 4 7 15 15 Nicht zutreffend 4 4

1 Die KI-Anreicherung und die Bildanalyse sind rechenintensive Vorgänge, die unverhältnismäßig große Mengen der verfügbaren Verarbeitungskapazität verbrauchen. Aus diesem Grund sind private Verbindungen in niedrigeren Tarifen deaktiviert, um die Leistung und Stabilität des eigentlichen Suchdiensts zu gewährleisten.

2 Dienste mit hoher Kapazität, die nach dem 3. April 2024 in den unter Partitionsspeicher aufgeführten Regionen erstellt wurden und Workloads für integrierte Vektorisierung zur Indizierungszeit ausführen, unterstützen freigegebene private Verbindungen in kostenpflichtigen Ebenen. Das System muss mindestens einen Skill erkennen, der Daten einbettet.

3 Die Anzahl der unterschiedlichen Ressourcentypen wird als die Anzahl der eindeutigen groupId-Werte berechnet, die in allen freigegebenen Ressourcen für private Verbindungen für einen bestimmten Dienst verwendet werden. Der Status der jeweiligen Ressource spielt dabei keine Rolle.

Synonymlimits

Die maximale Anzahl der Synonymzuordnungen variiert je nach Tarif. Jede Regel kann bis zu 20 Erweiterungen aufweisen. Als Erweiterungen werden gleichwertige Begriffe bezeichnet. Beispielsweise würde für „Katze“, die Zuordnung von „Kätzchen“, „Kater“ und „Felis“ (die Gattung der Katzen) als drei Erweiterungen gezählt werden.

Resource Kostenlos Basic S1 S2 S3 S3-HD L1 L2
Maximale Synonymzuordnungen 3 3 5 10 20 20 10 10
Maximale Anzahl von Regeln pro Zuordnung 5000 20000 20000 20000 20000 20000 20000 20000

Indexaliasgrenzwerte

Die maximale Anzahl von Indexaliassen variiert je nach Ebene und Erstellungsdatum des Diensts. Wenn der Dienst nach Oktober 2022 erstellt wurde, ist die maximale Anzahl von Aliassen in allen Ebenen doppelt so hoch wie die maximal zulässige Anzahl von Indizes. Wenn der Dienst vor Oktober 2022 erstellt wurde, ist der Grenzwert die Anzahl der zulässigen Indizes.

Diensterstellungsdatum Kostenlos Basic S1 S2 S3 S3-HD L1 L2
Vor Oktober 2022 3 5 oder 15 1 50 200 200 1000 pro Partition oder 3000 pro Dienst 10 10
Nach Oktober 2022 6 30 100 400 400 2000 pro Partition oder 6000 pro Dienst 20 20

1 Basic-Dienste, die vor Dezember 2017 erstellt wurden, haben niedrigere Grenzwerte (5 statt 15) für Indizes

Datengrenzwerte (KI-Anreicherung)

Für eine KI-Anreicherungspipeline, die Aufrufe zur Entitätserkennung, Entitätsverknüpfung, Schlüsselbegriffserkennung, Stimmungsanalyse, Sprachenerkennung und Erkennung personenbezogener Daten an eine Azure KI Language-Ressource sendet, gelten Datengrenzwerte. Die maximale Größe eines Datensatzes beträgt 50.000 Zeichen (gemessen durch String.Length). Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an das Stimmungsanalysetool senden, verwenden Sie den Skill „Text teilen“.

Drosselungsgrenzen

API-Anforderungen werden gedrosselt, wenn das System sich der Spitzenkapazität nähert. Die Drosselung verhält sich für verschiedene APIs unterschiedlich. Abfrage-APIs (Suchen/Vorschlagen/AutoVervollständigen) und Indizierungs-APIs drosseln dynamisch basierend auf der Last des Diensts. Index-APIs und Dienstvorgangs-APIs verfügen über statische Grenzwerte für Anforderungsraten.

Statische Grenzwerte für Anforderungsraten für Indexvorgänge:

  • Indizes auflisten (GET /indexes): 3 pro Sekunde pro Sucheinheit
  • Index abrufen (GET /indexes/myindex): 10 pro Sekunde pro Sucheinheit
  • Index erstellen (POST /Indizes): 12 pro Minute pro Sucheinheit
  • Index erstellen oder aktualisieren (PUT /indexes/myindex): 6 pro Sekunde pro Sucheinheit
  • Index löschen (DELETE /indexes/myindex): 12 pro Minute pro Sucheinheit

Statische Grenzwerte für Anforderungsraten für Vorgänge in Bezug auf einen Dienst:

  • Dienststatistiken (GET /servicestats): 4 pro Sekunde pro Sucheinheit

Grenzwerte für die semantische Rangfolgereinschränkung

Der semantische Sortierer verwendet ein Warteschlangensystem, um gleichzeitig eingehende Anforderungen zu verwalten. Mit diesem System können Suchdienste die höchstmögliche Anzahl von Abfragen pro Sekunde abrufen. Wenn der Grenzwert für gleichzeitig eingehende Anforderungen erreicht ist, werden zusätzliche Anforderungen in eine Warteschlange gestellt. Wenn die Warteschlange voll ist, werden weitere Anforderungen abgelehnt und müssen erneut durchgeführt werden.

Die Gesamtanzahl der Abfragen des semantischen Sortierers pro Sekunde variiert je nach den folgenden Faktoren:

  • Die Ebene des Suchdiensts. Sowohl die Warteschlangenkapazität als auch die Grenzwerte für gleichzeitig eingehende Anforderungen variieren je nach Ebene.
  • Anzahl der Sucheinheiten im Suchdienst. Die einfachste Möglichkeit, die maximale Anzahl gleichzeitiger semantischer Rangiererabfragen zu erhöhen, besteht darin, Ihrem Suchdienst weitere Sucheinheiten hinzuzufügen.
  • Die verfügbare Gesamtkapazität des semantischen Sortierers in der Region.
  • Die Zeitspanne, die zum Bearbeiten einer Abfrage mit dem semantischen Sortierer benötigt wird. Dies variiert je nach Auslastung des Suchdiensts.

In der folgenden Tabelle werden die Grenzwerte für die semantische Rangfolgereinschränkung nach Ebene beschrieben, vorbehaltlich der verfügbaren Kapazität in der Region. Sie können sich an den Microsoft-Support wenden, um eine Erhöhung des Grenzwerts anzufordern.

Resource Grundlegend S1 S2 S3 S3-HD L1 L2
Maximale Anzahl gleichzeitig eingehender Anforderungen (pro Sucheinheit) 2 3 4 4 4 4 4
Maximale Warteschlangengröße für Anforderungen (pro Sucheinheit) 4 6 8 8 8 8 8

API-Anforderungsgrenzwerte

Grenzwerte für Abfragen sind vorhanden, da ungebundene Abfragen Ihren Suchdienst destabilisieren können. In der Regel werden solche Abfragen programmgesteuert erstellt. Wenn Ihre Anwendung programmgesteuert Suchabfragen generiert, sollten Sie durch den Entwurf sicherstellen, dass sie keine Abfragen von unbegrenzter Größe erzeugt.

Grenzwerte für Nutzlasten bestehen aus ähnlichen Gründen und stellen die Stabilität Ihres Suchdiensts sicher. Der Grenzwert gilt für die gesamte Anforderung einschließlich aller Komponenten. Wenn die Anforderung beispielsweise mehrere Dokumente oder Befehle stapelt, muss die gesamte Anforderung in den unterstützten Grenzwert passen.

Wenn Sie einen unterstützten Grenzwert überschreiten müssen, sollten Sie Ihr Workload testen, damit Sie wissen, was Sie zu erwarten haben.

Sofern nicht angegeben, gelten die folgenden API-Anforderungen für alle programmierbaren Schnittstellen, einschließlich der Azure-SDKs.

Allgemein:

  • Unterstützte maximale Nutzlastgrenze beträgt 16 MB für die Indizierung und Abfrageanforderung über REST-API und SDKs.
  • Maximale Länge der 8-KB-URL (gilt nur für REST-APIs).

Indizierungs-APIs:

  • Unterstützt maximal 1.000 Dokumente pro Batch an Indexuploads, Zusammenführungen oder Löschungen.

Abfrage-APIs:

  • Maximal 32 Felder in $orderby Klausel.
  • Maximal 100.000 Zeichen in einer Suchklausel.
  • Die maximale Anzahl von Klauseln in der Suche beträgt 3.000.
  • Maximale Grenzwerte für Platzhalter und Abfragen zum regulären Ausdruck, wie durch Lucene erzwungen. Sie begrenzt die Anzahl der Muster, Variationen oder Übereinstimmungen mit 1.000 Instanzen. Dieser Grenzwert ist vorhanden, um Motorüberladungen zu vermeiden.

Suchbegriffe:

  • Die maximale unterstützte Suchbegriffgröße ist 32.766 Byte (32 KB minus 2 Bytes) von UTF-8-codiertem Text. Gilt für die Stichwortsuche und die Texteigenschaft der Vektorsuche.
  • Die maximale unterstützte Suchbegriffgröße beträgt 1.000 Zeichen für die Präfixsuche und die Suche von regulären Ausdrücken.

API-Antwortengrenzwerte

  • Maximale Rückgabe von 1.000 Dokumenten pro Seite mit Suchergebnissen
  • Maximale Rückgabe von 100 Vorschlägen pro Anforderung der Vorschlags-API

Die Suchmaschine gibt standardmäßig 50 Ergebnisse zurück, Sie können diesen Parameter jedoch außer Kraft setzen bis zum maximalen Grenzwert.

API-Schlüsselgrenzwerte

API-Schlüssel werden für die Dienstauthentifizierung verwendet. Es gibt zwei Arten. Administratorschlüssel werden im Anforderungsheader angegeben und gewähren vollständigen Lese-und Schreibzugriff für den Dienst. Abfrageschlüssel sind schreibgeschützt, die in der URL angegeben und normalerweise an Clientanwendungen verteilt werden.

  • Maximal 2 Administratorschlüssel pro Dienst
  • Maximal 50 Abfrageschlüssel pro Dienst