Dienstkontingente und Limits
Dieser Inhalt gilt für: Version 4.0 (GA) | Vorherige Versionen: Version 3.1 (GA) Version 3.0 (GA)
Dieser Inhalt gilt für: Version 2.1 | Neueste Version: Version 4.0 (GA)
Dieser Artikel enthält eine Kurzübersicht und eine ausführliche Beschreibung der Kontingente und Grenzwerte für den Azure KI Dokument Intelligenz-Dienst für alle Tarife. Außerdem finden Sie hier einige bewährte Methoden zur Vermeidung der Anforderungsdrosselung.
Modellverwendung
Unterstützte Dokumenttypen | Lesen | Layout | Vordefinierte Modelle | Benutzerdefinierte Modelle | Add-On-Funktionen |
---|---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
Bilder: JPEG/JPG , PNG , BMP , TIFF , HEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = unterstützt ✖️ = Nicht unterstützt
Unterstützte Dokumenttypen | Lesen | Layout | Vordefinierte Modelle | Benutzerdefinierte Modelle |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Bilder: JPEG/JPG , PNG , BMP , TIFF , HEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = unterstützt ✖️ = Nicht unterstützt
Abrechnung
Die Abrechnung von Dokument Intelligenz erfolgt monatlich, basierend auf dem Modelltyp und der Anzahl von analysierten Seiten. Sie finden Nutzungsmetriken im Metrikendashboard im Azure-Portal. Das Dashboard zeigt die Anzahl der von Azure KI Dokument Intelligenz verarbeiteten Seiten an. Sie können die geschätzten Kosten für die Ressource mithilfe des Azure-Preisrechners überprüfen. Ausführliche Anweisungen finden Sie unter Überprüfen der Nutzung und Schätzen der Kosten. Hier sind einige Details:
Wenn Sie ein Dokument zur Analyse übermitteln, analysiert der Dienst alle Seiten, es sei denn, Sie geben einen Seitenbereich mithilfe des
pages
-Parameters in Ihrer Anforderung an. Wenn der Dienst Microsoft Excel- und PowerPoint-Dokumente über das Lese-, OCR- oder Layoutmodell analysiert, zählt er jedes Excel-Arbeitsblatt und jede PowerPoint-Folie als eine Seite.Wenn der Dienst PDF- und TIFF-Dateien analysiert, zählt er jede Seite in der PDF-Datei oder jedes Bild in der TIFF-Datei als eine Seite und hat keine maximale Zeichenbeschränkungen.
Wenn der Dienst Microsoft Word- und HTML-Dateien analysiert, die von den Lese- und Layoutmodellen unterstützt werden, zählt er Seiten in Blöcken von jeweils 3.000 Zeichen. Wenn Ihr Dokument z. B. 7.000 Zeichen enthält, ergeben sich zwei Seiten mit je 3.000 Zeichen und eine Seite mit 1.000 Zeichen, insgesamt also drei Seiten.
Die Lese- und Layoutmodelle unterstützen keine Analyse eingebetteter oder verknüpfter Bilder in Microsoft Word-, Excel-, PowerPoint- und HTML-Dateien. Daher gelten sie für den Dienst nicht als hinzugefügte Bilder.
Das Training eines benutzerdefinierten Modells mit Dokument Intelligenz ist immer kostenfrei. Kosten fallen nur an, wenn der Dienst ein Modell zum Analysieren eines Dokuments verwendet.
Die Preise für Container entsprechen den Preisen für Clouddienste.
Dokument Intelligenz bietet einen kostenlosen Tarif (F0), mit dem Sie alle Features von Dokument Intelligenz testen können. Im Free-Tarif wird die Analyse der Antwort auf die ersten beiden Seiten einer Anforderung beschränkt.
Dokument Intelligenz bietet für große Workloads ein Preismodell mit Mindestabnahme an.
Das Layoutmodell ist erforderlich, um Bezeichnungen für Ihr Dataset für benutzerdefinierte Trainings zu generieren. Wenn für das Dataset, das Sie für benutzerdefinierte Trainings verwenden, keine Bezeichnungsdateien verfügbar sind, generiert der Dienst sie für Sie und stellt Ihnen die Layoutmodellverwendung in Rechnung.
Kontingent | Free (F0)1 | Standard (S0) |
---|---|---|
Analysieren von Transaktionen pro Sekunde – Grenzwert | 1 | 15 (Standardwert) |
Anpassbar | Nein | Ja 2 |
Abrufen von Vorgängen pro Sekunde – Grenzwert | 1 | 50 (Standardwert) |
Anpassbar | Nein | Ja 2 |
Modellverwaltungsvorgänge pro Sekunde – Grenzwert | 1 | 5 (Standardwert) |
Anpassbar | Nein | Ja 2 |
Auflistungsvorgänge pro Sekunde – Grenzwert | 1 | 10 (Standardwert) |
Anpassbar | Nein | Ja 2 |
Max. Dokumentgröße | 4 MB | 500 MB |
Anpassbar | Nein | Nein |
Max. Anzahl von Seiten (Analyse) | 2 | 2000 |
Anpassbar | Nein | Nein |
Max. Größe der Bezeichnungsdatei | 10 MB | 10 MB |
Anpassbar | Nein | Nein |
Max. Größe der OCR-JSON-Antwort | 500 MB | 500 MB |
Anpassbar | Nein | Nein |
Maximale Anzahl von Vorlagenmodellen | 500 | 5.000 |
Anpassbar | Nein | Nein |
Maximale Anzahl von neuronalen Modellen | 100 | 500 |
Anpassbar | Nein | Nein |
Nutzung des benutzerdefinierten Modells
Kontingent | Free (F0) 1 | Standard (S0) |
---|---|---|
Grenzwert beim Zusammenstellen des Modells | 5 | 500 (Standardwert) |
Anpassbar | Nein | No |
Trainingdatensatzgröße * Neurale und generative | 1 GB 3 | 1 GB (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets* Vorlage | 50 MB 4 | 50 MB (Standardwert) |
Anpassbar | Nein | Nein |
Max. Anzahl von Seiten (Training) * Vorlage | 500 | 500 (Standardwert) |
Anpassbar | Nein | No |
Maximale Anzahl von Seiten (Training) * Neurale und generative | 50.000 | 50.000 (Standardwert) |
Anpassbar | Nein | Nein |
Trainieren benutzerdefinierter neuronaler Modelle | 10 Stunden pro Monat 5 | kein Grenzwert (stundenweise Abrechnung), mit 10 kostenlosen Stunden jeden Monat beginnen |
Anpassbar | Nein | Ja3 |
Max. Anzahl von Seiten (Training) * Klassifizierer | 10.000 | 10 000 (Standardwert) |
Anpassbar | Nein | Nein |
Maximale Anzahl von Dokumenttypen (Klassen) * Klassifizierer | 500 | 500 (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets * Klassifizierer | 1 GB | 2 GB (Standardwert) |
Anpassbar | Nein | Nein |
Minimale Anzahl von Stichproben pro Klasse * Klassifizierer | 5 | 5 (Standardwert) |
Anpassbar | Nein | Nein |
Nutzung des benutzerdefinierten Modells
Kontingent | Free (F0) 1 | Standard (S0) |
---|---|---|
Grenzwert beim Zusammenstellen des Modells | 5 | 200 (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets * Neuronal | 1 GB 3 | 1 GB (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets* Vorlage | 50 MB 4 | 50 MB (Standardwert) |
Anpassbar | Nein | Nein |
Max. Anzahl von Seiten (Training) * Vorlage | 500 | 500 (Standardwert) |
Anpassbar | Nein | Nein |
Max. Anzahl von Seiten (Training) * Neuronal | 50.000 | 50.000 (Standardwert) |
Anpassbar | Nein | Nein |
Trainieren benutzerdefinierter neuronaler Modelle | 10 pro Monat | 20 USD pro Monat |
Anpassbar | Nein | Ja3 |
Max. Anzahl von Seiten (Training) * Klassifizierer | 10.000 | 10 000 (Standardwert) |
Anpassbar | Nein | Nein |
Maximale Anzahl von Dokumenttypen (Klassen) * Klassifizierer | 500 | 500 (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets * Klassifizierer | 1 GB | 1 GB (Standardwert) |
Anpassbar | Nein | Nein |
Minimale Anzahl von Stichproben pro Klasse * Klassifizierer | 5 | 5 (Standardwert) |
Anpassbar | Nein | Nein |
Nutzung des benutzerdefinierten Modells
Kontingent | Free (F0) 1 | Standard (S0) |
---|---|---|
Grenzwert beim Zusammenstellen des Modells | 5 | 200 (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets * Neuronal | 1 GB 3 | 1 GB (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets* Vorlage | 50 MB 4 | 50 MB (Standardwert) |
Anpassbar | Nein | Nein |
Max. Anzahl von Seiten (Training) * Vorlage | 500 | 500 (Standardwert) |
Anpassbar | Nein | Nein |
Max. Anzahl von Seiten (Training) * Neuronal | 50.000 | 50.000 (Standardwert) |
Anpassbar | Nein | Nein |
Trainieren benutzerdefinierter neuronaler Modelle | 10 pro Monat | 20 USD pro Monat |
Anpassbar | Nein | Ja3 |
Max. Anzahl von Seiten (Training) * Klassifizierer | 10.000 | 10 000 (Standardwert) |
Anpassbar | Nein | Nein |
Maximale Anzahl von Dokumenttypen (Klassen) * Klassifizierer | 500 | 500 (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets * Klassifizierer | 1 GB | 1 GB (Standardwert) |
Anpassbar | Nein | Nein |
Minimale Anzahl von Stichproben pro Klasse * Klassifizierer | 5 | 5 (Standardwert) |
Anpassbar | Nein | Nein |
Grenzwerte für benutzerdefinierte Modelle
Kontingent | Free (F0) 1 | Standard (S0) |
---|---|---|
Grenzwert beim Zusammenstellen des Modells | 5 | 200 (Standardwert) |
Anpassbar | Nein | Nein |
Größe des Trainingsdatasets | 50 MB | 50 MB (Standardwert) |
Anpassbar | Nein | Nein |
Max. Anzahl von Seiten (Training) | 500 | 500 (Standardwert) |
Anpassbar | Nein | No |
1 Für die Preisstufe Kostenlos (F0) siehe auch die monatlichen Freibeträge auf der Preisseite.
2 Siehe bewährte Verfahren und Anweisungen zur Anpassung.
3Die Anzahl der Trainingsdurchläufe für neuronale Modelle wird jeden Kalendermonat zurückgesetzt. Öffnen Sie eine Supportanfrage, um den monatlichen Grenzwert für das Training zu erhöhen. Ab der v4.0-API werden Trainingsanforderungen mit mehr als 20 Anforderungen in einem Kalendermonat in der Trainingsebene abgerechnet. Weitere Informationen finden Sie unter Preise.
4 Dieser Grenzwert gilt für alle Dokumente, die vor allen Aktualisierungen im Zusammenhang mit Bezeichnungen im Ordner Ihres Trainingsdatasets gefunden wurden.
5 Dieser Grenzwert gilt nur für
v 4.0 (2024-11-30 GA)
benutzerdefinierte neurale Modelle. Abv 4.0
unterstützen wir das Training größerer Dokumente für längere Zeiträume (bis zu 10 Stunden kostenlos, danach fallen Gebühren an). Weitere Informationen finden Sie auf der Seite für benutzerdefinierte neuronale Modelle.
Ausführliche Beschreibung, Kontingentanpassung und bewährte Methoden
Die Standardgrenzwerte können durch Anfordern einer Erhöhung über ein Supportticket erweitert werden. Überprüfen Sie vor dem Anfordern einer Kontingenterhöhung (sofern zutreffend), dass sie wirklich erforderlich ist. Der Dokument Intelligenz-Dienst nutzt die automatische Skalierung, um die erforderlichen Computeressourcen on-demand
bereitzustellen, die Kosten für Kunden niedrig zu halten und die Bereitstellung nicht genutzter Ressourcen aufzuheben, indem keine übermäßige Hardwarekapazität beibehalten wird.
Wenn Ihre Anwendung den Antwortcode 429 (Zu viele Anforderungen) zurückgibt, überschreiten Sie den Schwellenwert für eine oder mehrere Transaktionen pro Sekunde (TPS):
- Analysieren von Transaktionen pro Sekunde – Grenzwert: TPS für das Senden von Analyseanforderungen (POST)
- Abrufen von Vorgängen pro Sekunde – Grenzwert: TPS für das Abrufen von Ergebnissen für Analysevorgänge (GET)
- Modellverwaltungsvorgänge pro Sekunde – Grenzwert: Vorgänge im Zusammenhang mit der Modellverwaltung wie Erstellen/Trainieren und Kopieren
- Auflistungsvorgänge pro Sekunde – Grenzwert: Vorgänge im Zusammenhang mit dem Auflisten von Modellen, Vorgängen
Allgemeine bewährte Methoden zur Behandlung der Drosselung während der automatischen Skalierung
Verwenden Sie die folgenden Techniken, um Probleme im Zusammenhang mit der Drosselung (Antwortcode 429) zu vermeiden:
- Implementieren Sie eine Wiederholungslogik in der Anwendung.
- Vermeiden Sie plötzliche Änderungen bei der Arbeitsauslastung. Erhöhen Sie die Arbeitsauslastung nach und nach.
Beispiel: Bei Ihrer Anwendung wird Dokument Intelligenz verwendet, und die aktuelle Workload liegt bei 10 TPS (Transaktionen pro Sekunde). In der nächsten Sekunde erhöhen Sie die Last auf 40 TPS. Das Ergebnis ist der Antwortcode 429 für einige Anforderungen, da Sie den Grenzwert von 15 TPS für die Übermittlung von Analysevorgängen überschreiten. Sie können die Verarbeitung entweder zurücksetzen, um unter den 15 TPS zu bleiben, oder eine Erhöhung des TPS-Werts anfordern, um höhere Volumen zu unterstützen.
In den nächsten Abschnitten werden bestimmte Kontingentanpassungsfälle beschrieben. Wechseln Sie zu Dokument Intelligenz: Erhöhen des Grenzwerts für gleichzeitige Anforderungen.
Erhöhen des Anforderungsgrenzwerts für Transaktionen pro Sekunde
Standardmäßig ist die Anzahl der Transaktionen pro Sekunde (TPS) für eine Dokument Intelligenz-Ressource auf 15 TPS begrenzt. Im Tarif „Standard“ kann diese Anzahl erhöht werden. Machen Sie sich vor dem Übermitteln der Anforderung mit dem Material in diesem Abschnitt und mit diesen bewährten Methoden vertraut.
Der erste Schritt ist das Aktivieren der automatischen Skalierung. Folgen Sie diesem Dokument, um die automatische Skalierung für Ihre Ressource zu aktivieren * Aktivieren der automatischen Skalierung. Wenn die automatische Skalierung aktiviert ist, kann Ihre Ressource weiterhin Anforderungen oberhalb der konfigurierten TPS-Grenzwerte akzeptieren, wenn Kapazität für den Dienst vorhanden ist. Dies kann weiterhin zu gedrosselten Anforderungen führen.
Eine Erhöhung des Grenzwerts für gleichzeitige Anforderungen wirkt sich nicht direkt auf Ihre Kosten aus. Dokument Intelligenz zahlen Sie nur für Ihre tatsächliche Nutzung. Der Grenzwert gibt an, wie hoch der Dienst skaliert werden kann, bevor Ihre Anforderungen gedrosselt werden.
Der vorhandene Wert verschiedener Kategorien für Anforderungsgrenzwerte ist über das Azure-Portal auf der Registerkarte „Überwachung“ des Blatts „Ressourcenübersicht“ verfügbar.
Erstellen und Übermitteln einer Supportanfrage für die TPS-Erhöhung
Initiieren Sie die Erhöhung des TPS-Grenzwerts (Transaktionen pro Sekunde) für Ihre Ressource, indem Sie eine Supportanfrage übermitteln:
- Melden Sie sich beim Azure-Portal
- Wählen Sie die Dokument Intelligenz-Ressource aus, deren TPS-Grenzwert Sie erhöhen möchten.
- Wählen Sie -Neue Supportanfrage- (Gruppe -Support + Problembehandlung-) aus. Ein neues Fenster mit automatisch ausgefüllten Informationen zu Ihrem Azure-Abonnement und Ihrer Azure-Ressource erscheint
- Geben Sie eine -Zusammenfassung- ein (z. B. „TPS-Grenzwert von Dokument Intelligenz erhöhen“).
- Wählen Sie für das Feld „Problemtyp“ die Option „Kontingent- oder Verbrauchsprüfung“ aus.
- Wählen Sie -Weiter: Lösungen- aus.
- Fahren Sie mit der Anforderungserstellung fort.
- Geben Sie auf der Registerkarte „Details“ die folgenden Informationen im Feld -Beschreibung- ein:
- Ein Hinweis, dass es sich bei der Anforderung um das Dokument Intelligenz-Kontingent handelt
- Geben Sie eine TPS-Erwartung an, auf die Sie skalieren möchten. TPS-Erhöhungen sind zwar kostenlos, Sie sollten aber nur einen TPS-Wert anfordern, der für Ihre Workload angemessen ist.
- Azure-Ressourceninformationen
- Geben Sie die übrigen erforderlichen Informationen ein, und wählen Sie auf der Registerkarte -Überprüfen + erstellen- die Schaltfläche -Erstellen- aus.
- Notieren Sie sich die Nummer der Supportanfrage aus den Benachrichtigungen im Azure-Portal. Bitten Sie den Support, Sie in Kürze wegen der weiteren Verarbeitung zu kontaktieren.
Beispiel für eine bewährte Methode für Workloadmuster
Dieses Beispiel zeigt die empfohlene Vorgehensweise zur Vermeidung einer möglichen Drosselung im Rahmen der automatischen Skalierung. Dabei handelt es sich nicht um eine exakte Anleitung, sondern vielmehr um eine empfohlene Vorlage, die Sie nach Bedarf anpassen können.
Angenommen, für eine Dokument Intelligenz-Ressource wurde der Standardgrenzwert festgelegt. Starten Sie die Workload, um Ihre Analyseanforderungen zu übermitteln. Wenn Sie feststellen, dass bei der Überprüfung des Abschlusses eine häufige Drosselung mit dem Antwortcode 429 auftritt, sollten Sie zunächst ein exponentielles Backoff für die Antwortanforderung „GET analyze“ implementieren. Verwenden Sie beispielsweise eine zunehmend längere Wartezeit zwischen Wiederholungsversuchen für aufeinanderfolgende Fehlerantworten, z. B. das Muster „2-5-13-34“ für Verzögerungen zwischen Anfragen. Im Allgemeinen empfehlen wir, die „GET analyze“-Antwort nicht häufiger als einmal alle zwei Sekunden für eine entsprechende POST-Anforderung aufzurufen. Die Antwort analyze
enthält auch einen Retry-After-Header, der angibt, wie lange Sie warten sollten (in Sekunden), bevor Sie den Abschluss dieser Anforderung überprüfen.
Wenn Sie feststellen, dass die Anzahl der POST-Anforderungen für übermittelte Dokumente gedrosselt wird, sollten Sie eine Verzögerung zwischen den Anforderungen hinzufügen. Wenn Ihre Workload ein höheres Maß an gleichzeitiger Verarbeitung erfordert, müssen Sie eine Supportanfrage erstellen, um Ihre Dienstgrenzwerte für Transaktionen pro Sekunde zu erhöhen.
Im Allgemeinen empfehlen wir, die Arbeitsauslastung und die Arbeitsauslastungsmuster vor dem Produktionseinsatz zu testen.