Limity i przydziały dotyczące usługi
Ta zawartość dotyczy: wersja 4.0 (GA) | Poprzednie wersje: v3.1 (GA) v3.0 (GA)
Ta zawartość dotyczy: wersja 2.1 | Najnowsza wersja: wersja 4.0 (OGÓLNA)
Ten artykuł zawiera zarówno krótki opis, jak i szczegółowy opis przydziałów i limitów usługi Analizy dokumentów usługi Azure AI dla wszystkich warstw cenowych. Zawiera również pewne najlepsze rozwiązania, aby uniknąć ograniczania żądań.
Użycie modelu
Obsługiwane typy dokumentów | Przeczytaj | Układ | Wstępnie utworzone modele | Modele niestandardowe | Możliwości dodatków |
---|---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
Obrazy: JPEG/JPG , , BMP PNG , , TIFF HEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , , PPTX XLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = obsługiwane = nieobsługiwane ✖️
Obsługiwane typy dokumentów | Przeczytaj | Układ | Wstępnie utworzone modele | Modele niestandardowe |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Obrazy: JPEG/JPG , , BMP PNG , , TIFF HEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , , PPTX XLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = obsługiwane = nieobsługiwane ✖️
Rozliczenia
Rozliczenia analizy dokumentów są obliczane co miesiąc na podstawie typu modelu i liczby analizowanych stron. Metryki użycia można znaleźć na pulpicie nawigacyjnym metryk w witrynie Azure Portal. Na pulpicie nawigacyjnym jest wyświetlana liczba stron, które przetwarza analiza dokumentów usługi Azure AI. Szacowany koszt wydatków na zasób można sprawdzić przy użyciu kalkulatora cen platformy Azure. Aby uzyskać szczegółowe instrukcje, zobacz Sprawdzanie użycia i szacowania kosztów. Oto kilka szczegółów:
Po przesłaniu dokumentu do analizy usługa analizuje wszystkie strony, chyba że określisz zakres stron przy użyciu parametru
pages
w żądaniu. Gdy usługa analizuje dokumenty programu Microsoft Excel i PowerPoint za pośrednictwem modelu odczytu, OCR lub układu, zlicza każdy arkusz programu Excel i slajd programu PowerPoint jako jedną stronę.Gdy usługa analizuje pliki PDF i TIFF, zlicza każdą stronę w pliku PDF lub każdy obraz w pliku TIFF jako jedną stronę bez maksymalnych limitów znaków.
Gdy usługa analizuje pliki Microsoft Word i HTML obsługiwane przez modele odczytu i układu, zlicza strony w blokach o 3000 znaków. Jeśli na przykład dokument zawiera 7000 znaków, dwie strony z 3000 znakami każda i jedna strona z 1000 znakami sumuje się do łącznej liczby trzech stron.
Modele odczytu i układu nie obsługują analizy osadzonych ani połączonych obrazów w plikach Microsoft Word, Excel, PowerPoint i HTML. W związku z tym usługa nie zlicza ich jako dodanych obrazów.
Trenowanie modelu niestandardowego jest zawsze bezpłatne za pomocą analizy dokumentów. Opłaty są naliczane tylko wtedy, gdy usługa używa modelu do analizowania dokumentu.
Cennik kontenera jest taki sam jak cennik usługi w chmurze.
Analiza dokumentów oferuje warstwę bezpłatną (F0), w której można przetestować wszystkie funkcje analizy dokumentów.
Analiza dokumentów ma model cen oparty na zobowiązaniach dla dużych obciążeń.
Model układu jest wymagany do generowania etykiet dla zestawu danych na potrzeby trenowania niestandardowego. Jeśli zestaw danych używany na potrzeby trenowania niestandardowego nie ma dostępnych plików etykiet, usługa generuje je dla Ciebie i rozliczenie za użycie modelu układu.
Norma sprzedaży | Bezpłatna (F0)1 | Standardowa (S0) |
---|---|---|
Limit transakcji na sekundę | 1 | 15 (wartość domyślna) |
Możliwość dopasowania | Nie. | Tak 2 |
Maksymalny rozmiar dokumentu | 4 MB | 500 MB |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba stron (analiza) | 2 | 2000 |
Możliwość dopasowania | Nie | Nie. |
Maksymalny rozmiar pliku etykiet | 10 MB | 10 MB |
Możliwość dopasowania | Nie | Nie. |
Maksymalny rozmiar odpowiedzi OCR json | 500 MB | 500 MB |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba modeli szablonów | 500 | 5000 |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba modeli neuronowych | 100 | 500 |
Możliwość dopasowania | Nie | Nie. |
Użycie modelu niestandardowego
Norma sprzedaży | Bezpłatna (F0) 1 | Standardowa (S0) |
---|---|---|
Limit modelu redagowania | 5 | 500 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Rozmiar zestawu danych trenowania * neuronowy i generowanie | 1 GB 3 | 1 GB (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Rozmiar zestawu danych trenowania * Szablon | 50 MB 4 | 50 MB (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba stron (trenowanie) * szablon | 500 | 500 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba stron (trenowanie) * neuronowe i generowanie | 50,000 | 50 000 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Niestandardowy trenowanie modelu neuronowego | 10 godzin miesięcznie 5 | brak limitu (płatność według godziny) |
Możliwość dopasowania | Nie. | Tak 3 |
Maksymalna liczba stron (trenowanie) * Klasyfikator | 10,000 | 10 000 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba typów dokumentów (klas) * Klasyfikator | 500 | 500 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Rozmiar zestawu danych trenowania * Klasyfikator | 1 GB | 2 GB (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Minimalna liczba próbek na klasę * Klasyfikator | 5 | 5 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Użycie modelu niestandardowego
Norma sprzedaży | Bezpłatna (F0) 1 | Standardowa (S0) |
---|---|---|
Limit modelu redagowania | 5 | 200 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Rozmiar zestawu danych trenowania * neuronowy | 1 GB 3 | 1 GB (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Rozmiar zestawu danych trenowania * Szablon | 50 MB 4 | 50 MB (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba stron (trenowanie) * szablon | 500 | 500 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba stron (trenowanie) * neuronowe | 50,000 | 50 000 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Niestandardowy trenowanie modelu neuronowego | 10 miesięcznie | 20 miesięcznie |
Możliwość dopasowania | Nie. | Tak 3 |
Maksymalna liczba stron (trenowanie) * Klasyfikator | 10,000 | 10 000 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba typów dokumentów (klas) * Klasyfikator | 500 | 500 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Rozmiar zestawu danych trenowania * Klasyfikator | 1 GB | 1 GB (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Minimalna liczba próbek na klasę * Klasyfikator | 5 | 5 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Użycie modelu niestandardowego
Norma sprzedaży | Bezpłatna (F0) 1 | Standardowa (S0) |
---|---|---|
Limit modelu redagowania | 5 | 200 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Rozmiar zestawu danych trenowania * neuronowy | 1 GB 3 | 1 GB (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Rozmiar zestawu danych trenowania * Szablon | 50 MB 4 | 50 MB (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba stron (trenowanie) * szablon | 500 | 500 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba stron (trenowanie) * neuronowe | 50,000 | 50 000 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Niestandardowy trenowanie modelu neuronowego | 10 miesięcznie | 20 miesięcznie |
Możliwość dopasowania | Nie. | Tak 3 |
Maksymalna liczba stron (trenowanie) * Klasyfikator | 10,000 | 10 000 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba typów dokumentów (klas) * Klasyfikator | 500 | 500 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Rozmiar zestawu danych trenowania * Klasyfikator | 1 GB | 1 GB (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Minimalna liczba próbek na klasę * Klasyfikator | 5 | 5 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Limity modelu niestandardowego
Norma sprzedaży | Bezpłatna (F0) 1 | Standardowa (S0) |
---|---|---|
Limit modelu redagowania | 5 | 200 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Rozmiar zestawu danych trenowania | 50 MB | 50 MB (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
Maksymalna liczba stron (trenowanie) | 500 | 500 (wartość domyślna) |
Możliwość dopasowania | Nie | Nie. |
1 W przypadku warstwy cenowej Bezpłatna (F0) zobacz również miesięczne dodatki na stronie cennika.
2 Zobacz najlepsze rozwiązania i instrukcje dotyczące korekt.
3 Liczba trenowania modeli neuronowych jest resetowany co miesiąc kalendarzowy. Otwórz wniosek o pomoc techniczną, aby zwiększyć miesięczny limit trenowania.
4 Ten limit dotyczy wszystkich dokumentów znajdujących się w folderze zestawu danych trenowania przed wszelkimi aktualizacjami powiązanymi z etykietami.
5 Ten limit dotyczy
v 4.0 (2024-11-30 GA)
tylko niestandardowych modeli neuronowych. Począwszy odv 4.0
programu, obsługujemy trenowanie większych dokumentów przez dłuższy czas (do 10 godzin za darmo i naliczanie opłat po). Aby uzyskać więcej informacji, zapoznaj się z niestandardową stroną modelu neuronowego.
Szczegółowy opis, korekta limitu przydziału i najlepsze rozwiązania
Przed zażądaniem zwiększenia limitu przydziału (jeśli ma to zastosowanie), upewnij się, że jest to konieczne. Usługa analizy dokumentów używa skalowania automatycznego, aby zapewnić wymagane zasoby on-demand
obliczeniowe, utrzymać niskie koszty klienta i anulować aprowizowanie nieużywanych zasobów, nie utrzymując nadmiernej ilości pojemności sprzętowej.
Jeśli aplikacja zwraca kod odpowiedzi 429 (zbyt wiele żądań), a obciążenie mieści się w zdefiniowanych limitach: najprawdopodobniej usługa jest skalowana w górę do zapotrzebowania, ale nie osiągnęła jeszcze wymaganej skali. W związku z tym usługa nie ma natychmiast wystarczającej ilości zasobów, aby obsłużyć żądanie. Ten stan jest przejściowy i nie powinien trwać długo.
Ogólne najlepsze rozwiązania dotyczące ograniczania przepustowości podczas skalowania automatycznego
Aby zminimalizować problemy związane z ograniczaniem przepustowości (kod odpowiedzi 429), zalecamy użycie następujących technik:
- Implementowanie logiki ponawiania prób w aplikacji
- Unikaj gwałtownych zmian w obciążeniu. Stopniowe zwiększanie obciążenia
Przykład. Aplikacja korzysta z analizy dokumentów, a bieżące obciążenie to 10 TPS (transakcje na sekundę). Kolejna sekunda zwiększa obciążenie do 40 TPS (czyli cztery razy więcej). Usługa natychmiast rozpoczyna skalowanie w górę w celu spełnienia nowego obciążenia, ale prawdopodobnie nie może wykonać go w ciągu sekundy, więc niektóre żądania otrzymają kod odpowiedzi 429.
W następnych sekcjach opisano konkretne przypadki dostosowywania limitów przydziału. Przechodzenie do analizy dokumentów: zwiększanie limitu żądań współbieżnych
Zwiększanie liczby transakcji na sekundę limitu żądań
Domyślnie liczba transakcji na sekundę jest ograniczona do 15 transakcji na sekundę dla zasobu analizy dokumentów. W przypadku warstwy cenowej Standardowa tę liczbę można zwiększyć. Przed przesłaniem żądania upewnij się, że znasz materiał w tej sekcji i zapoznasz się z tymi najlepszymi rozwiązaniami.
Zwiększenie limitu żądań współbieżnych nie ma bezpośredniego wpływu na koszty. Usługa Analizy dokumentów używa modelu "Płatność tylko za to, czego używasz". Limit określa, jak wysoko usługa może skalować przed rozpoczęciem ograniczania żądań.
Istniejąca wartość parametru limitu żądań współbieżnych nie jest widoczna za pośrednictwem witryny Azure Portal, narzędzi wiersza polecenia ani żądań interfejsu API. Aby sprawdzić aktualną wartość, utwórz wniosek o pomoc techniczną platformy Azure.
Jeśli chcesz zwiększyć liczbę transakcji na sekundę, możesz włączyć automatyczne skalowanie zasobu. Postępuj zgodnie z tym dokumentem, aby włączyć automatyczne skalowanie zasobu * włączanie automatycznego skalowania. Możesz również przesłać wniosek o pomoc techniczną modułu TPS.
Przygotuj wymagane informacje
Identyfikator zasobu analizy dokumentów
Region (Region)
Podstawowe informacje o modelu:
- Zaloguj się do witryny Azure Portal.
- Wybierz zasób analizy dokumentów, dla którego chcesz zwiększyć limit transakcji
- Wybierz pozycję -Properties- (-Resource Management- group)
- Skopiuj i zapisz wartości następujących pól:
- Identyfikator zasobu
- Lokalizacja (region punktu końcowego)
Tworzenie i przesyłanie wniosku o pomoc techniczną
Zainicjuj zwiększenie limitu transakcji na sekundę (TPS) dla zasobu, przesyłając wniosek o pomoc techniczną:
- Upewnij się, że masz wymagane informacje
- Zaloguj się do witryny Azure Portal.
- Wybierz zasób analizy dokumentów, dla którego chcesz zwiększyć limit TPS
- Wybierz pozycję -New support request- (-Support + troubleshooting- group) (Nowa prośba o pomoc techniczną — grupa rozwiązywania problemów). Zostanie wyświetlone nowe okno z automatycznie wypełnionymi informacjami o subskrypcji platformy Azure i zasobie platformy Azure
- Wprowadź -Summary - (na przykład "Zwiększ limit tpS analizy dokumentów")
- W polu Typ problemu wybierz pozycję "Weryfikacja przydziału lub użycia".
- Wybierz pozycję -Next: Solutions- (Dalej: rozwiązania)
- Kontynuuj tworzenie żądania
- Wprowadź następujące informacje w polu -Description- na karcie Szczegóły:
- zwróć uwagę, że żądanie dotyczy limitu przydziału analizy dokumentów.
- Podaj oczekiwania tpS, które chcesz skalować, aby spełnić.
- Zebrane informacje o zasobach platformy Azure.
- Wypełnij wprowadzanie wymaganych informacji i wybierz przycisk -Create- (Utwórz) na karcie -Review + create- (Przeglądanie i tworzenie)
- Zanotuj numer wniosku o pomoc techniczną w powiadomieniach z witryny Azure Portal. Poszukaj pomocy technicznej, aby wkrótce skontaktować się z Tobą w celu dalszego przetwarzania.
Przykład najlepszych rozwiązań dotyczących wzorca obciążenia
W tym przykładzie przedstawiono podejście, które zalecamy, aby zminimalizować możliwe ograniczanie żądań z powodu trwającego skalowania automatycznego. Nie jest to dokładny przepis, ale tylko szablon, który zachęcamy do naśladowania i dostosowywania w razie potrzeby.
Załóżmy, że zasób analizy dokumentów ma ustawiony domyślny limit. Uruchom obciążenie, aby przesłać żądania analizy. Jeśli okaże się, że występuje częste ograniczanie przepustowości z kodem odpowiedzi 429, zacznij od zaimplementowania wykładniczego wycofywania w żądaniu analizy GET. Używając stopniowo dłuższego czasu oczekiwania między kolejnymi próbami odpowiedzi na błędy, na przykład wzorzec 2-5-13-34 opóźnień między żądaniami. Ogólnie rzecz biorąc, zalecamy, aby nie wywoływać odpowiedzi get analyze więcej niż raz co 2 sekundy dla odpowiedniego żądania POST.
Jeśli okaże się, że ograniczasz liczbę przesłanych żądań POST dla przesłanych dokumentów, rozważ dodanie opóźnienia między żądaniami. Jeśli obciążenie wymaga wyższego stopnia przetwarzania współbieżnego, należy utworzyć wniosek o pomoc techniczną, aby zwiększyć limity usług dla transakcji na sekundę.
Ogólnie rzecz biorąc, zalecamy przetestowanie obciążenia i wzorców obciążenia przed przejściem do środowiska produkcyjnego.