Ta zawartość dotyczy: v4.0 (GA) v3.1 (GA) v3.0 (GA) v2.1 (GA)
Azure AI Document Intelligence to oparta na chmurze usługa, która używa modeli uczenia maszynowego do wyodrębniania par klucz/wartość, tekstu i tabel z dokumentów. Zwrócony wynik jest danymi wyjściowymi ze strukturą JSON. Przypadki użycia analizy dokumentów obejmują zautomatyzowane przetwarzanie danych, ulepszone strategie oparte na danych i wzbogacone możliwości wyszukiwania dokumentów.
Omówienie
Czy usługa Azure AI Document Intelligence i Azure AI Form Recognizer są takie same?
Tak.
Usługa Azure AI Document Intelligence i Rozpoznawanie formularzy sztucznej inteligencji platformy Azure są tą samą usługą. Nazwa usługi została zmieniona z usługi Azure AI Form Recognizer na Azure AI Document Intelligence w lipcu 2023 r. Usługa zapewnia te same możliwości i funkcje, co przed zmianą nazwy.
Zmiany cen: nie ma żadnych zmian w cenach. Nazwy usług Cognitive Services i Applied AI Services nadal są używane w rozliczeniach platformy Azure, analizie kosztów, cennikach i interfejsach API cen.
Zmiany powodujące niezgodność: nie ma żadnych zmian powodujących niezgodność w interfejsach API ani bibliotekach klienckich.
Czy analiza dokumentów jest zintegrowana z innymi usługi firmy Microsoft?
Tak.
Analiza dokumentów integruje się z następującymi usługami:
Możliwości AI
Czy mogę używać analizy dokumentów z generowaniem sztucznej inteligencji do przetwarzania dokumentów?
Tak.
Możesz również użyć rozwiązania do generowania dokumentów sztucznej inteligencji do rozmowy z dokumentami (RAG), generowania urzekającej zawartości z tych dokumentów i uzyskiwania dostępu do modeli usługi Azure OpenAI Service na danych.
Dzięki połączeniu usługi Azure AI Document Intelligence i Azure OpenAI możesz utworzyć aplikację dla przedsiębiorstw w celu bezproblemowej interakcji z dokumentami przy użyciu języka naturalnego. Możesz łatwo znaleźć odpowiedzi, uzyskać cenne szczegółowe informacje oraz wygenerować nową i wciągającą zawartość z istniejących dokumentów.
Więcej szczegółów na temat wzorca generowania rozszerzonego pobierania można znaleźć tutaj.
Czy analiza dokumentów może pomóc w semantycznym fragmentowaniu w dokumentach na potrzeby generowania rozszerzonego pobierania?
Tak.
Analiza dokumentów umożliwia tworzenie bloków konstrukcyjnych w celu włączenia fragmentów semantycznych. Fragmentowanie semantyczne to kluczowy krok w zakresie pobierania rozszerzonej generacji (RAG) w celu zapewnienia gęstych fragmentów kontekstu i poprawy istotności.
Analiza dokumentów udostępnia model układu, który zapewnia wizualną dekompozycję dokumentu w wierszach, akapitach, sekcjach, nagłówkach i stopkach.
Następnie możesz pobrać wyniki w formacie markdown, aby dalej podzielić dokument na granice sekcji lub akapitu.
Aby uzyskać więcej informacji, zobacz omówienie programu RAG w usłudze Document Intelligence
Document Intelligence Studio
Czy potrzebuję określonych uprawnień dostępu do programu Document Intelligence Studio?
Tak.
Aby uzyskać dostęp do usługi Document Intelligence Studio, potrzebujesz aktywnego konta i subskrypcji platformy Azure z co najmniej rolą Czytelnik.
W przypadku analiz dokumentów i wstępnie utworzonych modeli poniżej przedstawiono wymagania dotyczące ról dla scenariuszy użytkownika:
Podstawowy
- Użytkownik usług Cognitive Services: ta rola jest potrzebna dla zasobu analizy dokumentów lub wielu usług Azure Cognitive Services do korzystania z narzędzia Document Intelligence Studio.
Zaawansowani
- Współautor: ta rola jest potrzebna do utworzenia grupy zasobów lub zasobu analizy dokumentów.
W przypadku niestandardowych projektów modelu poniżej przedstawiono wymagania dotyczące ról dla scenariuszy użytkownika:
Podstawowy
Użytkownik usług Cognitive Services: ta rola jest potrzebna dla zasobu analizy dokumentów lub wielu usług Cognitive Services w celu wytrenowania niestandardowego modelu lub analizy przy użyciu wytrenowanych modeli.
Współautor danych obiektu blob usługi Storage: ta rola jest potrzebna dla konta magazynu do tworzenia danych projektu i etykietowania.
Zaawansowani
Współautor konta magazynu: ta rola jest potrzebna dla konta magazynu w celu skonfigurowania ustawień współużytkowania zasobów między źródłami (CORS). Jest to jednorazowa próba ponownego użycia tego samego konta magazynu.
Współautor: ta rola jest potrzebna do utworzenia grupy zasobów i zasobów. Rola współautora lub współautora konta magazynu nie zapewnia dostępu do korzystania z zasobu analizy dokumentów ani konta magazynu, jeśli uwierzytelnianie lokalne (oparte na kluczach) jest wyłączone. Do korzystania z funkcji w narzędziu Document Intelligence Studio nadal potrzebne są podstawowe role (Współautor danych użytkownika i magazynu usług Cognitive Services).
Aby uzyskać więcej informacji, zobacz Wbudowane role firmy Microsoft i sekcje dotyczące przypisań ról platformy Azure w przewodniku Szybki start dotyczącym usługi Document Intelligence Studio.
Czy mogę przetwarzać dokumenty z więcej niż dwiema stronami w programie Document Intelligence Studio?
Tak, w przypadku zasobów warstwy płatnej.
Nie, w przypadku zasobów w warstwie Bezpłatna.
W przypadku zasobów warstwy bezpłatna (F0) tylko pierwsze dwie strony są analizowane niezależnie od tego, czy używasz programu Document Intelligence Studio, interfejsu API REST, czy bibliotek klienckich.
Jeśli chcesz analizować wszystkie strony w dokumencie, przejdź do zasobu płatnego (S0). W narzędziu Document Intelligence Studio wybierz przycisk Ustawienia (koło zębate), wybierz kartę Zasoby i sprawdź warstwę cenową, która ma być używana do analizowania dokumentów.
Czy mogę zmienić katalogi lub subskrypcje w programie Document Intelligence Studio?
Tak.
Aby zmienić katalog w programie Document Intelligence Studio, wybierz przycisk Ustawienia (koło zębate). W obszarze Katalog wybierz katalog z listy, a następnie wybierz pozycję Przełącz katalog. Zaloguj się ponownie po przełączeniu katalogu.
Aby zmienić subskrypcję lub zasób, przejdź do karty Zasób w obszarze Ustawienia.
Czy można używać programu Document Intelligence Studio z zasobem skonfigurowanym z zaporą lub siecią wirtualną?
Tak.
Jeśli zasób analizy dokumentów jest skonfigurowany z zaporą lub siecią wirtualną, musisz dodać dedykowany adres IP 20.3.165.95 do listy dozwolonych zapory dla zasobu analizy dokumentów. Niektóre funkcje w projektach niestandardowych (na przykład automatyczne etykietowanie, zarządzanie projektami i człowiek w pętli) nie działają, jeśli dostęp do sieci publicznej jest wyłączony.
Kiedy przekażę plik w usłudze Document Intelligence Studio za pomocą funkcji "Pobierz z adresu URL", czy mogę użyć adresu URL z magazynu obiektów blob?
Tak.
Jeśli adres URL usługi Azure Blob Storage zawiera token SAS i jest dostępny z sieci publicznych. Nie można użyć funkcji Fetch dla kont magazynu, w których dostęp do klucza jest wyłączony lub za zaporą/siecią wirtualną.
Czy mogę ponownie użyć lub dostosować środowisko etykietowania z programu Document Intelligence Studio i skompilować je we własnej aplikacji?
Tak.
Środowisko etykietowania z usługi Document Intelligence Studio jest typu open source w repozytorium Toolkit.
Czy istnieją oddzielne punkty końcowe adresu URL dla regionów suwerennej chmury analizy dokumentów?
Tak.
Program Document Intelligence Studio ma oddzielne punkty końcowe adresów URL dla regionów suwerennej chmury:
Adres URL chmury Azure US Government (Azure Fairfax): Document Intelligence Studio US Government.
Adres URL platformy Microsoft Azure obsługiwany przez firmę 21Vianet (Azure — Chiny): Document Intelligence Studio (Chiny).
Projektowanie aplikacji
Czy można tworzyć aplikacje przy użyciu analizy dokumentów sztucznej inteligencji platformy Azure przy użyciu najnowszych opcji programowania?
Tak.
Analiza dokumentów oferuje najnowsze opcje programowania na następujących platformach:
[INTERFEJS API REST](/rest/api/aiservices/document-models/analyze-document?view=rest-aiservices-2023-07-31 &preserve-view=true&tabs=HTTP)
Czy mogę zmigrować aplikację do najnowszej wersji analizy dokumentów?
Tak.
Poniższa tabela zawiera linki do szczegółowych instrukcji migracji do najnowszej wersji analizy dokumentów:
Język/interfejs API | Przewodnik migracji |
---|---|
Interfejs API REST | Wersja 3 |
C#/.NET | 4.0.0 |
Java | 4.0.0 |
JavaScript | 4.0.0 |
Python | 3.2.0 |
Czy mogę określić zakres stron do przeanalizowania w dokumencie?
Tak.
Użyj parametru (obsługiwanego pages
w wersji 2.1, 3.0 i nowszych wersjach interfejsu API REST) i określ strony dla wielu stron dokumentów PDF i TIFF. Zaakceptowane dane wejściowe obejmują następujące zakresy:
- Pojedyncze strony. Jeśli na przykład określisz
1, 2
wartość , przetwarzane są strony 1 i 2. - Zakresy skończone. Jeśli na przykład określisz
2-5
wartość , przetwarzane są strony od 2 do 5. - Zakresy otwarte. Jeśli na przykład określisz
5-
wartość , zostaną przetworzone wszystkie strony ze strony 5. Jeśli określisz-10
wartość , przetwarzane są strony od 1 do 10.
Te parametry można mieszać razem, a zakresy mogą się nakładać. Jeśli na przykład określisz -5, 1, 3, 5-10
wartość , przetwarzane są strony od 1 do 10.
Usługa akceptuje żądanie, jeśli może przetworzyć co najmniej jedną stronę dokumentu. Na przykład użycie w 5-100
pięciostronicowym dokumencie jest prawidłowym wejściem, co oznacza, że strona 5 jest przetwarzana.
Jeśli nie podasz zakresu stron, cały dokument zostanie przetworzony.
Czy zaleca się używanie narzędzia Document Intelligence Studio zamiast narzędzia do etykietowania przykładowego FOTT dla mojego projektu?
Tak.
Zalecamy program Document Intelligence Studio przez większość czasu, ponieważ może skrócić czas konfigurowania zasobów analizy dokumentów i usług magazynu.
Rozważ użycie narzędzia do testowania formularzy (FOTT) tylko w następujących scenariuszach:
Dane muszą pozostać na jednej maszynie. Użyj narzędzia do etykietowania przykładowego FOTT i kontenera analizy dokumentów.
Projekt jest bardzo zależny od analizy dokumentów w wersji 2.1 i chcesz nadal korzystać z interfejsów API w wersji 2.1.
Czy istnieją najlepsze rozwiązania w celu ograniczenia ograniczania przepustowości?
Tak.
Analiza dokumentów używa skalowania automatycznego w celu zapewnienia wymaganych zasobów obliczeniowych na żądanie, przy jednoczesnym zachowaniu niskich kosztów klientów. Aby ograniczyć ograniczanie przepustowości podczas skalowania automatycznego, zalecamy następujące podejście:
Zaimplementuj logikę ponawiania prób w aplikacji.
Jeśli okaże się, że ograniczasz liczbę żądań
POST
, rozważ dodanie opóźnienia między żądaniami.Stopniowo zwiększaj obciążenie. Unikaj ostrych zmian.
Utwórz wniosek o pomoc techniczną w celu zwiększenia limitu transakcji na sekundę (TPS).
Dowiedz się więcej o limitach przydziałów i limitach usługi analizy dokumentów.
Modele niestandardowe
Czy mogę poprawić szacowany wynik dokładności dla modelu niestandardowego?
Tak.
Wariancja w strukturze wizualnej dokumentów może mieć wpływ na dokładność modelu. Oto kilka wskazówek:
Uwzględnij wszystkie odmiany dokumentu w zestawie danych trenowania. Odmiany obejmują różne formaty; na przykład cyfrowe i zeskanowane pliki PDF.
Oddzielaj wizualnie różne typy dokumentów i trenuj różne modele.
Upewnij się, że nie masz etykiet nadmiarowych.
W przypadku etykietowania podpisów i regionów nie uwzględniaj otaczającego tekstu.
Aby uzyskać więcej informacji, zobacz Dokładność i współczynniki ufności.
Czy mogę ponownie wytrenować model niestandardowy?
L.p.
Analiza dokumentów nie ma jawnej operacji ponownego trenowania. Każda operacja trenowania generuje nowy model.
Jeśli okaże się, że model musi ponownie trenować, możesz dodać więcej przykładów do zestawu danych szkoleniowych i wytrenować nowy model.
Możesz również utworzyć nowy model do utworzenia przy użyciu oryginalnego modelu w następujący sposób:
Utwórz zestaw danych dla nowego szablonu.
Oznaczanie i trenowanie nowego modelu.
Sprawdź, czy nowy model działa dobrze dla określonych typów dokumentów.
Utwórz nowy model przy użyciu istniejącego modelu w jednym punkcie końcowym. Analiza dokumentów może następnie określić najlepszy model dla każdego dokumentu do przeanalizowania.
Aby uzyskać więcej informacji, zobacz komponowane modele.
Czy mogę przenieść wytrenowane modele z jednego środowiska (na przykład beta) do innego (na przykład produkcyjnego)?
Tak.
Interfejs API kopiowania umożliwia kopiowanie modeli niestandardowych z jednego konta analizy dokumentów do innych, które istnieją w dowolnym obsługiwanym regionie geograficznym. Aby uzyskać szczegółowe instrukcje, zobacz Odzyskiwanie po awarii.
Operacja kopiowania jest ograniczona do kopiowania modeli w określonym środowisku chmury, w którym wytrenujesz model. Na przykład kopiowanie modeli z chmury publicznej do chmury Azure Government nie jest obsługiwane.
Czy opłaty są naliczane podczas trenowania modeli niestandardowych?
Tak.
W przypadku v4.0 11-30-2024 (GA)
niestandardowych modeli neuronowych można wytrenować bezpłatnie przez maksymalnie 10 godzin. Niezależnie od tego, czy trenujesz pojedynczy model przez 10 godzin, czy trenujesz wiele modeli w sumie 10 godzin, nie są naliczane opłaty za pierwsze 10 godzin. Po skorzystaniu z bezpłatnej 10 godzin opłaty są naliczane automatycznie przez dodatkową godzinę szkolenia. Aby uzyskać szczegółowe informacje na temat cen, zapoznaj się ze stroną cennika. Ta nowa funkcja płatnego szkolenia umożliwia trenowanie modeli przez dłuższy czas trwania w celu przetwarzania większych dokumentów. Aby uzyskać więcej informacji na temat tej płatnej funkcji trenowania, zobacz sekcję rozliczeń niestandardowego modelu neuronowego.
W przypadku programu v3.0 2022-08-31
lub v3.1 2023-07-31
niestandardowe modele neuronowe można trenować bezpłatnie przez maksymalnie 20 sesji treningowych, a każda sesja jest ograniczona do 30 minut trwania trenowania. Po użyciu wszystkich 20 sesji szkoleniowych możesz przesłać bilet pomoc techniczna platformy Azure, aby zwiększyć limit sesji treningowej. Aby zwiększyć limit, dwie sesje szkoleniowe są uważane za jedną godzinę trenowania i naliczane są opłaty za dwie sesje /jedną godzinę trenowania. Aby uzyskać szczegółowe informacje na temat cen, zobacz [stronę cennika]. Aby uzyskać więcej informacji na temat sposobów zwiększenia limitu, zobacz sekcję rozliczeń niestandardowego modelu neuronowego. Funkcja płatnego szkolenia i v3.0
i v3.1
jest niedostępna. Płatna funkcja trenowania dla niestandardowego modelu neuronowego jest dostępna tylko w systemie v4.0
.
Konto magazynu
Czy istnieje czas wygaśnięcia tokenu sygnatury dostępu współdzielonego (SAS) dla uwierzytelniania konta magazynu?
Tak.
Podczas tworzenia sygnatury dostępu współdzielonego (SAS) domyślny czas trwania wynosi 48 godzin. Po 48 godzinach należy utworzyć nowy token.
Rozważ ustawienie dłuższego okresu trwania dla czasu, przez który używasz konta magazynu z analizą dokumentów.
Czy usługa Document Intelligence może uzyskać dostęp do danych na moim koncie magazynu, jeśli znajduje się za siecią wirtualną lub zaporą?
Nie, nie bezpośrednio.
Analiza dokumentów nie może uzyskać dostępu do konta magazynu, jeśli jest ona chroniona przez sieć wirtualną lub zaporę.
Jednak prywatne konto magazynu platformy Azure i uwierzytelnianie obsługują tożsamości zarządzane dla zasobów platformy Azure. W przypadku korzystania z tożsamości zarządzanej usługa Analizy dokumentów może uzyskiwać dostęp do konta magazynu przy użyciu przypisanych poświadczeń.
Jeśli zamierzasz analizować dane konta magazynu prywatnego przy użyciu protokołu FOTT, musisz wdrożyć narzędzie za siecią wirtualną lub zaporą.
Dowiedz się, jak utworzyć tożsamość zarządzaną i używać jej dla zasobu analizy dokumentów.
Kontenery
Czy istnieje różnica między odłączonym i połączonym kontenerem?
Tak.
Chociaż możliwości modelu są takie same w przypadku kontenerów połączonych i odłączonych, metody rozliczeń i łączności różnią się:
Połączone kontenery wysyłają informacje rozliczeniowe na platformę Azure przy użyciu zasobu analizy dokumentów na koncie platformy Azure. W przypadku połączonych kontenerów łączność z Internetem jest wymagana do wysyłania informacji rozliczeniowych na platformę Azure. Połączone kontenery analizy dokumentów wysyłają informacje rozliczeniowe na platformę Azure przy użyciu zasobu analizy dokumentów na koncie platformy Azure. Połączone kontenery nie wysyłają danych klientów, takich jak obraz lub tekst analizowany, do firmy Microsoft. Aby zapoznać się z przykładem informacji wysyłanych przez połączone kontenery do firmy Microsoft na potrzeby rozliczeń, zobacz Często zadawane pytania dotyczące kontenera usługi Azure AI.
Odłączone kontenery umożliwiają korzystanie z interfejsów API, które są odłączone od Internetu. Informacje o rozliczeniach nie są wysyłane za pośrednictwem Internetu. Zamiast tego opłaty są oparte na zakupionej warstwie zobowiązania. Obecnie rozłączone użycie kontenerów jest dostępne dla modeli niestandardowych i modeli faktur analizy dokumentów.
Czy mogę użyć magazynu lokalnego dla kontenera narzędzia do etykietowania przykładowego analizy dokumentów (FOTT)?
Tak.
FOTT ma wersję, która używa magazynu lokalnego. Wersja musi być zainstalowana na maszynie z systemem Windows. Można go zainstalować z tej lokalizacji.
Na stronie projektu określ identyfikator URI folderu etykiety jako /shared lub /shared/sub-dir, jeśli pliki etykietowania znajdują się w podkatalogu. Wszystkie inne zachowanie narzędzia do etykietowania przykładowego analizy dokumentów są takie same jak hostowana usługa.
Czy istnieje najlepsze rozwiązanie do skalowania w górę?
Tak.
W przypadku wywołań asynchronicznych można uruchomić wiele kontenerów z udostępnionym magazynem. Kontener, który przetwarza POST
wywołanie analizy, przechowuje dane wyjściowe w magazynie. Następnie każdy inny kontener może pobrać wyniki z magazynu i obsłużyć GET
wywołania. Identyfikator żądania nie jest powiązany z kontenerem.
W przypadku wywołań synchronicznych można uruchomić wiele kontenerów, ale tylko jeden kontener obsługuje żądanie. Ponieważ jest to wywołanie blokujące, każdy kontener z puli może obsłużyć żądanie i wysłać odpowiedź. W tym miejscu tylko jeden kontener jest powiązany z żądaniem jednocześnie i nie jest wymagane żadne sondowanie.
Czy mogę skonfigurować kontenery z udostępnionym magazynem?
Tak.
Kontenery używają Mounts: Shared
właściwości podczas uruchamiania w celu określenia magazynu udostępnionego do przechowywania plików przetwarzania. Aby zapoznać się z użyciem tej właściwości, zapoznaj się z dokumentacją kontenerów.
Zabezpieczenia i prywatność
Czy analiza dokumentów przechowuje moje dane?
Tak, krótko.
W przypadku wszystkich funkcji analiza dokumentów tymczasowo przechowuje dane i wyniki w usłudze Azure Storage w tym samym regionie co żądanie. Dane są następnie usuwane w ciągu 24 godzin od momentu przesłania żądania analizy.
Dowiedz się więcej na temat danych, prywatności i zabezpieczeń analizy dokumentów.
W przypadku wytrenowanych modeli niestandardowych tymczasowe dane wyjściowe po analizie i etykietowaniu są przechowywane w tej samej lokalizacji usługi Azure Storage, w której są przechowywane dane szkoleniowe. Wytrenowane modele niestandardowe są przechowywane w usłudze Azure Storage w tym samym regionie i są logicznie izolowane przy użyciu poświadczeń subskrypcji i interfejsu API platformy Azure.
Więcej pomocy i pomocy technicznej
Czy istnieją inne zasoby umożliwiające udostępnienie rozwiązań pytań dotyczących analizy dokumentów sztucznej inteligencji platformy Azure?
Tak.
Microsoft Q & A jest domem dla pytań technicznych i odpowiedzi w firmie Microsoft. Zapytania specyficzne dla analizy dokumentów można filtrować.
Czy mogę przekazać bezpośrednią opinię, jeśli usługa nie rozpoznaje określonego tekstu lub rozpoznaje go niepoprawnie podczas etykietowania dokumentów?
Tak.
Stale aktualizujemy i ulepszamy modele analizy dokumentów. Możesz wysłać wiadomość e-mail do zespołu ds. analizy dokumentów. Jeśli to możliwe, udostępnij przykładowy dokument z wyróżnionym problemem.