Neuerungen in Azure KI Dokument Intelligenz
Dieser Inhalt gilt für: Version 4.0 (GA) Version 3.1 (GA) Version 3.0 (GA) Version 2.1 (GA)
Der Dokument Intelligenz-Dienst wird fortlaufend aktualisiert. Speichern Sie ein Lesezeichen für diese Seite, um bei Versionshinweisen, Verbesserungen von Features und unserer aktuellen Dokumentation auf dem neuesten Stand zu bleiben.
Wichtig
API-Vorschauversionen werden zurückgegeben, sobald die GA-API eingeführt wird. Die API-Version „2023-02-28-preview“ wird eingestellt. Wenn Sie die API-Vorschauversion oder die zugehörigen SDK-Versionen weiterhin verwenden, aktualisieren Sie Ihren Code auf die aktuelle API-Version 2024-11-30 (GA)
.
Dezember 2024
Document Intelligence v4.0-Programmiersprachen-SDKs sind jetzt allgemein verfügbar (GA)!
Die neuesten Clientbibliotheken weisen standardmäßig die [REST-API-Version 2024-11-30 (GA)](/rest/api/aiservices/operation-groups?view=rest-aiservices-v4.0%20(2024-11-30&preserve-view=true) des Diensts auf.
Weitere Informationen finden Sie in Clientbibliotheken für die folgenden unterstützten Programmiersprachen:
November 2024
Document Intelligence REST API v4.0: 2024-11-30 REST API (GA) ist jetzt allgemein verfügbar (GA)! Die REST-API v4.0 enthält die folgenden Änderungen:
-
- Die Batch-API unterstützt jetzt alle Modelle, einschließlich aller Lese-, Layout-, vordefinierten Sektoren- und benutzerdefinierten Modelle.
- Die Batch-API unterstützt die LIST-Funktion, damit Benutzer Batchaufträge innerhalb der letzten sieben Tage auflisten können.
- Die Batch-API unterstützt die DELETE-Funktion zum expliziten Löschen des Batchauftrags für DSGVO- und Datenschutzcompliance.
- GetAnalyzeBatchResult unterstützt resultId als Reaktion auf LIST aller resultIds.
🆕 Durchsuchbare PDF. Das vorgefertigte Lese-Modell unterstützt jetzt Bilderformate (JPEG/JPG, PNG, BMP, TIFF, HEIF) und Spracherweiterung, um Chinesisch, Japanisch und Koreanisch für PDF-Ausgabe einzuschließen.
Benutzerdefiniertes Klassifizierungsmodell
- Das benutzerdefinierte Klassifizierungsmodell unterstützt inkrementelles Training. Sie können vorhandenen Klassen neue Beispiele hinzufügen oder neue Klassen hinzufügen, indem Sie auf einen vorhandenen Klassifizierer verweisen.
- Mit v4.0 teil das benutzerdefinierte Klassifizierungsmodell Dokumente während der Analyse nicht standardmäßig auf. Sie müssen die Eigenschaft „splitMode” explizit auf „automatisch“ festlegen, um das ältere Verhalten beizubehalten.
- Das benutzerdefinierte Klassifizierungsmodell unterstützt jetzt 25.000 Seiten als neue Begrenzung der Trainingsseite.
Benutzerdefiniertes neuronales Modell
- Das benutzerdefinierte neurale Modell unterstützt jetzt die Signaturerkennung.
- Benutzerdefinierte neuronale Modelle unterstützen das kostenpflichtige Training länger, wenn Sie ein Modell mit einem größeren beschrifteten Dataset trainieren müssen. Die ersten 20 Trainingsausführungen in einem Kalendermonat sind weiterhin kostenlos. Alle Trainingsvorgänge nach den ersten 20 Trainingsausführungen sind kostenpflichtig. Weitere Informationen finden Sie unter Abrechnung.
-
- Das US-Kontoauszugsmodell unterstützt jetzt die Schecktabellenextraktion.
-
- Unterstützt die Extraktion der Signatur des Zahlers
Modell für Hypothekendokumente
- Das Hypothekenmodell unterstützt jetzt die Signaturerkennung für die Formulare 1003, 1004, 1005 und Offenlegung des Abschlusses.
-
- Das Belegmodell unterstützt jetzt weitere Felder wie ReceiptType, Steuersatz, CountryRegion, Nettobetrag und Beschreibung.
-
- Neue vorgefertigte Steuermodelle für 1095A, 1095C, 1099SSA und W4 hinzugefügt.
Die v4.0-API enthält kumulative Updates aus Vorschauversionen, wie aufgeführt:
August 2024
Die REST-API für Dokument Intelligenz 2024-07-31-preview ist jetzt verfügbar. Mit der API v3.1 werden neue und aktualisierte Funktionen eingeführt:
Die Public Preview 2024-07-31-preview ist derzeit nur in den folgenden Azure-Regionen verfügbar. Das neue Extraktionsmodell für Dokumentfelder im Azure KI Foundry-Portal ist lediglich in der Region „USA, Norden-Mitte“ verfügbar:
USA, Osten
USA, Westen 2
Europa, Westen
USA Nord Mitte
🆕 Modellzusammensetzung mit benutzerdefinierten Klassifizierern
- Dokument Intelligenz unterstützt jetzt das Erstellen eines Modells mit einem expliziten benutzerdefinierten Klassifizierungsmodell. Erfahren Sie mehr über die Vorteile bei der Verwendung der neuen Erstellungsfunktion.
Benutzerdefiniertes Klassifizierungsmodell
- Das benutzerdefinierte Klassifizierungsmodell unterstützt jetzt auch die direkte Aktualisierung des Modells.
- Das benutzerdefinierte Klassifizierungsmodell unterstützt jetzt den Modellkopievorgang, um die Sicherung und Notfallwiederherstellung zu ermöglichen.
- Das benutzerdefinierte Klassifizierungsmodell unterstützt jetzt die explizite Angabe von Seiten, die aus einem Eingabedokument klassifiziert werden sollen.
🆕 Modell für Hypothekendokumente
- Extrahieren von Informationen aus Appraisal (Formular 1004)
- Extrahieren von Informationen aus Validation of Employment (Formular 1005).
-
- Extrahieren von Zahlungsempfängern, Betrag, Datum und anderen relevanten Informationen aus Schecks
-
- Neues vordefiniertes Modell zur Verarbeitung von Lohnabrechnungen, um Löhne, Stunden, Abzüge, Nettolohn und mehr zu extrahieren
-
- Neues vordefiniertes Modell zum Extrahieren von Kontoinformationen, einschließlich Start- und Endguthaben und Transaktionsdetails aus Kontoauszügen
-
- Neues einheitliches US-Steuermodell, das aus Formularen wie W-2, 1098, 1099 und 1040 extrahieren kann
🆕 Durchsuchbare PDF. Das vordefinierte Lesemodell unterstützt jetzt die PDF-Ausgabe zum Herunterladen von PDF-Dateien mit eingebettetem Text aus Extraktionsergebnissen, sodass eine PDF in Szenarien wie beim Suchen und Kopieren von Inhalt verwendet werden kann.
Das Layoutmodell unterstützt jetzt die verbesserte Abbildungserkennung, in der Abbildungen aus Dokumenten jetzt als Bilddatei heruntergeladen werden können, die für weiteres Abbildungsverständnis verwendet werden können. Das Layoutmodell bietet außerdem Verbesserungen am OCR-Modell für gescannten Text speziell für einzelne Zeichen, Text in Feldern und Dokumente mit dichtem Text.
-
- Die Dokumentintelligenz unterstützt jetzt Batchanalysevorgänge, also die Analyse einer Gruppe von Dokumenten. Dies vereinfacht die Nutzung für Entwickler und verbessert die Effizienz.
-
- Abfragefelder Die KI-Qualität der Extraktion wird mit dem neuesten Modell verbessert.
Mai 2024
Dokument Intelligenz Studio fügt Unterstützung für die Microsoft Entra-Authentifizierung (früher Azure Active Directory) hinzu. Weitere Informationen finden Sie unter Authentifizierung in Dokument Intelligenz Studio.
Februar 2024
Die REST-API für Dokument Intelligenz 2024-07-31-preview ist jetzt verfügbar. Mit der API v3.1 werden neue und aktualisierte Funktionen eingeführt:
Die Public Preview 2024-07-31-preview ist derzeit nur in den folgenden Azure-Regionen verfügbar:
- USA, Osten
- USA, Westen 2
- Europa, Westen
Das Layoutmodell unterstützt jetzt die Abbildungserkennung und die Analyse der hierarchischen Dokumentstruktur (Abschnitte und Unterabschnitte). Die KI-Qualität der Lesereihenfolge und der Erkennung logischer Rollen wurde ebenfalls verbessert.
Benutzerdefinierte Extraktionsmodelle
- Benutzerdefinierte Extraktionsmodelle unterstützen jetzt die Konfidenzbewertungen auf Zellen-, Zeilen- und Tabellenebene. Erfahren Sie mehr über die Tabellen-, Zeilen- und Zellvertrauenssicherheit.
- Benutzerdefinierte Extraktionsmodelle verfügen über VERBESSERUNGEN der KI-Qualität für die Feldextraktion.
- Das benutzerdefinierte Vorlagenextraktionsmodell unterstützt jetzt das Extrahieren überlappender Felder. Erfahren Sie mehr überlappende Felder und derenVerwendung.
Benutzerdefiniertes Klassifizierungsmodell
- Benutzerdefiniertes Klassifizierungsmodell unterstützt jetzt inkrementelle Schulung für Szenarien, in denen Sie das Klassifizierermodell mit zusätzlichen Beispielen oder Klassen aktualisieren müssen. Erfahren Sie mehr über inkrementelle Sicherungen.
- Benutzerdefiniertes Klassifizierungsmodell bietet Unterstützung für Office-Dokumenttypen (.docx, .pptx und .xls). Erfahren Sie mehr über die Unterstützungerweiterter Dokumenttypen.
-
- Unterstützung für das neue Gebietsschema:
Gebietsschema Code Arabisch ( ar
)Bulgarisch ( bg
)Griechisch ( el
)Hebräisch ( he
)Mazedonisch ( mk
)Russisch ( ru
)Serbisch Kyrillisch ( sr-cyrl
)Ukrainisch ( uk
)Thailändisch ( th
)Türkisch ( tr
)Vietnamesisch ( vi
)- Unterstützung für neue Währungscodes:
Währung Gebietsschema Code BAM
Bosnische Konvertierbare Mark ( ba
)BGN
Bulgarischer Lew ( bg
)ILS
Israelischer Schekel ( il
)MKD
Mazedonischer Denar ( mk
)RUB
Russischer Rubel ( ru
)THB
Thailändischer Baht ( th
)TRY
Türkische Lira ( tr
)UAH
Ukrainische Hrywnja ( ua
)VND
Vietnamesischer Dong ( vn
)- Steuerartikel unterstützen Expansion für Deutschland (
de
), Spanien (es
),Portugal (pt
), Englisch Kanada (en-CA
).
-
- Erweiterte Feldunterstützung für IDs und Führerscheine der Europäischen Union.
-
- Extrahieren von Informationen aus dem „Uniform Residential Loan Application“ (Formular 1003).
- Extrahieren Sie Informationen aus dem „Uniform Underwriting and Transmittal Summary“ oder dem Formular 1008.
- Extrahieren Sie Informationen aus der Offenlegung von Hypothekenabschluss.
-
- Extrahieren Sie Informationen aus Bankkarten.
-
- Neue Vorbauung, um Informationen aus Ehescheinen zu extrahieren.
Dezember 2023
Die Document Intelligence-Clientbibliotheken für die REST-API 2023-10-31-preview sind jetzt zur Verwendung verfügbar.
November 2023
Die Rest-API für Document Intelligence 2023-10-31-preview ist jetzt verfügbar. Mit der API v3.1 werden neue und aktualisierte Funktionen eingeführt:
Öffentliche Vorschauversion Preview 31.10.2023 ist derzeit nur in den folgenden Azure-Regionen verfügbar:
- USA, Osten
- USA, Westen 2
- Europa, Westen
-
- Spracherweiterung für Handschrift: Russisch(
ru
), Arabisch(ar
), Thai(th
). - Konformität mit der Cyber-Executive Order (EO)
- Spracherweiterung für Handschrift: Russisch(
-
- Unterstützen Sie Office- und HTML-Dateien.
- Markdown-Ausgabeunterstützung.
- Verbesserungen bei der Erkennung von Tabellenüberschriften, Lesereihenfolge und Abschnittsüberschriften.
- Ab Dokument Intelligenz 2023-10-31-preview ist das allgemeine Dokumentmodell (vorkonfiguriertes Dokument) veraltet. Um Schlüssel-Wert-Paare aus Dokumenten zu extrahieren, verwenden Sie das
prebuilt-layout
Modell mit aktiviertem optionalen Abfragezeichenfolgenparameterfeatures=keyValuePairs
.
-
- Extrahiert jetzt Währung für alle preisbezogenen Felder.
Krankenversicherungskartenmodell
- Neue Feldunterstützung für Medicare- und Medicaid-Informationen.
-
- W-1099-Steuermodell. Unterstützt das 1099 Grundformular und die folgenden Varianten: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
-
- Unterstützung für das Feld
KVK
- Unterstützung für das Feld
BPAY
- Zahlreiche Feldoptimierungen.
- Unterstützung für das Feld
Benutzerdefinierte Klassifizierung
- Unterstützung für mehrsprachige Dokumente.
- Neue Optionen zum Teilen von Seiten: automatische Teilung, immer nach Seite geteilt, keine Teilung.
-
- Abfragefelder sind ab der
2023-10-31-preview
-Version verfügbar. - Add-On-Funktionen sind in allen Modellen mit Ausnahme des Lesemodells verfügbar.
- Abfragefelder sind ab der
Hinweis
Mit der GA-Veröffentlichung (General Availability) der API 2022-08-31 sind die zugehörigen Vorschau-APIs veraltet. Wenn Sie die API-Versionen „2021-09-30-preview“, „2022-01-30-preview“ oder „2022-06-30-preview“ verwenden, aktualisieren Sie Ihre Anwendungen auf die API-Version „2022-08-31“. Es gibt einige kleinere Änderungen. Weitere Informationen finden Sie im Migrationsleitfaden.
Juli 2023
Hinweis
Die Formularerkennung heißt jetzt Azure KI Dokument Intelligenz!
- Es gibt keine Änderungen an den Preisen.
- Die Namen Cognitive Services und Azure Applied AI werden in Abrechnungs-, Kostenanalyse-, Preislisten- und Preis-APIs von Azure weiterhin verwendet.
- Es gibt keine Breaking Changes an APIs (Anwendungsprogrammierschnittstellen) oder Clientbibliotheken.
- Einige Plattformen warten noch auf das Update mit der Umbenennung. Alle Erwähnung von Formularerkennung oder Document Intelligence in unserer Dokumentation beziehen sich auf denselben Azure-Dienst.
Dokument Intelligenz v3.1 (GA)
Die Dokument Intelligenz-API, Version 3.1, ist jetzt allgemein verfügbar! Die API-Version entspricht 2023-07-31
.
Mit der API v3.1 werden neue und aktualisierte Funktionen eingeführt:
- Document Intelligence-APIs sind jetzt modularer und bieten Unterstützung für optionale Features. Sie können die Ausgabe jetzt anpassen, um die Features, die Sie benötigen, gezielt einzuschließen. Erfahren Sie mehr über optionale Parameter.
- Dokumentklassifizierungs-API zum Aufteilen einer Datei in einzelne Dokumente. Erfahren Sie mehr über die Dokumentklassifizierung.
- Vordefiniertes Vertragsmodell.
- Vorgefertigtes Modell für das US-Steuerformular 1098.
- Unterstützung für Office-Dateitypen mit der Lese-API.
- Barcodeerkennung in Dokumenten.
- Add-On-Funktion für die Formelerkennung.
- Add-On-Funktion für die Schriftartenerkennung.
- Unterstützung für hochauflösende Dokumente.
- Benutzerdefinierte neuronale Modelle erfordern jetzt eine einzige beschriftete Stichprobe zum Trainieren.
- Spracherweiterung für benutzerdefinierte neuronale Modelle. Trainieren von neuronalen Modellen für Dokumente in 30 Sprachen. Die vollständige Liste unterstützter Sprachen finden Sie unter Sprachunterstützung.
- 🆕 Vordefiniertes Krankenversicherungskartenmodell.
- Erweiterung des Gebietsschemas des vordefinierten Rechnungsmodells.
- Vordefinierte Empfangsmodellsprache und Gebietsschemaerweiterung mit mehr als 100 unterstützten Sprachen.
- Das vordefinierte ID-Modell unterstützt jetzt europäische IDs.
Dokument Intelligenz Studio UX Updates
✔️ Analyseoptionen
Dokument Intelligenz unterstützt jetzt komplexere Analysefunktionen, und Studio bietet einen einzigen Einstiegspunkt (Schaltfläche „Analyseoptionen“) für die problemlose Konfiguration der Add-On-Funktionen.
Je nach Dokumentextraktionsszenario können Sie die Features für Analysebereich, Dokumentseitenbereich, optionale Erkennung und Premium-Erkennung konfigurieren.
Hinweis
Die Schriftartenextraktion wird in Dokument Intelligenz Studio nicht visualisiert. Sie können die Ergebnisse der Schriftarterkennung jedoch im Stilabschnitt der JSON-Ausgabe überprüfen.
✔️ Automatische Beschriftung von Dokumenten mit vordefinierten Modellen oder einem Ihrer eigenen Modelle
Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie Ihre Dokumente jetzt automatisch anhand eines der vordefinierten Modelle des Dokument Intelligenz-Diensts oder mithilfe der zuvor von Ihnen trainierten Modelle beschriften.
Bei einigen Dokumenten liegen nach der automatischen Beschriftung möglicherweise einige Beschriftungen doppelt vor. Stellen Sie sicher, dass Sie die Beschriftungen so ändern, dass auf der Beschriftungsseite keine doppelten Beschriftungen vorhanden sind.
✔️ Automatische Beschriftung von Tabellen
Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie jetzt die Tabellen im Dokument automatisch beschriften. Eine manuelle Beschriftung ist nicht erforderlich.
✔️ Direktes Hinzufügen von Testdateien zu Ihrem Trainingsdataset
Wenn Sie ein benutzerdefiniertes Extraktionsmodell trainieren, verbessern Sie die Modellqualität über die Testseite, indem Sie bei Bedarf Testdokumente in das Trainingsdataset hochladen.
Wenn für einige Beschriftungen ein niedriger Konfidenzwert zurückgegeben wird, stellen Sie sicher, dass Ihre Beschriftungen korrekt sind. Fügen Sie sie andernfalls dem Trainingsdataset hinzu, und beschriften Sie sie neu, um die Modellqualität zu verbessern.
✔️ Verwenden der Dokumentlistenoptionen und -filter in benutzerdefinierten Projekten
Verwenden Sie die Beschriftungsseite des benutzerdefinierten Extraktionsmodells. Sie können jetzt ganz einfach durch Ihre Schulungsdokumente navigieren, indem Sie die Suchfunktion verwenden, filtern und sortieren.
Verwenden Sie die Rasteransicht, um Dokumente in der Vorschau anzuzeigen, oder verwenden Sie die Listenansicht, um einfacher durch die Dokumente zu scrollen.
✔️ Projektfreigabe
- Geben Sie mühelos benutzerdefinierte Extraktionsprojekte frei. Weitere Informationen finden Sie unter Projektfreigabe mit benutzerdefinierten Modellen.
Mai 2023
Einführung einer aktualisierten Dokumentation für Build 2023
🆕 Die Übersicht über Dokument Intelligenz verfügt über eine verbesserte Navigation, strukturierte Zugriffspunkte und verbesserte Bilder.
🆕 Wählen Sie ein Dokument Intelligenz-Modell aus, um die beste Dokument Intelligenz-Lösung für Ihre Projekte und Workflows auszuwählen.
April 2023
Ankündigung der neuesten öffentlichen Vorschauversion der Dokument Intelligenz-Clientbibliothek
Die Document Intelligence-REST-API, Version 2023-02-28-preview, unterstützt die Clientbibliotheken des öffentlichen Vorschaurelease. Dieses Release enthält die folgenden neuen Features und Funktionen, die für .NET/C# (4.1.0-beta-1)-, Java (4.1.0-beta-1)-, JavaScript (4.1.0-beta-1)- und Python (3.3.0b.1)-Clientbibliotheken verfügbar sind:
Weitere Informationen finden Sie unter Dokument Intelligenz-SDK (Public Preview) und Versionshinweise vom März 2023.
März 2023
Wichtig
2023-02-28-preview
-Funktionen sind derzeit nur in den folgenden Regionen verfügbar:
- Europa, Westen
- USA, Westen 2
- East US
- Das benutzerdefinierte Klassifizierungsmodell ist eine neue Funktionalität in der Dokument Intelligenz und ab der
2023-02-28-preview
-API verfügbar. - Funktionen der Abfragefelder, die dem allgemeinen Dokumentmodell hinzugefügt wurden, verwenden Azure OpenAI-Modelle, um bestimmte Felder aus Dokumenten zu extrahieren. Probieren Sie das Feature Allgemeine Dokumente mit Abfragefeldern mit Dokument Intelligenz Studio aus. Abfragefelder sind derzeit nur für Ressourcen in der Region
East US
aktiv. - Add-On-Funktionen:
- Die Schriftextraktion wird jetzt mit der
2023-02-28-preview
-API erkannt. - Die Formelextraktion wird jetzt mit der
2023-02-28-preview
-API erkannt. - Die Extraktion mit hoher Auflösung wird jetzt mit der
2023-02-28-preview
-API erkannt.
- Die Schriftextraktion wird jetzt mit der
- Updates für benutzerdefinierte Extraktionsmodelle:
- Das benutzerdefinierte neuronale Modell unterstützt jetzt zusätzliche Sprachen für Training und Analyse. Trainieren Sie neuronale Modelle für Niederländisch, Französisch, Deutsch, Italienisch und Spanisch.
- Das benutzerdefinierte Vorlagenmodell verfügt jetzt über eine verbesserte Funktionalität zur Signaturerkennung.
- Document Intelligence Studio-Updates:
- Zusätzlich zur Unterstützung für alle neuen Features wie Klassifizierung und Abfragefelder ermöglicht Studio jetzt die Projektfreigabe für benutzerdefinierte Modellprojekte.
- Neue Modellzugänge in der beschränkten Vorschauversion: Impfkarten, Verträge, US-Steuerformular 1098, US-Steuerformular 1098-E und US-Steuerformular 1098-T. Füllen Sie das Formular zum Anfordern einer privaten Vorschau von Dokument Intelligenz aus, und übermitteln Sie es, um Zugriff auf zugriffsbeschränkte Vorschaumodelle anzufordern.
- Updates für Belegmodelle:
- Dank des Belegmodells profitieren Sie von Unterstützung für thermische Quittungen.
- Das Belegmodell bietet jetzt Unterstützung für 18 Sprachen und drei Sprachdialekte (Englisch, Französisch, Portugiesisch).
- Das Belegmodell unterstützt jetzt die
TaxDetails
-Extraktion.
- Das Layoutmodell verfügt jetzt über eine verbesserte Tabellenerkennung.
- Beim Modell „Lesen“ wurde die Erkennung einstelliger Zeichen verbessert.
Februar 2023
Ausgewählte Azure Dokument Intelligenz-Container für v3.0 stehen jetzt zur Verfügung!
Derzeit sind die Container Lesen v3.0 und Layout v3.0 verfügbar.
Weitere Informationen finden Sie unter Installieren und Ausführen von Dokument Intelligenz-Containern.
Januar 2023
Vordefiniertes Belegmodell – hinzugefügte Sprachen werden unterstützt. Das Belegmodell unterstützt jetzt diese hinzugefügten Sprachen und Gebietsschemas
- Japanisch – Japan (ja-JP)
- Französisch – Kanada (fr-CA)
- Niederländisch – Niederlande (nl-NL)
- Englisch – Vereinigte Arabische Emirate (en-AE)
- Portugiesisch – Brasilien (pt-BR)
Vordefiniertes Rechnungsmodell – hinzugefügte Sprachen werden unterstützt. Das Rechnungsmodell unterstützt jetzt diese hinzugefügten Sprachen und Gebietsschemas
- Englisch – USA (en-US), Australien (en-AU), Kanada (en-CA), Vereinigtes Königreich (en-GB), Indien (en-IN)
- Spanisch – Spanien (es-ES)
- Französisch – Frankreich (fr-FR)
- Italienisch – Italien (it-IT)
- Portugiesisch – Portugal (pt-PT)
- Niederländisch – Niederlande (nl-NL)
Vordefiniertes Rechnungsmodell – hinzugefügte Felder werden erkannt. Das Rechnungsmodell erkennt nun diese hinzugefügten Felder
- Currency code
- Zahlungsoptionen
- Gesamtrabatt
- Steuerposten (nur en-IN)
Vordefiniertes ID-Modell – hinzugefügte Dokumenttypen werden unterstützt. Das ID-Modell unterstützt jetzt diese hinzugefügten Dokumenttypen
- US-Militär-ID
Tipp
Alle Updates vom Januar 2023 sind mit der REST-API-Version 2022-08-31 (GA) verfügbar.
Vordefiniertes Belegmodell – zusätzliche Sprachunterstützung:
Das vordefinierte Belegmodell unterstützt jetzt die folgenden Sprachen:
- Englisch – Vereinigte Arabische Emirate (en-AE)
- Niederländisch – Niederlande (nl-NL)
- Französisch – Kanada (fr-CA)
- Deutsch – (de-DE)
- Italienisch – (it-IT)
- Japanisch – Japan (ja-JP)
- Portugiesisch – Brasilien (pt-BR)
Vordefiniertes Rechnungsmodell – zusätzliche Sprachunterstützung und Feldextraktionen
Das vordefinierte Rechnungsmodell unterstützt jetzt die folgenden Sprachen:
- Englisch – Australien (en-AU), Kanada (en-CA), Vereinigtes Königreich (en-UK), Indien (en-IN)
- Portugiesisch – Brasilien (pt-BR)
Das vordefinierte Rechnungsmodell unterstützt jetzt die folgenden Feldextraktionen:
- Currency code
- Zahlungsoptionen
- Gesamtrabatt
- Steuerposten (nur en-IN)
Vordefiniertes Ausweisdokumentmodell – Unterstützung zusätzlicher Dokumenttypen
Das vordefinierte Ausweisdokumentmodell unterstützt jetzt die folgenden Dokumenttypen:
- Führerscheinerweiterung für Indien, Kanada, Vereinigtes Königreich und Australien
- US-Militärausweise und -Ausweisdokumente
- Indische Personalausweise und Ausweisdokumente (PAN und Aadhaar)
- Australische Personalausweise und Ausweisdokumente (Fotokarte, Schlüsselpass-ID)
- Kanada Personalausweise und Ausweisdokumente (Personalausweis, Maple-Karte)
- Personalausweise und Ausweisdokumente des Vereinigten Königreichs (nationaler/regionaler Personalausweis)
Dezember 2022
Dokument Intelligenz Studio-Updates
Die Document Intelligence Studio-Version vom Dezember enthält die neuesten Updates für Dokument Intelligenz Studio. Es gibt erhebliche Verbesserungen an der Benutzeroberfläche, vor allem bei der Unterstützung benutzerdefinierter Modellbezeichnungen.
Seitenbereich: Studio unterstützt jetzt die Analyse von angegebenen Seiten aus einem Dokument.
Benutzerdefinierte Modellbezeichnungen:
Automatisches Ausführen der Layout-API: Sie können die Layout-API während des Setupprozesses für ein benutzerdefiniertes Modell automatisch für alle Dokumente in Ihrem Blobspeicher ausführen.
Suchen Studio bietet jetzt Suchfunktionen zum Suchen von Wörtern in einem Dokument. Diese Verbesserung ermöglicht eine einfachere Navigation während der Bezeichnung.
Navigation: Sie können Bezeichnungen für beschriftete Wörter in einem Dokument auswählen.
Automatische Tabellenbezeichnung: Nachdem Sie das Tabellensymbol in einem Dokument ausgewählt haben, können Sie die extrahierte Tabelle in der Beschriftungsansicht automatisch beschriften.
Bezeichnung von Untertypen und Untertypen der zweiten Ebene: Studio unterstützt jetzt Untertypen für Tabellenspalten, Tabellenzeilen und Untertypen der zweiten Ebene für Typen wie Datumsangaben und Zahlen.
Das Erstellen benutzerdefinierter neuronaler Modelle wird jetzt in der Region „US Gov Virginia“ unterstützt.
Die API-Vorschauversionen
2022-01-30-preview
und2021-09-30-preview
werden am 31. Januar 2023 eingestellt. Aktualisieren Sie auf die API-Version2022-08-31
, um Dienstunterbrechungen zu vermeiden.
November 2022
- Ankündigung der neuesten stabilen Version von Azure KI Dokument Intelligenz-Bibliotheken
- Dieses Release enthält wichtige Änderungen und Updates für .NET-, Java-, JavaScript- und Python-Clientbibliotheken. Weitere Informationen finden Sie unter Azure SDK DevBlog.
- Die wichtigsten Verbesserungen sind die Einführung von zwei neuen Clients:
DocumentAnalysisClient
undDocumentModelAdministrationClient
.
Oktober 2022
Dokument Intelligenz-Inhalte mit Versionsangabe
Die Dokumentation zu Dokument Intelligenz wurde aktualisiert, um Inhalte mit Versionsangaben anzuzeigen. Jetzt können Sie wählen, ob Sie die Inhalte für die Version
v3.0 GA
oder die Versionv2.1 GA
anzeigen möchten. Die Oberfläche der Version 3.0 ist die Standardeinstellung.
Dokument Intelligenz Studio-Beispielcode
- Beispielcode für die Dokument Intelligenz Studio-Umgebung für Beschriftungen ist jetzt auf GitHub verfügbar. Kunden können Dokument Intelligenz entwickeln und in ihre eigene Benutzeroberfläche integrieren oder ihre eigene neue Benutzeroberfläche mithilfe des Dokument Intelligenz Studio-Beispielcodes erstellen.
Spracherweiterung
- In der neuesten Vorschauversion unterstützen die Vorlagenmodelle Read (OCR), Layout und Custom der Dokument Intelligenz jetzt 134 neue Sprachen. Zu diesen Sprachergänzungen gehören Griechisch, Lettisch, Serbisch, Thai, Ukrainisch und Vietnamesisch sowie mehrere Sprachen in lateinischer und kyrillischer Schrift. Dokument Intelligenz unterstützt jetzt insgesamt 299 Sprachen in den aktuellen GA- und neuen Vorschauversionen. Auf der Seite „Unterstützte Sprachen“ finden Sie alle unterstützen Sprachen.
- Verwenden Sie den REST-API-Parameter
api-version=2022-06-30-preview
, wenn Sie die API oder das entsprechende SDK verwenden, um die neuen Sprachen in Ihren Anwendungen zu unterstützen.
Neues vordefiniertes Vertragsmodell
- Ein neues vordefiniertes Modell, das Informationen aus Verträgen wie Parteien, Titel, Vertrags-ID, Unterzeichnungsdatum usw. extrahiert. Das Vertragsmodell befindet sich derzeit in der Vorschau. Hier können Sie Zugriff anfordern.
Regionserweiterung für das Training benutzerdefinierter neuronaler Modelle
- Das Training von benutzerdefinierten neuronalen Modellen wird jetzt in weiteren Regionen unterstützt.
- East US
- USA (Ost 2)
- US Gov Arizona
- Das Training von benutzerdefinierten neuronalen Modellen wird jetzt in weiteren Regionen unterstützt.
September 2022
Hinweis
Ab Version 4.0.0 wird eine neue Gruppe von Clients eingeführt, um die neuesten Features des Dokument Intelligenz-Diensts zu nutzen.
SDK-Version 4.0.0 GA-Release enthält die folgenden Updates:
- Version 4.0.0: allgemein verfügbar (2022-09-08)
- Unterstützt Clients mit REST-API v3.0 und v2.0
Regionserweiterung zum Trainieren benutzerdefinierter neuronaler Modelle jetzt in sechs neuen Regionen unterstützt
- Australien (Osten)
- USA (Mitte)
- Asien, Osten
- Frankreich, Mitte
- UK, Süden
- USA, Westen 2
Eine vollständige Liste der Regionen, in denen Training unterstützt wird, finden Sie unter Benutzerdefinierte neuronale Modelle.
Document Intelligence SDK-Version, Release
4.0.0 GA
:- Version 4.0.0 (.NET/C#, Java, JavaScript) und Version 3.2.0 (Python) der Document Intelligence-Clientbibliotheken sind allgemein verfügbar und können in Produktionsanwendungen verwendet werden.
- Weitere Informationen zu Document Intelligence-Clientbibliotheken finden Sie in der SDK-Übersicht.
- Aktualisieren Sie Ihre Anwendungen mithilfe des Migrationsleitfadens für Ihre Programmiersprache.
August 2022
Die Vorschauversion der Dokument Intelligenz-SDK-Beta vom August 2022 enthält die folgenden Updates:
Version 4.0.0-beta.5 (2022-08-09)
Dokument Intelligenz v3.0 ist allgemein verfügbar.
- Dokument Intelligenz REST-API v3.0 ist nun allgemein verfügbar und kann in Produktionsanwendungen verwendet werden! Aktualisieren Sie Ihre Anwendungen mit der REST-API-Version 2022-08-31.
Dokument Intelligenz Studio-Updates
- Nächste Schritte: Unter jeder Modellseite verfügt das Studio jetzt über einen Abschnitt mit den nächsten Schritten. Benutzer können schnell auf Beispielcode, Richtlinien zur Problembehandlung und Preisinformationen zugreifen.
- Benutzerdefinierte Modelle: Das Studio enthält jetzt die Möglichkeit, Bezeichnungen in benutzerdefinierten Modellprojekten neu anzuordnen, um die Bezeichnungseffizienz zu verbessern.
- Kopieren von Modellen: Benutzerdefinierte Modelle können aus dem Studio in verschiedene Dokument Intelligenz-Dienste kopiert werden. Dieser Vorgang ermöglicht die Höherstufung eines trainierten Modells auf andere Umgebungen und Regionen.
- Löschen von Dokumenten: Das Studio unterstützt jetzt das Löschen von Dokumenten aus beschrifteten Datasets in benutzerdefinierten Projekten.
Updates für den Dokument Intelligenz-Dienst
- prebuilt-read. Das Lese-OCR-Modell ist jetzt auch in Dokument Intelligenz mit den beiden neuen Features für Absätze und Spracherkennung verfügbar. Erweiterte Dokumentszenarien von Lesezielen der Dokument Intelligenz, die mit den erweiterten Dokumentintelligenzfunktionen in der Dokument Intelligenz abgestimmt sind.
- prebuilt-layout. Das Layoutmodell extrahiert Absätze und gibt an, ob der extrahierte Text ein Absatz, Titel, Abschnittsüberschrift, eine Fußnote, ein Seitenkopf, ein Seitenfuß oder eine Seitenzahl ist.
- prebuilt-invoice. Die Felder „MwSt. gesamt“ und „Position/MwSt.“ werden nun in die vorhandenen Felder „Steuern gesamt“ respektive „Position/Steuern“ aufgelöst.
- prebuilt-idDocument. Unterstützung der Datenextraktion für US-amerikanische Ausweise, Sozialversicherungskarten und Green Cards. Unterstützung für Pass- und Visainformationen.
- prebuilt-receipt. Erweiterte Gebietsschemaunterstützung für Französisch (fr-FR), Spanisch (es-ES), Portugiesisch (pt-PT), Italienisch (it-IT) und Deutsch (de-DE)
- prebuilt-businessCard. Adressanalyseunterstützung zum Extrahieren von untergeordneten Feldern für Adresskomponenten wie Adresse, Ort, Bundesland/Kanton, Land/Region und Postleitzahl.
Verbesserungen der KI-Qualität
- prebuilt-read. Verbesserte Unterstützung für einzelne Zeichen, handschriftliche Datumsangaben, Beträge, Namen, andere wichtige Daten, die häufig in Quittungen und Rechnungen zu finden sind, sowie verbesserte Verarbeitung digitaler PDF-Dokumente.
- prebuilt-layout. Unterstützung für eine bessere Erkennung von zugeschnittenen Tabellen und rahmenlosen Tabellen sowie verbesserte Erkennung von langen übergreifenden Zellen.
- prebuilt-document. Verbesserte Wert- und Kontrollkästchenerkennung
- custom-neural. Verbesserte Genauigkeit für die Tabellenerkennung und -extraktion
Juni 2022
- Die Vorschauversion der Dokument Intelligenz-SDK-Beta vom Juni 2022 enthält die folgenden Updates:
Version 4.0.0-beta.4 (2022-06-08)
Die Juni-Version von Dokument Intelligenz Studio ist das neueste Update für Dokument Intelligenz Studio. In diesem Update wurden erhebliche Verbesserungen an Benutzererfahrung und Barrierefreiheit vorgenommen:
- Codebeispiel für JavaScript und C#: Die Registerkarte „Code“ in Studio fügt jetzt Codebeispiele für JavaScript und C# über das vorhandene für Python hinaus hinzu.
- Neue Benutzeroberfläche zum Hochladen von Dokumenten. Studio unterstützt jetzt das Hochladen eines Dokuments mit Drag & Drop auf die neue Benutzeroberfläche zum Hochladen.
- Neues Feature für benutzerdefinierte Projekte. Benutzerdefinierte Projekte unterstützen jetzt das Erstellen von Speicherkonten und Blobs beim Konfigurieren des Projekts. Darüber hinaus unterstützen benutzerdefinierte Projekte jetzt das Hochladen von Trainingsdateien direkt in Studio sowie das Kopieren des vorhandenen benutzerdefinierten Modells.
Das Release 2022-06-30-preview von Dokument Intelligenz v3.0 enthält umfangreiche Updates für die Feature-APIs:
- Layout erweitert die Strukturextraktion. Das Layout umfasst jetzt hinzugefügte Strukturelemente wie Abschnitte, Abschnittsüberschriften und Absätze. Dieses Update ermöglicht Szenarien mit feinerer Dokumentsegmentierung. Eine vollständige Liste der identifizierten Strukturelemente finden Sie unter Erweiterte Struktur.
- Unterstützung von tabellarischen Feldern in benutzerdefinierten neuronalen Modellen. Benutzerdefinierte Dokumentmodelle unterstützen jetzt tabellarische Felder. Tabellarische Felder sind standardmäßig auch mehrere Seiten. Weitere Informationen zu tabellarischen Feldern in benutzerdefinierten neuronalen Modellen finden Sie unter Tabellarische Felder.
- Unterstützung tabellarischer Felder in benutzerdefinierten Vorlagenmodellen für seitenübergreifende Tabellen. Benutzerdefinierte Formularmodelle unterstützen jetzt seitenübergreifende tabellarische Felder. Weitere Informationen zu tabellarischen Feldern in benutzerdefinierten Vorlagenmodellen finden Sie unter Tabellarische Felder.
- Die Ausgabe des Rechnungsmodells umfasst jetzt allgemeine Schlüssel-Wert-Paare für Dokumente. Wenn Rechnungen Pflichtfelder enthalten, die über die im vordefinierten Modell enthaltenen Felder hinausgehen, ergänzt das allgemeine Dokumentmodell die Ausgabe um Schlüssel-Wert-Paare. Weitere Informationen finden Sie unter Schlüssel-Wert-Paare.
- Erweiterung der Rechnungssprache. Das Rechnungsmodell umfasst erweiterte Sprachunterstützung. Weitere Informationen finden Sie unter Unterstützte Sprachen.
- Die vordefinierte Visitenkarte umfasst jetzt Unterstützung für die japanische Sprache. Weitere Informationen finden Sie unter Unterstützte Sprachen.
- Vordefiniertes Ausweisdokumentmodell. Das Ausweisdokumentmodell extrahiert jetzt DateOfIssue, Height, Weight, EyeColor, HairColor und DocumentDiscriminator aus US-Führerscheinen. Unterstützte Sprachen Feldextraktion.
- Das Lesemodell unterstützt jetzt gängige Microsoft Office-Dokumenttypen. Dokumenttypen wie Word (DOCX), Excel (XLSX) und PowerPoint (PPT) werden jetzt mit der Lese-API unterstützt. Siehe Datenextraktion.
Februar 2022
Version 4.0.0-beta.3 (2022-02-10)
Das Vorschaurelease von Document Intelligence Version 3.0 bietet mehrere neue Features, Funktionen und Verbesserungen:
- Benutzerdefiniertes neuronales Modell oder benutzerdefiniertes Dokumentmodell ist ein neues benutzerdefiniertes Modell zum Extrahieren von Text- und Auswahlmarkierungen aus strukturierten Formularen, halbstrukturierten und unstrukturierten Dokumenten.
- Das vordefinierte W-2-Modell ist ein neues vordefiniertes Modell zum Extrahieren von Feldern aus W-2-Formularen für Steuererklärungs- und Einkommensüberprüfungsszenarien.
- Die Lese-API extrahiert gedruckte Textzeilen, Wörter, Textpositionen, erkannte Sprachen und handschriftlichen Text, sofern erkannt.
- Das vortrainierte Modell Allgemeines Dokument wurde jetzt so aktualisiert, dass neben API-Text, Tabellen, Struktur und Schlüssel-Wert-Paaren aus Formularen und Dokumenten auch Auswahlmarkierungen unterstützt werden.
- Rechnungs-API Das vordefinierte Rechnungsmodell erweitert die Unterstützung auf spanischen Rechnungen.
- Dokument Intelligenz Studio fügt neue Demos für Lese-, W2-, Hotelbelegbeispiele und Unterstützung für das Training der neuen benutzerdefinierten neuronalen Modelle hinzu.
- Spracherweiterung Mit „Lesen“, „Layout“ und „Benutzerdefiniertes Formular“ von Dokument Intelligenz wird Unterstützung für 42 neue Sprachen hinzugefügt, einschließlich Arabisch, Hindi und anderen Sprachen, die arabische oder Devanagari-Schriften verwenden, um die Abdeckung auf 164 Sprachen zu erweitern. Die handschriftliche Sprachunterstützung wird auf Japanisch und Koreanisch erweitert.
Erste Schritte mit der neuen API der Vorschauversion 3.0
Document Intelligence-Modelldatenextraktion:
Modell Textextraktion Schlüssel-Werte-Paare Auswahlmarkierungen Tabellen Signaturen Lesen ✓ Allgemeines Dokument ✓ ✓ ✓ ✓ Layout ✓ ✓ ✓ Rechnung ✓ ✓ ✓ ✓ Rechnung ✓ ✓ ✓ ID-Dokument ✓ ✓ Visitenkarte ✓ ✓ Benutzerdefiniertes Vorlagenmodell ✓ ✓ ✓ ✓ ✓ Benutzerdefiniertes neuronales Modell ✓ ✓ ✓ ✓ Die Vorschauversion der Dokument Intelligenz-SDK-Beta enthält die folgenden Updates:
Benutzerdefinierte Dokumentmodelle und -modi:
- Benutzerdefinierte Vorlage (früher benutzerdefiniertes Formular)
- Benutzerdefiniertes neuronales Modell.
- Benutzerdefiniertes Modell – Buildmodus.
Vordefiniertes W-2-Modell (prebuilt-tax.us.w2)
Vordefiniertes Lesemodell (prebuilt-read)
Vordefiniertes Rechnungsmodell (Spanisch) (prebuilt-invoice)
Nächste Schritte
Versuchen Sie, Ihre eigenen Formulare und Dokumente mithilfe von Dokument Intelligenz Studio zu verarbeiten.
Führen Sie eine Dokument Intelligenz-Schnellstartanleitung durch, und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.
Versuchen Sie, Ihre eigenen Formulare und Dokumente mithilfe des Dokument Intelligenz-Stichproben-Bezeichnungstools zu verarbeiten.
Führen Sie eine Dokument Intelligenz-Schnellstartanleitung durch, und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.