Freigeben über


Neuerungen in Azure KI Dokument Intelligenz

Dieser Inhalt gilt für: Häkchen Version 4.0 (GA) Häkchen Version 3.1 (GA) Häkchen Version 3.0 (GA) Häkchen Version 2.1 (GA)

Der Dokument Intelligenz-Dienst wird fortlaufend aktualisiert. Speichern Sie ein Lesezeichen für diese Seite, um bei Versionshinweisen, Verbesserungen von Features und unserer aktuellen Dokumentation auf dem neuesten Stand zu bleiben.

Wichtig

API-Vorschauversionen werden zurückgegeben, sobald die GA-API eingeführt wird. Die API-Version „2023-02-28-preview“ wird eingestellt. Wenn Sie die API-Vorschauversion oder die zugehörigen SDK-Versionen weiterhin verwenden, aktualisieren Sie Ihren Code auf die aktuelle API-Version 2024-11-30 (GA).

Dezember 2024

Document Intelligence v4.0-Programmiersprachen-SDKs sind jetzt allgemein verfügbar (GA)!

Die neuesten Clientbibliotheken weisen standardmäßig die [REST-API-Version 2024-11-30 (GA)](/rest/api/aiservices/operation-groups?view=rest-aiservices-v4.0%20(2024-11-30&preserve-view=true) des Diensts auf.

Weitere Informationen finden Sie in Clientbibliotheken für die folgenden unterstützten Programmiersprachen:

November 2024

Document Intelligence REST API v4.0: 2024-11-30 REST API (GA) ist jetzt allgemein verfügbar (GA)! Die REST-API v4.0 enthält die folgenden Änderungen:

  • 🆕 Batch-API

    • Die Batch-API unterstützt jetzt alle Modelle, einschließlich aller Lese-, Layout-, vordefinierten Sektoren- und benutzerdefinierten Modelle.
    • Die Batch-API unterstützt die LIST-Funktion, damit Benutzer Batchaufträge innerhalb der letzten sieben Tage auflisten können.
    • Die Batch-API unterstützt die DELETE-Funktion zum expliziten Löschen des Batchauftrags für DSGVO- und Datenschutzcompliance.
    • GetAnalyzeBatchResult unterstützt resultId als Reaktion auf LIST aller resultIds.
  • 🆕 Durchsuchbare PDF. Das vorgefertigte Lese-Modell unterstützt jetzt Bilderformate (JPEG/JPG, PNG, BMP, TIFF, HEIF) und Spracherweiterung, um Chinesisch, Japanisch und Koreanisch für PDF-Ausgabe einzuschließen.

  • Benutzerdefiniertes Klassifizierungsmodell

    • Das benutzerdefinierte Klassifizierungsmodell unterstützt inkrementelles Training. Sie können vorhandenen Klassen neue Beispiele hinzufügen oder neue Klassen hinzufügen, indem Sie auf einen vorhandenen Klassifizierer verweisen.
    • Mit v4.0 teil das benutzerdefinierte Klassifizierungsmodell Dokumente während der Analyse nicht standardmäßig auf. Sie müssen die Eigenschaft „splitMode” explizit auf „automatisch“ festlegen, um das ältere Verhalten beizubehalten.
    • Das benutzerdefinierte Klassifizierungsmodell unterstützt jetzt 25.000 Seiten als neue Begrenzung der Trainingsseite.
  • Benutzerdefiniertes neuronales Modell

    • Das benutzerdefinierte neurale Modell unterstützt jetzt die Signaturerkennung.
    • Benutzerdefinierte neuronale Modelle unterstützen das kostenpflichtige Training länger, wenn Sie ein Modell mit einem größeren beschrifteten Dataset trainieren müssen. Die ersten 20 Trainingsausführungen in einem Kalendermonat sind weiterhin kostenlos. Alle Trainingsvorgänge nach den ersten 20 Trainingsausführungen sind kostenpflichtig. Weitere Informationen finden Sie unter Abrechnung.
  • US-Kontoauszugsmodell

    • Das US-Kontoauszugsmodell unterstützt jetzt die Schecktabellenextraktion.
  • Scheckmodell

    • Unterstützt die Extraktion der Signatur des Zahlers
  • Modell für Hypothekendokumente

    • Das Hypothekenmodell unterstützt jetzt die Signaturerkennung für die Formulare 1003, 1004, 1005 und Offenlegung des Abschlusses.
  • Belegmodell

    • Das Belegmodell unterstützt jetzt weitere Felder wie ReceiptType, Steuersatz, CountryRegion, Nettobetrag und Beschreibung.
  • 🆕 US-Steuermodell

    • Neue vorgefertigte Steuermodelle für 1095A, 1095C, 1099SSA und W4 hinzugefügt.
  • Die v4.0-API enthält kumulative Updates aus Vorschauversionen, wie aufgeführt:

August 2024

Die REST-API für Dokument Intelligenz 2024-07-31-preview ist jetzt verfügbar. Mit der API v3.1 werden neue und aktualisierte Funktionen eingeführt:

  • Die Public Preview 2024-07-31-preview ist derzeit nur in den folgenden Azure-Regionen verfügbar. Das neue Extraktionsmodell für Dokumentfelder im Azure KI Foundry-Portal ist lediglich in der Region „USA, Norden-Mitte“ verfügbar:

  • USA, Osten

  • USA, Westen 2

  • Europa, Westen

  • USA Nord Mitte

  • 🆕 Modellzusammensetzung mit benutzerdefinierten Klassifizierern

    • Dokument Intelligenz unterstützt jetzt das Erstellen eines Modells mit einem expliziten benutzerdefinierten Klassifizierungsmodell. Erfahren Sie mehr über die Vorteile bei der Verwendung der neuen Erstellungsfunktion.
  • Benutzerdefiniertes Klassifizierungsmodell

    • Das benutzerdefinierte Klassifizierungsmodell unterstützt jetzt auch die direkte Aktualisierung des Modells.
    • Das benutzerdefinierte Klassifizierungsmodell unterstützt jetzt den Modellkopievorgang, um die Sicherung und Notfallwiederherstellung zu ermöglichen.
    • Das benutzerdefinierte Klassifizierungsmodell unterstützt jetzt die explizite Angabe von Seiten, die aus einem Eingabedokument klassifiziert werden sollen.
  • 🆕 Modell für Hypothekendokumente

    • Extrahieren von Informationen aus Appraisal (Formular 1004)
    • Extrahieren von Informationen aus Validation of Employment (Formular 1005).
  • 🆕 Scheckmodell

    • Extrahieren von Zahlungsempfängern, Betrag, Datum und anderen relevanten Informationen aus Schecks
  • 🆕 Lohnabrechnungsmodell

    • Neues vordefiniertes Modell zur Verarbeitung von Lohnabrechnungen, um Löhne, Stunden, Abzüge, Nettolohn und mehr zu extrahieren
  • 🆕 Kontoauszugsmodell

    • Neues vordefiniertes Modell zum Extrahieren von Kontoinformationen, einschließlich Start- und Endguthaben und Transaktionsdetails aus Kontoauszügen
  • 🆕 US-Steuermodell

    • Neues einheitliches US-Steuermodell, das aus Formularen wie W-2, 1098, 1099 und 1040 extrahieren kann
  • 🆕 Durchsuchbare PDF. Das vordefinierte Lesemodell unterstützt jetzt die PDF-Ausgabe zum Herunterladen von PDF-Dateien mit eingebettetem Text aus Extraktionsergebnissen, sodass eine PDF in Szenarien wie beim Suchen und Kopieren von Inhalt verwendet werden kann.

  • Das Layoutmodell unterstützt jetzt die verbesserte Abbildungserkennung, in der Abbildungen aus Dokumenten jetzt als Bilddatei heruntergeladen werden können, die für weiteres Abbildungsverständnis verwendet werden können. Das Layoutmodell bietet außerdem Verbesserungen am OCR-Modell für gescannten Text speziell für einzelne Zeichen, Text in Feldern und Dokumente mit dichtem Text.

  • 🆕 Batch-API

    • Die Dokumentintelligenz unterstützt jetzt Batchanalysevorgänge, also die Analyse einer Gruppe von Dokumenten. Dies vereinfacht die Nutzung für Entwickler und verbessert die Effizienz.
  • Add-On-Funktionen

    • Abfragefelder Die KI-Qualität der Extraktion wird mit dem neuesten Modell verbessert.

Mai 2024

Dokument Intelligenz Studio fügt Unterstützung für die Microsoft Entra-Authentifizierung (früher Azure Active Directory) hinzu. Weitere Informationen finden Sie unter Authentifizierung in Dokument Intelligenz Studio.

Februar 2024

Die REST-API für Dokument Intelligenz 2024-07-31-preview ist jetzt verfügbar. Mit der API v3.1 werden neue und aktualisierte Funktionen eingeführt:

  • Die Public Preview 2024-07-31-preview ist derzeit nur in den folgenden Azure-Regionen verfügbar:

    • USA, Osten
    • USA, Westen 2
    • Europa, Westen
  • Das Layoutmodell unterstützt jetzt die Abbildungserkennung und die Analyse der hierarchischen Dokumentstruktur (Abschnitte und Unterabschnitte). Die KI-Qualität der Lesereihenfolge und der Erkennung logischer Rollen wurde ebenfalls verbessert.

  • Benutzerdefinierte Extraktionsmodelle

    • Benutzerdefinierte Extraktionsmodelle unterstützen jetzt die Konfidenzbewertungen auf Zellen-, Zeilen- und Tabellenebene. Erfahren Sie mehr über die Tabellen-, Zeilen- und Zellvertrauenssicherheit.
    • Benutzerdefinierte Extraktionsmodelle verfügen über VERBESSERUNGEN der KI-Qualität für die Feldextraktion.
    • Das benutzerdefinierte Vorlagenextraktionsmodell unterstützt jetzt das Extrahieren überlappender Felder. Erfahren Sie mehr überlappende Felder und derenVerwendung.
  • Benutzerdefiniertes Klassifizierungsmodell

    • Benutzerdefiniertes Klassifizierungsmodell unterstützt jetzt inkrementelle Schulung für Szenarien, in denen Sie das Klassifizierermodell mit zusätzlichen Beispielen oder Klassen aktualisieren müssen. Erfahren Sie mehr über inkrementelle Sicherungen.
    • Benutzerdefiniertes Klassifizierungsmodell bietet Unterstützung für Office-Dokumenttypen (.docx, .pptx und .xls). Erfahren Sie mehr über die Unterstützungerweiterter Dokumenttypen.
  • Rechnungsmodell

    • Unterstützung für das neue Gebietsschema:
    Gebietsschema Code
    Arabisch (ar)
    Bulgarisch (bg)
    Griechisch (el)
    Hebräisch (he)
    Mazedonisch (mk)
    Russisch (ru) Serbisch Kyrillisch (sr-cyrl)
    Ukrainisch (uk)
    Thailändisch (th)
    Türkisch (tr)
    Vietnamesisch (vi)
    • Unterstützung für neue Währungscodes:
    Währung Gebietsschema Code
    BAM Bosnische Konvertierbare Mark (ba)
    BGN Bulgarischer Lew (bg)
    ILS Israelischer Schekel (il)
    MKD Mazedonischer Denar (mk)
    RUB Russischer Rubel (ru)
    THB Thailändischer Baht (th)
    TRY Türkische Lira (tr)
    UAH Ukrainische Hrywnja (ua)
    VND Vietnamesischer Dong (vn)
    • Steuerartikel unterstützen Expansion für Deutschland (de), Spanien (es),Portugal (pt), Englisch Kanada (en-CA).
  • ID-Modell

  • 🆕 Hypothekendokumente

    • Extrahieren von Informationen aus dem „Uniform Residential Loan Application“ (Formular 1003).
    • Extrahieren Sie Informationen aus dem „Uniform Underwriting and Transmittal Summary“ oder dem Formular 1008.
    • Extrahieren Sie Informationen aus der Offenlegung von Hypothekenabschluss.
  • 🆕 Kredit-/Debitkartenmodell

    • Extrahieren Sie Informationen aus Bankkarten.
  • 🆕 Heiratsurkunde

    • Neue Vorbauung, um Informationen aus Ehescheinen zu extrahieren.

Dezember 2023

Die Document Intelligence-Clientbibliotheken für die REST-API 2023-10-31-preview sind jetzt zur Verwendung verfügbar.

November 2023

Die Rest-API für Document Intelligence 2023-10-31-preview ist jetzt verfügbar. Mit der API v3.1 werden neue und aktualisierte Funktionen eingeführt:

  • Öffentliche Vorschauversion Preview 31.10.2023 ist derzeit nur in den folgenden Azure-Regionen verfügbar:

    • USA, Osten
    • USA, Westen 2
    • Europa, Westen
  • Lesemodell

    • Spracherweiterung für Handschrift: Russisch(ru), Arabisch(ar), Thai(th).
    • Konformität mit der Cyber-Executive Order (EO)
  • Layoutmodell

    • Unterstützen Sie Office- und HTML-Dateien.
    • Markdown-Ausgabeunterstützung.
    • Verbesserungen bei der Erkennung von Tabellenüberschriften, Lesereihenfolge und Abschnittsüberschriften.
    • Ab Dokument Intelligenz 2023-10-31-preview ist das allgemeine Dokumentmodell (vorkonfiguriertes Dokument) veraltet. Um Schlüssel-Wert-Paare aus Dokumenten zu extrahieren, verwenden Sie das prebuilt-layout Modell mit aktiviertem optionalen Abfragezeichenfolgenparameter features=keyValuePairs.
  • Belegmodell

    • Extrahiert jetzt Währung für alle preisbezogenen Felder.
  • Krankenversicherungskartenmodell

    • Neue Feldunterstützung für Medicare- und Medicaid-Informationen.
  • US-Steuerdokumentmodelle

    • W-1099-Steuermodell. Unterstützt das 1099 Grundformular und die folgenden Varianten: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
  • Rechnungsmodell

    • Unterstützung für das Feld KVK
    • Unterstützung für das Feld BPAY
    • Zahlreiche Feldoptimierungen.
  • Benutzerdefinierte Klassifizierung

    • Unterstützung für mehrsprachige Dokumente.
    • Neue Optionen zum Teilen von Seiten: automatische Teilung, immer nach Seite geteilt, keine Teilung.
  • Add-On-Funktionen

    • Abfragefelder sind ab der 2023-10-31-preview-Version verfügbar.
    • Add-On-Funktionen sind in allen Modellen mit Ausnahme des Lesemodells verfügbar.

Hinweis

Mit der GA-Veröffentlichung (General Availability) der API 2022-08-31 sind die zugehörigen Vorschau-APIs veraltet. Wenn Sie die API-Versionen „2021-09-30-preview“, „2022-01-30-preview“ oder „2022-06-30-preview“ verwenden, aktualisieren Sie Ihre Anwendungen auf die API-Version „2022-08-31“. Es gibt einige kleinere Änderungen. Weitere Informationen finden Sie im Migrationsleitfaden.

Juli 2023

Hinweis

Die Formularerkennung heißt jetzt Azure KI Dokument Intelligenz!

  • Es gibt keine Änderungen an den Preisen.
  • Die Namen Cognitive Services und Azure Applied AI werden in Abrechnungs-, Kostenanalyse-, Preislisten- und Preis-APIs von Azure weiterhin verwendet.
  • Es gibt keine Breaking Changes an APIs (Anwendungsprogrammierschnittstellen) oder Clientbibliotheken.
  • Einige Plattformen warten noch auf das Update mit der Umbenennung. Alle Erwähnung von Formularerkennung oder Document Intelligence in unserer Dokumentation beziehen sich auf denselben Azure-Dienst.

Dokument Intelligenz v3.1 (GA)

Die Dokument Intelligenz-API, Version 3.1, ist jetzt allgemein verfügbar! Die API-Version entspricht 2023-07-31. Mit der API v3.1 werden neue und aktualisierte Funktionen eingeführt:

Dokument Intelligenz Studio UX Updates

✔️ Analyseoptionen

  • Dokument Intelligenz unterstützt jetzt komplexere Analysefunktionen, und Studio bietet einen einzigen Einstiegspunkt (Schaltfläche „Analyseoptionen“) für die problemlose Konfiguration der Add-On-Funktionen.

  • Je nach Dokumentextraktionsszenario können Sie die Features für Analysebereich, Dokumentseitenbereich, optionale Erkennung und Premium-Erkennung konfigurieren.

    Animierter Screenshot der Verwendung der Schaltfläche „Analyseoptionen“ zum Konfigurieren von Optionen in Studio.

    Hinweis

    Die Schriftartenextraktion wird in Dokument Intelligenz Studio nicht visualisiert. Sie können die Ergebnisse der Schriftarterkennung jedoch im Stilabschnitt der JSON-Ausgabe überprüfen.

✔️ Automatische Beschriftung von Dokumenten mit vordefinierten Modellen oder einem Ihrer eigenen Modelle

  • Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie Ihre Dokumente jetzt automatisch anhand eines der vordefinierten Modelle des Dokument Intelligenz-Diensts oder mithilfe der zuvor von Ihnen trainierten Modelle beschriften.

    Animierter Screenshot: automatische Beschriftung in Studio

  • Bei einigen Dokumenten liegen nach der automatischen Beschriftung möglicherweise einige Beschriftungen doppelt vor. Stellen Sie sicher, dass Sie die Beschriftungen so ändern, dass auf der Beschriftungsseite keine doppelten Beschriftungen vorhanden sind.

    Screenshot: Warnung zu doppelter Beschriftung nach automatischer Beschriftung

✔️ Automatische Beschriftung von Tabellen

  • Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie jetzt die Tabellen im Dokument automatisch beschriften. Eine manuelle Beschriftung ist nicht erforderlich.

    Animierter Screenshot: automatische Tabellenbeschriftung in Studio

✔️ Direktes Hinzufügen von Testdateien zu Ihrem Trainingsdataset

  • Wenn Sie ein benutzerdefiniertes Extraktionsmodell trainieren, verbessern Sie die Modellqualität über die Testseite, indem Sie bei Bedarf Testdokumente in das Trainingsdataset hochladen.

  • Wenn für einige Beschriftungen ein niedriger Konfidenzwert zurückgegeben wird, stellen Sie sicher, dass Ihre Beschriftungen korrekt sind. Fügen Sie sie andernfalls dem Trainingsdataset hinzu, und beschriften Sie sie neu, um die Modellqualität zu verbessern.

Animierter Screenshot: Hinzufügen von Testdateien zum Trainingsdataset

✔️ Verwenden der Dokumentlistenoptionen und -filter in benutzerdefinierten Projekten

  • Verwenden Sie die Beschriftungsseite des benutzerdefinierten Extraktionsmodells. Sie können jetzt ganz einfach durch Ihre Schulungsdokumente navigieren, indem Sie die Suchfunktion verwenden, filtern und sortieren.

  • Verwenden Sie die Rasteransicht, um Dokumente in der Vorschau anzuzeigen, oder verwenden Sie die Listenansicht, um einfacher durch die Dokumente zu scrollen.

    Screenshot: Optionen und Filter der Dokumentlistenansicht

✔️ Projektfreigabe

Mai 2023

Einführung einer aktualisierten Dokumentation für Build 2023

April 2023

Ankündigung der neuesten öffentlichen Vorschauversion der Dokument Intelligenz-Clientbibliothek

März 2023

Wichtig

2023-02-28-preview-Funktionen sind derzeit nur in den folgenden Regionen verfügbar:

  • Europa, Westen
  • USA, Westen 2
  • East US

Februar 2023


Januar 2023

  • Vordefiniertes Belegmodell – hinzugefügte Sprachen werden unterstützt. Das Belegmodell unterstützt jetzt diese hinzugefügten Sprachen und Gebietsschemas

    • Japanisch – Japan (ja-JP)
    • Französisch – Kanada (fr-CA)
    • Niederländisch – Niederlande (nl-NL)
    • Englisch – Vereinigte Arabische Emirate (en-AE)
    • Portugiesisch – Brasilien (pt-BR)
  • Vordefiniertes Rechnungsmodell – hinzugefügte Sprachen werden unterstützt. Das Rechnungsmodell unterstützt jetzt diese hinzugefügten Sprachen und Gebietsschemas

    • Englisch – USA (en-US), Australien (en-AU), Kanada (en-CA), Vereinigtes Königreich (en-GB), Indien (en-IN)
    • Spanisch – Spanien (es-ES)
    • Französisch – Frankreich (fr-FR)
    • Italienisch – Italien (it-IT)
    • Portugiesisch – Portugal (pt-PT)
    • Niederländisch – Niederlande (nl-NL)
  • Vordefiniertes Rechnungsmodell – hinzugefügte Felder werden erkannt. Das Rechnungsmodell erkennt nun diese hinzugefügten Felder

    • Currency code
    • Zahlungsoptionen
    • Gesamtrabatt
    • Steuerposten (nur en-IN)
  • Vordefiniertes ID-Modell – hinzugefügte Dokumenttypen werden unterstützt. Das ID-Modell unterstützt jetzt diese hinzugefügten Dokumenttypen

    • US-Militär-ID

Tipp

Alle Updates vom Januar 2023 sind mit der REST-API-Version 2022-08-31 (GA) verfügbar.

  • Vordefiniertes Belegmodell – zusätzliche Sprachunterstützung:

    Das vordefinierte Belegmodell unterstützt jetzt die folgenden Sprachen:

    • Englisch – Vereinigte Arabische Emirate (en-AE)
    • Niederländisch – Niederlande (nl-NL)
    • Französisch – Kanada (fr-CA)
    • Deutsch – (de-DE)
    • Italienisch – (it-IT)
    • Japanisch – Japan (ja-JP)
    • Portugiesisch – Brasilien (pt-BR)
  • Vordefiniertes Rechnungsmodell – zusätzliche Sprachunterstützung und Feldextraktionen

    Das vordefinierte Rechnungsmodell unterstützt jetzt die folgenden Sprachen:

    • Englisch – Australien (en-AU), Kanada (en-CA), Vereinigtes Königreich (en-UK), Indien (en-IN)
    • Portugiesisch – Brasilien (pt-BR)

    Das vordefinierte Rechnungsmodell unterstützt jetzt die folgenden Feldextraktionen:

    • Currency code
    • Zahlungsoptionen
    • Gesamtrabatt
    • Steuerposten (nur en-IN)
  • Vordefiniertes Ausweisdokumentmodell – Unterstützung zusätzlicher Dokumenttypen

    Das vordefinierte Ausweisdokumentmodell unterstützt jetzt die folgenden Dokumenttypen:

    • Führerscheinerweiterung für Indien, Kanada, Vereinigtes Königreich und Australien
    • US-Militärausweise und -Ausweisdokumente
    • Indische Personalausweise und Ausweisdokumente (PAN und Aadhaar)
    • Australische Personalausweise und Ausweisdokumente (Fotokarte, Schlüsselpass-ID)
    • Kanada Personalausweise und Ausweisdokumente (Personalausweis, Maple-Karte)
    • Personalausweise und Ausweisdokumente des Vereinigten Königreichs (nationaler/regionaler Personalausweis)

Dezember 2022

  • Dokument Intelligenz Studio-Updates

    Die Document Intelligence Studio-Version vom Dezember enthält die neuesten Updates für Dokument Intelligenz Studio. Es gibt erhebliche Verbesserungen an der Benutzeroberfläche, vor allem bei der Unterstützung benutzerdefinierter Modellbezeichnungen.

    • Seitenbereich: Studio unterstützt jetzt die Analyse von angegebenen Seiten aus einem Dokument.

    • Benutzerdefinierte Modellbezeichnungen:

      • Automatisches Ausführen der Layout-API: Sie können die Layout-API während des Setupprozesses für ein benutzerdefiniertes Modell automatisch für alle Dokumente in Ihrem Blobspeicher ausführen.

      • Suchen Studio bietet jetzt Suchfunktionen zum Suchen von Wörtern in einem Dokument. Diese Verbesserung ermöglicht eine einfachere Navigation während der Bezeichnung.

      • Navigation: Sie können Bezeichnungen für beschriftete Wörter in einem Dokument auswählen.

      • Automatische Tabellenbezeichnung: Nachdem Sie das Tabellensymbol in einem Dokument ausgewählt haben, können Sie die extrahierte Tabelle in der Beschriftungsansicht automatisch beschriften.

      • Bezeichnung von Untertypen und Untertypen der zweiten Ebene: Studio unterstützt jetzt Untertypen für Tabellenspalten, Tabellenzeilen und Untertypen der zweiten Ebene für Typen wie Datumsangaben und Zahlen.

  • Das Erstellen benutzerdefinierter neuronaler Modelle wird jetzt in der Region „US Gov Virginia“ unterstützt.

  • Die API-Vorschauversionen 2022-01-30-preview und 2021-09-30-preview werden am 31. Januar 2023 eingestellt. Aktualisieren Sie auf die API-Version 2022-08-31, um Dienstunterbrechungen zu vermeiden.


November 2022

  • Ankündigung der neuesten stabilen Version von Azure KI Dokument Intelligenz-Bibliotheken
    • Dieses Release enthält wichtige Änderungen und Updates für .NET-, Java-, JavaScript- und Python-Clientbibliotheken. Weitere Informationen finden Sie unter Azure SDK DevBlog.
    • Die wichtigsten Verbesserungen sind die Einführung von zwei neuen Clients: DocumentAnalysisClient und DocumentModelAdministrationClient.

Oktober 2022

  • Dokument Intelligenz-Inhalte mit Versionsangabe

    • Die Dokumentation zu Dokument Intelligenz wurde aktualisiert, um Inhalte mit Versionsangaben anzuzeigen. Jetzt können Sie wählen, ob Sie die Inhalte für die Version v3.0 GA oder die Version v2.1 GA anzeigen möchten. Die Oberfläche der Version 3.0 ist die Standardeinstellung.

      Screenshot der Landing Page für Dokument Intelligenz mit dem Dropdownmenü „Version“

  • Dokument Intelligenz Studio-Beispielcode

    • Beispielcode für die Dokument Intelligenz Studio-Umgebung für Beschriftungen ist jetzt auf GitHub verfügbar. Kunden können Dokument Intelligenz entwickeln und in ihre eigene Benutzeroberfläche integrieren oder ihre eigene neue Benutzeroberfläche mithilfe des Dokument Intelligenz Studio-Beispielcodes erstellen.
  • Spracherweiterung

    • In der neuesten Vorschauversion unterstützen die Vorlagenmodelle Read (OCR), Layout und Custom der Dokument Intelligenz jetzt 134 neue Sprachen. Zu diesen Sprachergänzungen gehören Griechisch, Lettisch, Serbisch, Thai, Ukrainisch und Vietnamesisch sowie mehrere Sprachen in lateinischer und kyrillischer Schrift. Dokument Intelligenz unterstützt jetzt insgesamt 299 Sprachen in den aktuellen GA- und neuen Vorschauversionen. Auf der Seite „Unterstützte Sprachen“ finden Sie alle unterstützen Sprachen.
    • Verwenden Sie den REST-API-Parameter api-version=2022-06-30-preview, wenn Sie die API oder das entsprechende SDK verwenden, um die neuen Sprachen in Ihren Anwendungen zu unterstützen.
  • Neues vordefiniertes Vertragsmodell

    • Ein neues vordefiniertes Modell, das Informationen aus Verträgen wie Parteien, Titel, Vertrags-ID, Unterzeichnungsdatum usw. extrahiert. Das Vertragsmodell befindet sich derzeit in der Vorschau. Hier können Sie Zugriff anfordern.
  • Regionserweiterung für das Training benutzerdefinierter neuronaler Modelle

    • Das Training von benutzerdefinierten neuronalen Modellen wird jetzt in weiteren Regionen unterstützt.
      • East US
      • USA (Ost 2)
      • US Gov Arizona

September 2022

Hinweis

Ab Version 4.0.0 wird eine neue Gruppe von Clients eingeführt, um die neuesten Features des Dokument Intelligenz-Diensts zu nutzen.

SDK-Version 4.0.0 GA-Release enthält die folgenden Updates:

  • Version 4.0.0: allgemein verfügbar (2022-09-08)
  • Unterstützt Clients mit REST-API v3.0 und v2.0

Paket (NuGet)

Änderungsprotokoll/Releaseverlauf

Migrationsleitfaden

Infodatei

Beispiele

  • Regionserweiterung zum Trainieren benutzerdefinierter neuronaler Modelle jetzt in sechs neuen Regionen unterstützt

    • Australien (Osten)
    • USA (Mitte)
    • Asien, Osten
    • Frankreich, Mitte
    • UK, Süden
    • USA, Westen 2
    • Eine vollständige Liste der Regionen, in denen Training unterstützt wird, finden Sie unter Benutzerdefinierte neuronale Modelle.

    • Document Intelligence SDK-Version, Release 4.0.0 GA:

      • Version 4.0.0 (.NET/C#, Java, JavaScript) und Version 3.2.0 (Python) der Document Intelligence-Clientbibliotheken sind allgemein verfügbar und können in Produktionsanwendungen verwendet werden.
      • Weitere Informationen zu Document Intelligence-Clientbibliotheken finden Sie in der SDK-Übersicht.
      • Aktualisieren Sie Ihre Anwendungen mithilfe des Migrationsleitfadens für Ihre Programmiersprache.

August 2022

Die Vorschauversion der Dokument Intelligenz-SDK-Beta vom August 2022 enthält die folgenden Updates:

Version 4.0.0-beta.5 (2022-08-09)

Änderungsprotokoll/Releaseverlauf

Paket (NuGet)

SDK-Referenzdokumentation

  • Dokument Intelligenz v3.0 ist allgemein verfügbar.

    • Dokument Intelligenz REST-API v3.0 ist nun allgemein verfügbar und kann in Produktionsanwendungen verwendet werden! Aktualisieren Sie Ihre Anwendungen mit der REST-API-Version 2022-08-31.
  • Dokument Intelligenz Studio-Updates

    • Nächste Schritte: Unter jeder Modellseite verfügt das Studio jetzt über einen Abschnitt mit den nächsten Schritten. Benutzer können schnell auf Beispielcode, Richtlinien zur Problembehandlung und Preisinformationen zugreifen.
    • Benutzerdefinierte Modelle: Das Studio enthält jetzt die Möglichkeit, Bezeichnungen in benutzerdefinierten Modellprojekten neu anzuordnen, um die Bezeichnungseffizienz zu verbessern.
    • Kopieren von Modellen: Benutzerdefinierte Modelle können aus dem Studio in verschiedene Dokument Intelligenz-Dienste kopiert werden. Dieser Vorgang ermöglicht die Höherstufung eines trainierten Modells auf andere Umgebungen und Regionen.
    • Löschen von Dokumenten: Das Studio unterstützt jetzt das Löschen von Dokumenten aus beschrifteten Datasets in benutzerdefinierten Projekten.
  • Updates für den Dokument Intelligenz-Dienst

    • prebuilt-read. Das Lese-OCR-Modell ist jetzt auch in Dokument Intelligenz mit den beiden neuen Features für Absätze und Spracherkennung verfügbar. Erweiterte Dokumentszenarien von Lesezielen der Dokument Intelligenz, die mit den erweiterten Dokumentintelligenzfunktionen in der Dokument Intelligenz abgestimmt sind.
    • prebuilt-layout. Das Layoutmodell extrahiert Absätze und gibt an, ob der extrahierte Text ein Absatz, Titel, Abschnittsüberschrift, eine Fußnote, ein Seitenkopf, ein Seitenfuß oder eine Seitenzahl ist.
    • prebuilt-invoice. Die Felder „MwSt. gesamt“ und „Position/MwSt.“ werden nun in die vorhandenen Felder „Steuern gesamt“ respektive „Position/Steuern“ aufgelöst.
    • prebuilt-idDocument. Unterstützung der Datenextraktion für US-amerikanische Ausweise, Sozialversicherungskarten und Green Cards. Unterstützung für Pass- und Visainformationen.
    • prebuilt-receipt. Erweiterte Gebietsschemaunterstützung für Französisch (fr-FR), Spanisch (es-ES), Portugiesisch (pt-PT), Italienisch (it-IT) und Deutsch (de-DE)
    • prebuilt-businessCard. Adressanalyseunterstützung zum Extrahieren von untergeordneten Feldern für Adresskomponenten wie Adresse, Ort, Bundesland/Kanton, Land/Region und Postleitzahl.
  • Verbesserungen der KI-Qualität

    • prebuilt-read. Verbesserte Unterstützung für einzelne Zeichen, handschriftliche Datumsangaben, Beträge, Namen, andere wichtige Daten, die häufig in Quittungen und Rechnungen zu finden sind, sowie verbesserte Verarbeitung digitaler PDF-Dokumente.
    • prebuilt-layout. Unterstützung für eine bessere Erkennung von zugeschnittenen Tabellen und rahmenlosen Tabellen sowie verbesserte Erkennung von langen übergreifenden Zellen.
    • prebuilt-document. Verbesserte Wert- und Kontrollkästchenerkennung
    • custom-neural. Verbesserte Genauigkeit für die Tabellenerkennung und -extraktion

Juni 2022

  • Die Vorschauversion der Dokument Intelligenz-SDK-Beta vom Juni 2022 enthält die folgenden Updates:

Februar 2022

  • Das Vorschaurelease von Document Intelligence Version 3.0 bietet mehrere neue Features, Funktionen und Verbesserungen:

    • Benutzerdefiniertes neuronales Modell oder benutzerdefiniertes Dokumentmodell ist ein neues benutzerdefiniertes Modell zum Extrahieren von Text- und Auswahlmarkierungen aus strukturierten Formularen, halbstrukturierten und unstrukturierten Dokumenten.
    • Das vordefinierte W-2-Modell ist ein neues vordefiniertes Modell zum Extrahieren von Feldern aus W-2-Formularen für Steuererklärungs- und Einkommensüberprüfungsszenarien.
    • Die Lese-API extrahiert gedruckte Textzeilen, Wörter, Textpositionen, erkannte Sprachen und handschriftlichen Text, sofern erkannt.
    • Das vortrainierte Modell Allgemeines Dokument wurde jetzt so aktualisiert, dass neben API-Text, Tabellen, Struktur und Schlüssel-Wert-Paaren aus Formularen und Dokumenten auch Auswahlmarkierungen unterstützt werden.
    • Rechnungs-API Das vordefinierte Rechnungsmodell erweitert die Unterstützung auf spanischen Rechnungen.
    • Dokument Intelligenz Studio fügt neue Demos für Lese-, W2-, Hotelbelegbeispiele und Unterstützung für das Training der neuen benutzerdefinierten neuronalen Modelle hinzu.
    • Spracherweiterung Mit „Lesen“, „Layout“ und „Benutzerdefiniertes Formular“ von Dokument Intelligenz wird Unterstützung für 42 neue Sprachen hinzugefügt, einschließlich Arabisch, Hindi und anderen Sprachen, die arabische oder Devanagari-Schriften verwenden, um die Abdeckung auf 164 Sprachen zu erweitern. Die handschriftliche Sprachunterstützung wird auf Japanisch und Koreanisch erweitert.
  • Erste Schritte mit der neuen API der Vorschauversion 3.0

  • Document Intelligence-Modelldatenextraktion:

    Modell Textextraktion Schlüssel-Werte-Paare Auswahlmarkierungen Tabellen Signaturen
    Lesen
    Allgemeines Dokument
    Layout
    Rechnung
    Rechnung
    ID-Dokument
    Visitenkarte
    Benutzerdefiniertes Vorlagenmodell
    Benutzerdefiniertes neuronales Modell
  • Die Vorschauversion der Dokument Intelligenz-SDK-Beta enthält die folgenden Updates:


Nächste Schritte