Dokumentintelligenzmodelle für Hypothekendokumente

Artikel
12/12/2024

Dieser Inhalt gilt für: Version 4.0 (GA)

Die Dokumentintelligenzmodelle für Hypotheken verwendet leistungsstarke OCR (Optical Character Recognition)-Funktionen und Deep Learning-Modelle, um Schlüsselfelder aus Hypothekendokumenten zu analysieren und zu extrahieren. Hypothekendarlehen können in verschiedenen Formaten und Qualitäten vorliegen. Die API analysiert Hypothekendokumente und gibt eine strukturierte JSON-Datendarstellung zurück. Die Modelle unterstützen derzeit nur Dokumente in englischer Sprache. Mit der neuesten Version 4.0 können Sie jetzt Signaturen aus Hypothekenanträgen und -formularen extrahieren.

Unterstützte Dokumenttypen:

Einheitlicher Antrag für ein Wohnungsbaudarlehen (Formular 1003)
Einheitlicher Bericht über die Bewertung von Wohnimmobilien (Uniform Residential Appraisal Report, Formular 1004)
Formular „Überprüfung der Beschäftigung“ (Verification Of Employment Form, Formular 1005)
Einheitliche Zeichnungs- und Übertragungszusammenfassung (Formular 1008)
Offenlegung des Abschlusses-Formular

Entwicklungsoptionen

Dokument Intelligenz Version 4.0 (2024-11-30-GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Funktion	Ressourcen	Modell-ID
Hypothekenmodell	• Document Intelligence Studio • REST-API • C# SDK • Python SDK • Java SDK • JavaScript SDK	• prebuilt-mortgage.us.1003 • prebuilt-mortgage.us.1004 • prebuilt-mortgage.us.1005 • prebuilt-mortgage.us.1008 • prebuilt-mortgage.us.closingDisclosure

Eingabeanforderungen

Unterstützte Dateiformate:

Modell	PDF	Abbildung: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Lesen Sie	✔	✔	✔
Layout	✔	✔	✔
Allgemeines Dokument	✔	✔
Vordefiniert	✔	✔
Benutzerdefinierte Extraktion	✔	✔
Benutzerdefinierte Klassifizierung	✔	✔	✔

Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.
In den Formaten PDF und TIFF können bis zu 2,000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).
Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für den kostenpflichtigen Tarif (S0) und 4 MB für den kostenlosen Tarif (F0).
Die Bildgröße muss zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.
Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.
Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem 8-Punkttext bei 150 Punkten pro Zoll (Dots Per Inch, DPI).
Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.
- Für das Training benutzerdefinierter Extraktionsmodelle beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1 GB für das neuronale Modell.
- Für das Training benutzerdefinierter Klassifizierungsmodelle beträgt die Gesamtgröße der Trainingsdaten 1 GB bei maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Trainingsdaten 2 GB bei maximal 10.000 Seiten.

Testen der Datenextraktion für Hypothekendokumente

Um zu sehen, wie die Datenextraktion für den Hypothekendokumentdienst funktioniert, benötigen Sie die folgenden Ressourcen:

Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).
Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot: Schlüssel und Endpunkt im Azure-Portal

Dokument Intelligenz Studio

Wählen Sie auf der Startseite von Dokument Intelligenz Studio die Option Hypothek aus.
Sie können die Muster-Hypothekendokumente analysieren oder Ihre eigenen Dateien hochladen.
Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:

Dokument Intelligenz Studio testen

Unterstützte Sprachen und Gebietsschemas

Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung ‒ vordefinierte Modelle.

Feldextraktion

Weitere Informationen zu unterstützten Feldern für die Dokumentextraktion finden Sie in unserem GitHub-Beispielrepository auf der Seite mit dem Modellschema für Hypothekendokumente.

Nächste Schritte

Versuchen Sie, Ihre eigenen Formulare und Dokumente mithilfe von Dokument Intelligenz Studio zu verarbeiten.
Führen Sie eine Dokument Intelligenz-Schnellstartanleitung durch, und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.

Freigeben über