Freigeben über


Dokumentintelligenzmodelle für Hypothekendokumente

Dieser Inhalt gilt für: Häkchen Version 4.0 (GA)

Die Dokumentintelligenzmodelle für Hypotheken verwendet leistungsstarke OCR (Optical Character Recognition)-Funktionen und Deep Learning-Modelle, um Schlüsselfelder aus Hypothekendokumenten zu analysieren und zu extrahieren. Hypothekendarlehen können in verschiedenen Formaten und Qualitäten vorliegen. Die API analysiert Hypothekendokumente und gibt eine strukturierte JSON-Datendarstellung zurück. Die Modelle unterstützen derzeit nur Dokumente in englischer Sprache. Mit der neuesten Version 4.0 können Sie jetzt Signaturen aus Hypothekenanträgen und -formularen extrahieren.

Unterstützte Dokumenttypen:

  • Einheitlicher Antrag für ein Wohnungsbaudarlehen (Formular 1003)
  • Einheitlicher Bericht über die Bewertung von Wohnimmobilien (Uniform Residential Appraisal Report, Formular 1004)
  • Formular „Überprüfung der Beschäftigung“ (Verification Of Employment Form, Formular 1005)
  • Einheitliche Zeichnungs- und Übertragungszusammenfassung (Formular 1008)
  • Offenlegung des Abschlusses-Formular

Entwicklungsoptionen

Dokument Intelligenz Version 4.0 (2024-11-30-GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Funktion Ressourcen Modell-ID
Hypothekenmodell Document Intelligence Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-mortgage.us.1003
• prebuilt-mortgage.us.1004
• prebuilt-mortgage.us.1005
• prebuilt-mortgage.us.1008
• prebuilt-mortgage.us.closingDisclosure

Eingabeanforderungen

  • Unterstützte Dateiformate:

    Modell PDF Abbildung:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lesen Sie
    Layout
    Allgemeines Dokument
    Vordefiniert
    Benutzerdefinierte Extraktion
    Benutzerdefinierte Klassifizierung
  • Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.

  • In den Formaten PDF und TIFF können bis zu 2,000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).

  • Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für den kostenpflichtigen Tarif (S0) und 4 MB für den kostenlosen Tarif (F0).

  • Die Bildgröße muss zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.

  • Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.

  • Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem 8-Punkttext bei 150 Punkten pro Zoll (Dots Per Inch, DPI).

  • Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.

    • Für das Training benutzerdefinierter Extraktionsmodelle beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1 GB für das neuronale Modell.

    • Für das Training benutzerdefinierter Klassifizierungsmodelle beträgt die Gesamtgröße der Trainingsdaten 1 GB bei maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Trainingsdaten 2 GB bei maximal 10.000 Seiten.

Testen der Datenextraktion für Hypothekendokumente

Um zu sehen, wie die Datenextraktion für den Hypothekendokumentdienst funktioniert, benötigen Sie die folgenden Ressourcen:

  • Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).

  • Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot: Schlüssel und Endpunkt im Azure-Portal

Dokument Intelligenz Studio

  1. Wählen Sie auf der Startseite von Dokument Intelligenz Studio die Option Hypothek aus.

  2. Sie können die Muster-Hypothekendokumente analysieren oder Ihre eigenen Dateien hochladen.

  3. Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:

    Screenshot der Schaltflächen „Analyse ausführen“ und „Analyseoptionen“ im Document Intelligence Studio.

Unterstützte Sprachen und Gebietsschemas

Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung ‒ vordefinierte Modelle.

Feldextraktion

Weitere Informationen zu unterstützten Feldern für die Dokumentextraktion finden Sie in unserem GitHub-Beispielrepository auf der Seite mit dem Modellschema für Hypothekendokumente.

Nächste Schritte