Поделиться через


Модели ипотечных документов аналитики документов document

Это содержимое относится к: флажок версии 4.0 (GA)

Модели ипотеки document Intelligence используют мощные возможности оптического распознавания символов (OCR) и модели глубокого обучения для анализа и извлечения ключевых полей из ипотечных документов. Ипотечные документы могут иметь различные форматы и качество. API анализирует ипотечные документы и возвращает структурированное представление данных JSON. В настоящее время модели поддерживают только документы на английском языке. С помощью последней версии 4.0 теперь можно извлечь подписи из ипотечных приложений и форм.

Поддерживаемые типы документов:

  • Универсальное заявление о жилищном кредите (форма 1003)
  • Единый отчет об оценке жилых домов (форма 1004)
  • Проверка формы трудоустройства (форма 1005)
  • Унифицированное подзаписи и сводка по передаче (форма 1008)
  • Закрытие формы раскрытия

Варианты разработки

Аналитика документов версии 4.0 (2024-11-30-GA) поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель ипотеки Аналитика
документов• REST API
• ПАКЕТ SDK
для C#
• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
• предварительно созданная ипотека.us.1003
• предварительно созданная ипотека.us.1004
• предварительно созданная ипотека.us.1005
• предварительно созданная ипотека.us.1008
• предварительно созданная ипотека.us.closingDisclosure

Требования к входным данным

  • Поддерживаемые форматы файлов:

    Модель PDF Изображение:
    JPEG/JPG, , BMPPNGTIFFHEIF
    Microsoft Office:
    Word (), Excel (XLSXDOCX), PowerPoint (PPTX), HTML
    Читать
    Макет
    Документ общего назначения
    Готовое
    Настраиваемая функция извлечения
    Настраиваемая классификация
  • Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.

  • Для PDF и TIFF можно обрабатывать до 2000 страниц (с подпиской на бесплатный уровень только первые две страницы обрабатываются).

  • Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).

  • Размеры изображения должны составлять от 50 пикселей до 50 пикселей и 10 000 пикселей x 10 000 пикселей.

  • Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.

  • Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту 8 точки в 150 точек на дюйм (DPI).

  • Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.

    • Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1 ГБ для нейронной модели.

    • Для обучения пользовательской модели классификации общий размер обучающих данных составляет 1 ГБ не более 10 000 страниц. Для 2024-11-30 (GA) общий размер обучающих данных составляет 2 ГБ с не более чем 10 000 страниц.

Попробуйте извлечение данных ипотечных документов

Чтобы узнать, как работает извлечение данных для службы ипотечных документов, вам потребуется следующее:

  • Подписка Azure — ее можно создать бесплатно.

  • Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (F0), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.

Снимок экрана: расположение ключей и конечной точки на портале Azure.

Document Intelligence Studio

  1. На домашней странице Document Intelligence Studio выберите "Ипотека".

  2. Вы можете проанализировать примеры ипотечных документов или отправить собственные файлы.

  3. Нажмите кнопку "Выполнить анализ", а при необходимости настройте параметры анализа:

    Снимок экрана: кнопки

Поддерживаемые языки и языковые стандарты

См . страницу предварительно созданных моделей для полного списка поддерживаемых языков.

Извлечение полей

Поддерживаемые поля извлечения документов см. на страницах схемы модели ипотечных документов в нашем примере репозитория GitHub.

Следующие шаги

  • Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.