Поделиться через


Начало работы с пользовательскими проектами в Document Intelligence Studio

Это содержимое относится к: версии 4.0 (GA) | Предыдущие версии:флажоксиняя галочка v3.1 (GA) версии 3.0 (GA) синяя галочка

Document Intelligence Studio — это онлайн-средство для визуального изучения, понимания и интеграции функций из службы аналитики документов в приложениях. В этом кратком руководстве описано, как настроить пользовательский проект в Document Intelligence Studio.

Предварительные требования для новых пользователей

Ознакомьтесь со следующей документацией по созданию подписок и ресурсов, а также настройке проверки подлинности.

Дополнительные предварительные требования для пользовательских проектов

Помимо учетной записи Azure и ресурса аналитики документов или служб ИИ Azure, вам потребуется:

Контейнер хранилища BLOB-объектов Azure

Учетная запись Хранилища BLOB-объектов Azure с производительностью уровня "Стандартный". Вы создаете контейнеры для хранения и упорядочивания документов обучения в учетной записи хранения. Если вы не знаете, как создать учетную запись хранения Azure с контейнером, обратитесь к следующим кратким руководствам:

  • Создание учетной записи хранения. При создании учетной записи хранения выберите уровень производительности Стандартный в поле Сведения об экземпляре → Производительность.
  • Создание контейнера. При создании контейнера в окне Создание контейнера установите для поля Уровень общего доступа значение Контейнер (анонимный доступ на чтение для контейнеров и BLOB-объектов).

Назначения ролей Azure

Для пользовательских проектов для различных сценариев требуются следующие назначения ролей.

  • Базовая

    • Пользователь Cognitive Services. Для обучения пользовательской модели или анализа с обученными моделями требуется эта роль для аналитики документов или служб искусственного интеллекта Azure.
    • Участник данных BLOB-объектов хранилища. Эта роль необходима для создания проекта и меток данных учетной записи хранения.
  • Расширенные

    • Участник учетной записи хранения. Эта роль необходима для настройки параметров CORS учетной записи хранения (это одноразовая попытка при повторном использовании той же учетной записи хранения).
    • Участник. Для создания группы ресурсов и ресурсов требуется эта роль.

    Примечание.

    Если локальная (на основе ключа) проверка подлинности отключена для ресурса службы аналитики документов и учетной записи хранения, обязательно получите роли участника данных пользователей и blob-объектов Cognitive Services соответственно, поэтому у вас достаточно разрешений на использование Document Intelligence Studio. Роли участника и участника учетной записи хранения позволяют перечислять ключи, но не дают разрешения на использование ресурсов при отключении доступа к ключам.

Настройка CORS

CORS (общий доступ к ресурсам между источниками) необходимо настроить в учетной записи хранения Azure, чтобы она была доступна в Студии аналитики документов. Чтобы настроить CORS в портал Azure, необходимо получить доступ к вкладке CORS учетной записи хранения.

  1. Выберите вкладку CORS для учетной записи хранения.

    Снимок экрана: меню параметров CORS на портале Azure.

  2. Начните с создания записи CORS в службе BLOB-объектов.

  3. В поле Разрешенные источники введите https://documentintelligence.ai.azure.com.

    Снимок экрана, на котором показана конфигурация CORS для учетной записи хранения.

    Совет

    Можно не указывать домен, а воспользоваться подстановочным знаком *, чтобы разрешить всем исходным доменам делать запросы через CORS.

  4. Выберите все доступные 8 параметров для разрешенных методов.

  5. Утвердите все допустимые и предоставляемые заголовки, введя * в каждом поле.

  6. Установите для параметра Максимальный возраст 120 секунд или любое допустимое значение.

  7. Чтобы сохранить изменения, нажмите кнопку сохранения в верхней части страницы.

ТЕПЕРЬ CORS следует настроить для использования учетной записи хранения из Document Intelligence Studio.

Набор примеров документов

  1. Войдите в портал Azure и перейдите к контейнерам хранилища данных учетной записи>хранения.>

    Снимок экрана: меню хранилища данных в портал Azure.

  2. Выберите контейнер из списка.

  3. В меню в верхней части страницы нажмите кнопку Отправить.

    Снимок экрана: кнопка отправки контейнера в портал Azure.

  4. Появится окно Отправить BLOB-объект.

  5. Выберите файлы для отправки.

    Снимок экрана: окно отправки BLOB-объектов в портал Azure.

Примечание.

По умолчанию Студия будет использовать документы, расположенные в корне контейнера. Однако можно использовать данные, упорядоченные в папки, указав путь к папке в пошаговом процессе создания настраиваемой формы. См. раздел Упорядочение данных во вложенных папках

Использование функций Document Intelligence Studio

Автоматические документы с предварительно созданными моделями или одной из собственных моделей

  • На странице меток модели извлечения можно автоматически пометить документы с помощью одной из предварительно созданных моделей или обученных моделей.

    Анимированный снимок экрана: автоматическая маркировка в Студии.

  • Для некоторых документов возможны повторяющиеся метки после запуска автоматической метки. Обязательно измените метки таким образом, чтобы на странице маркировки не было повторяющихся меток.

    Снимок экрана: предупреждение о дублировании меток после автоматического добавления меток.

Автоматические таблицы меток

  • На странице маркировки пользовательской модели извлечения теперь можно автоматически пометить таблицы в документе без необходимости пометить таблицы вручную.

    Анимированный снимок экрана: автоматическая метка таблицы в Студии.

Добавление тестовых файлов непосредственно в обучающий набор данных

  • Обучив пользовательскую модель извлечения, используйте тестовую страницу для улучшения качества модели, отправив тестовые документы в обучающий набор данных при необходимости.

  • Если для некоторых меток возвращается оценка достоверности с низким уровнем достоверности, убедитесь, что вы правильно помечаете содержимое. Если нет, добавьте их в набор данных обучения и перенастройте их для улучшения качества модели.

    Анимированный снимок экрана, показывающий, как добавить тестовые файлы в набор данных для обучения.

Использование параметров списка документов и фильтров в пользовательских проектах

  • Используйте страницу меток модели пользовательского извлечения, чтобы легко перемещаться по учебным документам, используя поиск, фильтрацию и сортировку по функциям.

  • Используйте представление сетки для предварительного просмотра документов или используйте представление списка для упрощения прокрутки документов.

    Снимок экрана: параметры представления списка документов и фильтры.

Общий доступ к проекту

Удобно использовать пользовательские проекты извлечения. Дополнительные сведения см. в разделе "Общий доступ к проекту" с пользовательскими моделями.

Следующие шаги

Начало работы с Студией аналитики документов.