Начало работы с пользовательскими проектами в Document Intelligence Studio
Это содержимое относится к: версии 4.0 (GA) | Предыдущие версии: v3.1 (GA) версии 3.0 (GA)
Document Intelligence Studio — это онлайн-средство для визуального изучения, понимания и интеграции функций из службы аналитики документов в приложениях. В этом кратком руководстве описано, как настроить пользовательский проект в Document Intelligence Studio.
Предварительные требования для новых пользователей
Ознакомьтесь со следующей документацией по созданию подписок и ресурсов, а также настройке проверки подлинности.
Дополнительные предварительные требования для пользовательских проектов
Помимо учетной записи Azure и ресурса аналитики документов или служб ИИ Azure, вам потребуется:
Контейнер хранилища BLOB-объектов Azure
Учетная запись Хранилища BLOB-объектов Azure с производительностью уровня "Стандартный". Вы создаете контейнеры для хранения и упорядочивания документов обучения в учетной записи хранения. Если вы не знаете, как создать учетную запись хранения Azure с контейнером, обратитесь к следующим кратким руководствам:
- Создание учетной записи хранения. При создании учетной записи хранения выберите уровень производительности Стандартный в поле Сведения об экземпляре → Производительность.
- Создание контейнера. При создании контейнера в окне Создание контейнера установите для поля Уровень общего доступа значение Контейнер (анонимный доступ на чтение для контейнеров и BLOB-объектов).
Назначения ролей Azure
Для пользовательских проектов для различных сценариев требуются следующие назначения ролей.
Базовая
- Пользователь Cognitive Services. Для обучения пользовательской модели или анализа с обученными моделями требуется эта роль для аналитики документов или служб искусственного интеллекта Azure.
- Участник данных BLOB-объектов хранилища. Эта роль необходима для создания проекта и меток данных учетной записи хранения.
Расширенные
- Участник учетной записи хранения. Эта роль необходима для настройки параметров CORS учетной записи хранения (это одноразовая попытка при повторном использовании той же учетной записи хранения).
- Участник. Для создания группы ресурсов и ресурсов требуется эта роль.
Примечание.
Если локальная (на основе ключа) проверка подлинности отключена для ресурса службы аналитики документов и учетной записи хранения, обязательно получите роли участника данных пользователей и blob-объектов Cognitive Services соответственно, поэтому у вас достаточно разрешений на использование Document Intelligence Studio. Роли участника и участника учетной записи хранения позволяют перечислять ключи, но не дают разрешения на использование ресурсов при отключении доступа к ключам.
Настройка CORS
CORS (общий доступ к ресурсам между источниками) необходимо настроить в учетной записи хранения Azure, чтобы она была доступна в Студии аналитики документов. Чтобы настроить CORS в портал Azure, необходимо получить доступ к вкладке CORS учетной записи хранения.
Выберите вкладку CORS для учетной записи хранения.
Начните с создания записи CORS в службе BLOB-объектов.
В поле Разрешенные источники введите
https://documentintelligence.ai.azure.com
.Совет
Можно не указывать домен, а воспользоваться подстановочным знаком *, чтобы разрешить всем исходным доменам делать запросы через CORS.
Выберите все доступные 8 параметров для разрешенных методов.
Утвердите все допустимые и предоставляемые заголовки, введя * в каждом поле.
Установите для параметра Максимальный возраст 120 секунд или любое допустимое значение.
Чтобы сохранить изменения, нажмите кнопку сохранения в верхней части страницы.
ТЕПЕРЬ CORS следует настроить для использования учетной записи хранения из Document Intelligence Studio.
Набор примеров документов
Войдите в портал Azure и перейдите к контейнерам хранилища данных учетной записи>хранения.>
Выберите контейнер из списка.
В меню в верхней части страницы нажмите кнопку Отправить.
Появится окно Отправить BLOB-объект.
Выберите файлы для отправки.
Примечание.
По умолчанию Студия будет использовать документы, расположенные в корне контейнера. Однако можно использовать данные, упорядоченные в папки, указав путь к папке в пошаговом процессе создания настраиваемой формы. См. раздел Упорядочение данных во вложенных папках
Использование функций Document Intelligence Studio
Автоматические документы с предварительно созданными моделями или одной из собственных моделей
На странице меток модели извлечения можно автоматически пометить документы с помощью одной из предварительно созданных моделей или обученных моделей.
Для некоторых документов возможны повторяющиеся метки после запуска автоматической метки. Обязательно измените метки таким образом, чтобы на странице маркировки не было повторяющихся меток.
Автоматические таблицы меток
На странице маркировки пользовательской модели извлечения теперь можно автоматически пометить таблицы в документе без необходимости пометить таблицы вручную.
Добавление тестовых файлов непосредственно в обучающий набор данных
Обучив пользовательскую модель извлечения, используйте тестовую страницу для улучшения качества модели, отправив тестовые документы в обучающий набор данных при необходимости.
Если для некоторых меток возвращается оценка достоверности с низким уровнем достоверности, убедитесь, что вы правильно помечаете содержимое. Если нет, добавьте их в набор данных обучения и перенастройте их для улучшения качества модели.
Использование параметров списка документов и фильтров в пользовательских проектах
Используйте страницу меток модели пользовательского извлечения, чтобы легко перемещаться по учебным документам, используя поиск, фильтрацию и сортировку по функциям.
Используйте представление сетки для предварительного просмотра документов или используйте представление списка для упрощения прокрутки документов.
Общий доступ к проекту
Удобно использовать пользовательские проекты извлечения. Дополнительные сведения см. в разделе "Общий доступ к проекту" с пользовательскими моделями.
Следующие шаги
- Следуйте руководству по миграции аналитики документов версии 3.1, чтобы узнать о различиях в предыдущей версии REST API.
- Ознакомьтесь с краткими руководствами по пакету SDK версии 4.0, чтобы попробовать функции версии 3.0 в приложениях с помощью новых клиентских библиотек.
- Ознакомьтесь с краткими руководствами по REST API версии 4.0, чтобы попробовать функции версии 3.0 с помощью нового REST API.
Начало работы с Студией аналитики документов.