Создание проекта пользовательский анализ текста для здоровья
Используйте эту статью, чтобы узнать, как настроить требования для начала с пользовательской аналитики текста для работоспособности и создать проект.
Необходимые компоненты
Прежде чем приступить к использованию пользовательской аналитики текста для работоспособности, вам потребуется:
- Подписка Azure — создайте бесплатную учетную запись.
Создание ресурса Языковой службы
Прежде чем приступить к использованию пользовательской аналитики текста для работоспособности, вам потребуется ресурс языка искусственного интеллекта Azure. Рекомендуется создать ресурс языка и подключить к ней учетную запись хранения в портал Azure. Создание ресурса в портал Azure позволяет одновременно создавать учетную запись хранения Azure с предварительно настроенными разрешениями. Дополнительные сведения см. в статье, чтобы узнать, как использовать существующий ресурс и настроить его для работы с пользовательской аналитикой текста для работоспособности.
Вам также потребуется учетная запись хранения Azure. В нее будут отправляться документы .txt
, которые будут использоваться для обучения модели умению извлекать сущности.
Примечание.
- Чтобы создать ресурс Языка, требуется роль владельца, назначенная группе ресурсов.
- Если вы подключите ранее существующую учетную запись хранения, ей должна быть назначена роль владельца.
Создание языкового ресурса и подключение учетной записи хранения
Ресурс можно создать следующими способами:
- Портал Azure
- Language Studio
- PowerShell
Примечание.
Не следует перемещать учетную запись хранения в другую группу ресурсов или подписку после того, как учетная запись хранения была связана с языковым ресурсом.
Создание ресурса на портале Azure
Перейдите к портал Azure, чтобы создать новый ресурс языка искусственного интеллекта Azure.
В появившемся окне выберите эту службу из настраиваемых функций. Нажмите кнопку "Продолжить", чтобы создать ресурс в нижней части экрана.
Создайте ресурс службы "Язык" с приведенными ниже сведениями.
Имя Описание Подписка Вашу подписку Azure. Группа ресурсов Группа ресурсов, которая будет содержать ваш ресурс. Можно использовать существующую группу или создать новую. Область/регион Регион для ресурса службы "Язык". Например, "Западная часть США 2". Имя. Имя ресурса. Ценовая категория Ценовая категория ресурса Языка. Вы можете использовать уровень "Бесплатный" (F0), чтобы поработать со службой. Примечание.
Если появится сообщение Ваша учетная запись входа не является владельцем выбранной группы ресурсов учетной записи хранения, значит, ваша учетная запись должна иметь роль владельца, назначенную группе ресурсов, — только тогда вы сможете создать ресурс службы "Язык". Обратитесь за помощью к владельцу подписки Azure.
В разделе этой службы выберите существующую учетную запись хранения или выберите новую учетную запись хранения. Эти значения для учетной записи хранения помогут вам быстро начать работу, но они не всегда подходят для реальных рабочих сред. Чтобы избежать задержек при создании проекта, подключитесь к учетным записям хранения в том же регионе, что и ресурс Языка.
Значение для учетной записи хранения Рекомендуемое значение Storage account name Любое имя Storage account type Standard LRS Убедитесь, что флажок Уведомление об ответственном применении ИИ установлен. В нижней части страницы щелкните Просмотр и создание, а затем нажмите Создать.
Создание ресурса Языка из Студии Языка
При первом входе вы увидите окно Студия Языка, с помощью которого можно выбрать или создать ресурс Языка. Чтобы создать ресурс, можно также щелкнуть значок параметров в правом верхнем углу и выбрать Ресурсы, а затем — Создать новый ресурс.
Создайте ресурс службы "Язык" с приведенными ниже сведениями.
Сведения об экземпляре | Обязательное значение |
---|---|
Подписка Azure. | Ваша подписка Azure |
Группа ресурсов Azure | Группа ресурсов Azure |
Имя ресурса Azure | Имя ресурса Azure |
Расположение | Регион |
Ценовая категория | Ценовая категория ресурса службы "Язык". |
Внимание
- Обязательно включите управляемое удостоверение при создании ресурса языка.
- Чтение и подтверждение уведомления об ответственном ИИ
Чтобы использовать эту службу, необходимо создать учетную запись хранения Azure, если у вас еще нет учетной записи хранения.
Создание нового ресурса службы "Язык" с помощью PowerShell
Вы можете создать новый ресурс и учетную запись хранения, используя следующие файлы шаблонов и параметров CLI, которые размещаются на GitHub.
Измените следующие значения в файле параметров:
Наименование параметра | Описание значения |
---|---|
name |
Имя вашего языкового ресурса |
location |
Регион, в котором размещается ресурс. |
sku |
Ценовая категория ресурса. |
storageResourceName |
Имя учетной записи хранения |
storageLocation |
Регион, в котором размещена учетная запись хранения. |
storageSkuType |
SKU учетной записи хранения. |
storageResourceGroupName |
Группа ресурсов учетной записи хранения |
Используйте следующую команду PowerShell, чтобы развернуть шаблон Azure Resource Manager (ARM) с измененными файлами.
New-AzResourceGroupDeployment -Name ExampleDeployment -ResourceGroupName ExampleResourceGroup `
-TemplateFile <path-to-arm-template> `
-TemplateParameterFile <path-to-parameters-file>
Сведения о развертывании шаблонов и файлах параметров см. в документации по шаблонам ARM.
Примечание.
- Процесс подключения учетной записи хранения к ресурсу Языка является необратимым — ее нельзя будет отключить позже.
- Вы можете подключить ресурс Языка только к одной учетной записи хранения.
Использование уже существующего ресурса службы "Язык"
Вы можете использовать существующий языковой ресурс, чтобы приступить к работе с настраиваемыми NER, если этот ресурс соответствует следующим требованиям:
Требование | Description |
---|---|
Регионы | Убедитесь, что существующий ресурс подготовлен в одном из поддерживаемых регионов. В противном случае необходимо будет создать новый ресурс в одном из них. |
Ценовая категория | Ценовая категория ресурса. |
Управляемое удостоверение | Убедитесь, что параметр удостоверения, управляемого ресурсом, включен. В противном случае изучите следующий раздел. |
Чтобы использовать пользовательский анализ текста для работоспособности, необходимо создать учетную запись хранения Azure, если у вас еще нет.
Включение управления удостоверениями для ресурса
Ресурс языка должен иметь управление удостоверениями. Чтобы включить его с помощью портал Azure, выполните следующие действия.
- Перейдите к ресурсу Языка.
- В меню слева в разделе Управление ресурсами выберите Удостоверение.
- На вкладке Назначаемое системой убедитесь, что для параметра Состояние установлено значение Включено.
Включение пользовательской аналитики текста для работоспособности
Обязательно включите настраиваемую классификацию текста / распознавание именованных сущностей и пользовательский анализ текста для функции работоспособности из портал Azure.
- Перейдите к своему ресурсу "Язык" на портале Azure.
- В меню слева в разделе Управление ресурсами выберите Компоненты.
- Включение пользовательской классификации текста / Распознавание пользовательских именованных сущностей / функция пользовательской аналитики текста
- Подключение к учетной записи хранения
- Нажмите кнопку Применить.
Внимание
- Убедитесь, что ресурс Языка имеет роль участника данных BLOB-объектов хранилища, назначенную подключаемой учетной записи хранения.
Добавление требуемых ролей
Выполните следующие действия, чтобы задать необходимые роли для ресурса Языка и учетной записи хранения.
Роли для ресурса языка ИИ Azure
Перейдите к своей учетной записи хранения или ресурсу Языка на портале Azure.
В расположенном слева меню навигации щелкните Управление доступом (IAM).
Щелкните Добавить, чтобы добавить назначения ролей, и выберите соответствующую роль для учетной записи.
В ресурсе Языка вам должна быть назначена роль владельца или участника.
В поле Назначить доступ к выберите Пользователь, группа или субъект-служба.
Щелкните Выбрать члены.
Выберите свое имя пользователя. В поле Выбор можно найти имена пользователей. Повторите это действие для всех ролей.
Повторите эти действия для всех учетных записей пользователей, которым требуется доступ к этому ресурсу.
Роли для учетной записи хранения
- Войдите на страницу своей учетной записи хранения на портале Azure.
- В расположенном слева меню навигации щелкните Управление доступом (IAM).
- Щелкните Добавить, чтобы добавить назначения ролей и выберите роль Участник для данных BLOB-объектов хранилища для учетной записи хранения.
- В поле Назначить доступ к выберите Управляемое удостоверение.
- Щелкните Выбрать члены.
- Укажите свою подписку и выберите Язык в качестве управляемого удостоверения. В поле Выбор можно найти имена пользователей.
Внимание
Если у вас есть виртуальная сеть или частная конечная точка, обязательно выберите разрешить службам Azure в списке доверенных служб доступ к этой учетной записи хранения в портал Azure.
Включение CORS для учетной записи хранения
Обязательно разрешите методы (GET, PUT, DELETE) при включении общего доступа к ресурсам из разных источников (CORS).
Задайте для поля разрешенных источников значение https://language.cognitive.azure.com
. Разрешите все заголовки, добавив *
в допустимые значения заголовков, и задайте максимальный возраст 500
.
Создание проекта пользовательский анализ текста для здоровья
После настройки контейнера ресурсов и хранилища создайте новую пользовательскую аналитику текста для проекта работоспособности. Проект — это рабочая область для создания настраиваемых моделей ИИ на основе данных. Получить доступ к вашему проекту можете только вы, а также другие пользователи, у которых есть доступ к используемому ресурсу Azure. Если у вас есть помеченные данные, вы можете использовать их, импортировав проект.
Войдите в Студию Языка. Появится окно, где можно выбрать свою подписку и ресурс служб "Язык". Выберите ресурс службы "Язык", созданный на предыдущем шаге.
В разделе "Извлечение сведений" в Language Studio выберите "Настраиваемые Анализ текста для работоспособности".
Щелкните Create new project (Создать новый проект) в меню в верхней части страницы проектов. Создание проекта позволяет помечать данные, обучать, оценивать, улучшать и развертывать модели.
Введите сведения о проекте, включая имя, описание и язык файлов в проекте. Если вы используете пример набора данных, выберите английский язык. Вы не можете изменить имя проекта позже. Выберите Далее
Совет
Набор данных не обязательно должен быть полностью на одном языке. У вас может быть несколько документов с разными поддерживаемыми языками. Если набор данных содержит документы с разными языками или если во время выполнения предполагается использовать тексты на разных языках, выберите параметр Включить многоязычный набор данных при вводе основных сведений о проекте. Этот параметр можно включить позже на странице Параметры проекта.
После нажатия кнопки "Создать проект" откроется окно, чтобы подключить учетную запись хранения. Если вы уже подключили учетную запись хранения, отобразится подключенная учетная запись хранения. Если нет, выберите учетную запись хранения в раскрывающемся списке и выберите " Подключить учетную запись хранения".Это позволит задать необходимые роли для учетной записи хранения. На этом шаге может появиться ошибка, если вы не назначены в качестве владельца учетной записи хранения.
Примечание.
- Этот шаг нужно выполнить только один раз для каждого нового используемого ресурса.
- Этот процесс необратим. Если учетная запись хранения будет подключена к ресурсу службы "Язык", ее нельзя будет отключить позже.
- Вы можете подключить ресурс службы "Язык" только к одной учетной записи хранения.
Выберите контейнер, в который отправили набор данных.
Если вы уже помечены данные, убедитесь, что он соответствует поддерживаемму формату и выберите "Да", мои файлы уже помечены, и я отформатировал файл меток JSON и выберите файл меток в раскрывающемся меню. Выберите Далее. Если вы используете набор данных из краткого руководства, нет необходимости просматривать форматирование файла меток JSON.
Проверьте введенные данные и щелкните Create Project (Создать проект).
Импорт проекта
Если данные уже помечены, их можно использовать для начала работы со службой. Убедитесь, что помеченные данные соответствуют допустимым форматам данных.
Войдите в Студию Языка. Появится окно, где можно выбрать свою подписку и ресурс служб "Язык". Выберите свой языковой ресурс.
В разделе "Извлечение сведений" в Language Studio выберите "Пользовательский анализ текста" для работоспособности.
Щелкните Create new project (Создать новый проект) в меню в верхней части страницы проектов. Создав проект, вы сможете отмечать данные тегами, а также обучать, оценивать, улучшать и развертывать модели.
Когда вы выберете Создать проект, появится экран, где вы сможете подключить учетную запись хранения. Если вы не можете найти свою учетную запись хранения, убедитесь, что вы создали ресурс, выполнив рекомендуемые действия. Если вы уже подключили учетную запись хранения к ресурсу Языка, вы увидите, что она подключена.
Примечание.
- Этот шаг нужно выполнить только один раз для каждого нового используемого ресурса Языка.
- Этот процесс необратим. Если учетная запись хранения будет подключена к ресурсу службы "Язык", ее нельзя будет отключить позже.
- Вы можете подключить ресурс службы "Язык" только к одной учетной записи хранения.
Введите сведения о проекте, включая имя, описание и язык файлов в проекте. Вы не сможете изменить имя проекта на более поздних этапах. Выберите Далее.
Совет
Набор данных не обязательно должен быть полностью на одном языке. У вас может быть несколько документов с разными поддерживаемыми языками. Если набор данных содержит документы с разными языками или если во время выполнения предполагается использовать тексты на разных языках, выберите параметр Включить многоязычный набор данных при вводе основных сведений о проекте. Этот параметр можно включить позже на странице Параметры проекта.
Выберите контейнер, в который отправили набор данных.
Выберите "Да", мои файлы уже помечены, и я отформатировал файл меток JSON и выберите файл меток в раскрывающемся меню ниже, чтобы импортировать файл меток JSON. Убедитесь, что он соответствует поддерживаемому формату.
Выберите Далее.
Проверьте введенные данные и щелкните Create Project (Создать проект).
Получение сведений о проекте
Перейдите к странице настроек проекта в Language Studio.
Вы можете просмотреть сведения о проекте.
На этой странице можно изменить описание проекта и включить или отключить многоязычный набор данных.
Вы также можете просмотреть подключенную учетную запись хранения и контейнер для ресурса службы "Язык".
Кроме того, на ней можно получить ключ основного ресурса на этой странице.
Удаление проекта
Если проект вам больше не нужен, вы можете удалить его с помощью Студии Языка.
- Выберите функцию языковой службы, которую вы используете в верхней части страницы,
- Выберите проект, который требуется удалить
- В верхнем меню выберите Удалить.
Следующие шаги
Вы должны иметь представление о схеме проекта, которая будет использоваться для добавления меток к данным.
После определения схемы можно начать маркировку данных, которая будет использоваться для обучения модели, оценки и, наконец, прогнозирования.