Когда вы удовлетворены тем, как работает модель, она готова к развертыванию и запрашивает прогнозы из речевых фрагментов. Развернутая модель становится доступной для использования через API прогнозирования.
После проверки производительности модели и принятия решения об использовании в вашей среде модели необходимо назначить развертывание, чтобы иметь возможность запрашивать ее. Назначаемая развертыванию модель становится доступной для использования с помощью API прогнозирования. Рекомендуется создать развертывание production, которому вы назначите созданную на данный момент лучшую модель, и использовать его в своей системе. Можно создать другое развертывание, называемое staging и назначить ему текущую рабочую модель, чтобы ее проверить. В проекте может быть не более 10 развертываний.
Выберите " Добавить развертывание", чтобы запустить мастер добавления развертывания .
Выберите "Создать новое имя развертывания", чтобы создать новое развертывание и назначить обученную модель из раскрывающегося списка ниже. В противном случае можно выбрать перезаписать существующее имя развертывания, чтобы эффективно заменить модель, используемую существующим развертыванием.
Примечание.
Для перезаписи существующего развертывания не требуется вносить изменения в вызов API прогнозирования, но полученные результаты будут основаны на новой назначенной модели.
Выберите обученную модель в раскрывающемся списке "Модель ".
Выберите "Развернуть" , чтобы запустить задание развертывания.
После успешного развертывания рядом с ним появится дата окончания срока действия. Окончание срока действия развертывания означает, что модель становится недоступной для использования в целях прогнозирования, что обычно происходит через двенадцать месяцев после окончания срока действия конфигурации обучения.
Отправка задания развертывания
Создайте запрос PUT, используя следующий URL-адрес, заголовки и текст JSON, чтобы начать развертывание модели распознавания разговорной речи.
Имя, используемое для развертывания. Это значение учитывает регистр.
staging
{API-VERSION}
Версия вызываемого API.
2023-04-01
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст запроса
{
"trainedModelLabel": "{MODEL-NAME}",
}
Ключ
Заполнитель
Значение
Пример
trainedModelLabel
{MODEL-NAME}
Имя модели, которое будет назначено развертыванию. Имена можно назначить только успешно обученным моделям. Это значение учитывает регистр.
myModel
После отправки запроса API вы получите ответ 202, указывающий на успешное выполнение. Извлеките значение operation-location из заголовков ответа. Оно будет иметь следующий формат:
Этот URL-адрес можно использовать для получения состояния задания развертывания.
Получение состояния задания развертывания
При отправке успешного запроса развертывания полный URL-адрес запроса для проверки состояния задания (включая конечную точку, имя проекта и идентификатор задания) содержится в заголовке ответа operation-location .
Используйте указанный ниже запрос GET для запроса состояния задания развертывания. Замените значения заполнителей собственными значениями.
Имя, используемое для развертывания. Это значение учитывает регистр.
staging
{JOB-ID}
Идентификатор для поиска состояния обучения модели.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Версия вызываемого API.
2023-04-01
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст ответа
После отправки запроса вы получите следующий ответ. Продолжайте опрос этой конечной точки до тех пор, пока значение параметра Состояние не изменится на "Выполнено".
После завершения тестирования модели, назначенной одному развертыванию, вы можете назначить эту модель другому развертыванию. Переключение развертываний включает в себя:
Назначение модели, назначенной первому развертыванию, второму развертыванию.
Назначение модели, назначенной второму развертыванию, первому развертыванию.
Этот процесс можно использовать для переключений развертываний production и staging, когда требуется взять модель, назначенную развертыванию staging, и назначить ее развертыванию production.
Чтобы удалить развертывание из Language Studio, выберите Развертывание модели. Затем выберите развертывание, которое нужно удалить, и выберите пункт "Удалить развертывание " в верхнем меню.
Создайте запрос DELETE, используя следующий URL-адрес, заголовки и текст JSON, чтобы удалить развертывание распознавания разговорной речи.
Перейдите на страницу развертывания модели в Language Studio.
Перейдите на вкладку "Регионы ".
Выберите " Добавить ресурс развертывания".
Выберите ресурс языка в другом регионе.
Теперь вы готовы развернуть проект в регионах, где назначены ресурсы.
Назначение ресурсов развертывания программным способом требует проверки подлинности Microsoft Entra**. Идентификатор Microsoft Entra используется для подтверждения доступа к ресурсам, которые вы хотите назначить проекту для развертывания в нескольких регионах. Сведения о программном использовании проверки подлинности Microsoft Entra при вызове REST API см. в документации по проверке подлинности служб искусственного интеллекта Azure.
Назначить ресурс
Отправьте запрос POST с помощью следующего URL-адреса, заголовков и текста JSON для назначения ресурсов развертывания.
Запросить URL-адрес
При создании запроса API используйте следующий URL-адрес. Замените значения заполнителей ниже собственными значениями.
Настраиваемый поддомен ресурса, который требуется назначить. В портал Azure на вкладке "Ключи" и "Конечная точка" ресурса в поле "Конечная точка" в URL-адресеhttps://<your-custom-subdomain>.cognitiveservices.azure.com/
contosoresource
region
{REGION-CODE}
Код региона, указывающий регион ресурса, который требуется назначить. Находится в портал Azure на вкладке "Ключи" и "Конечная точка" ресурса в поле "Расположение или регион".
eastus
Получение состояния ресурса
Используйте следующий запрос GET , чтобы получить состояние задания ресурса развертывания. Замените значения заполнителей ниже собственными значениями.
Идентификатор задания для получения состояния развертывания. Это значение заголовка, полученное operation-location от API в ответ на назначение запроса ресурса развертывания.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Версия вызываемого API.
2022-10-01-preview
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст ответа
После отправки запроса вы получите следующий ответ. Продолжайте опрос этой конечной точки до тех пор, пока значение параметра Состояние не изменится на "Выполнено".
Полный путь к идентификатору ресурса, который требуется отменить. В портал Azure на вкладке "Свойства" ресурса в качестве поля "Идентификатор ресурса".
Используйте следующий запрос GET , чтобы получить состояние задания ресурсов развертывания unassign. Замените значения заполнителей ниже собственными значениями.
Идентификатор задания для получения состояния развертывания. Это значение заголовка, полученное operation-location от API в ответ на запрос ресурса развертывания unassign.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Версия вызываемого API.
2022-10-01-preview
Заголовки
Используйте следующий заголовок для проверки подлинности запроса.
Ключ
Значение
Ocp-Apim-Subscription-Key
Ключ к ресурсу. Используется для проверки подлинности запросов API.
Текст ответа
После отправки запроса вы получите следующий ответ. Продолжайте опрос этой конечной точки до тех пор, пока значение параметра Состояние не изменится на "Выполнено".