AksServiceDeploymentConfiguration Класс
Представляет сведения о конфигурации развертывания для службы, развернутой в Службе Kubernetes Azure.
Создает объект AksServiceDeploymentConfiguration с помощью метода deploy_configuration
классаAksWebservice.
Инициализируйте объект конфигурации для развертывания в целевом объекте вычислений AKS.
- Наследование
-
AksServiceDeploymentConfiguration
Конструктор
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Параметры
Имя | Описание |
---|---|
cpu_cores_limit
Обязательно
|
Максимальное число ядер ЦП, которое может использовать эта веб-служба. Может выражаться десятичным числом. |
memory_gb_limit
Обязательно
|
Максимальный объем памяти (в ГБ), который может использовать этот объект WebService. Может выражаться десятичным числом. |
autoscale_enabled
Обязательно
|
Указывает, следует ли включить автомасштабирование для этой Веб-службы.
По умолчанию используется значение True, если |
autoscale_min_replicas
Обязательно
|
Минимальное число контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1. |
autoscale_max_replicas
Обязательно
|
Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию — 10. |
autoscale_refresh_seconds
Обязательно
|
Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1. |
autoscale_target_utilization
Обязательно
|
Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70. |
collect_model_data
Обязательно
|
Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False. |
auth_enabled
Обязательно
|
Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True. |
cpu_cores
Обязательно
|
Количество ядер ЦП, выделяемых для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,1 |
memory_gb
Обязательно
|
Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5 |
enable_app_insights
Обязательно
|
Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False. |
scoring_timeout_ms
Обязательно
|
Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000. |
replica_max_concurrent_requests
Обязательно
|
Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure. |
max_request_wait_time
Обязательно
|
Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500. |
num_replicas
Обязательно
|
Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию. |
primary_key
Обязательно
|
Первичный ключ проверки подлинности, используемый для этой Веб-службы. |
secondary_key
Обязательно
|
Вторичный ключ проверки подлинности, используемый для этой Веб-службы. |
tags
Обязательно
|
Словарь тегов значений ключа для предоставления этой Веб-службе. |
properties
Обязательно
|
Словарь свойств значений ключа для предоставления этой Веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение". |
description
Обязательно
|
Описание для предоставления этой веб-службе. |
gpu_cores
Обязательно
|
Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0. |
period_seconds
Обязательно
|
Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1. |
initial_delay_seconds
Обязательно
|
Количество секунд после запуска контейнера до начала пробы активности. Значение по умолчанию — 310. |
timeout_seconds
Обязательно
|
Количество секунд, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1. |
success_threshold
Обязательно
|
Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение — 1. |
failure_threshold
Обязательно
|
Количество попыток ( |
namespace
Обязательно
|
Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами. |
token_auth_enabled
Обязательно
|
Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False. |
cpu_cores_limit
Обязательно
|
Максимальное число ядер ЦП, которое может использовать этот объект WebService. Может выражаться десятичным числом. |
memory_gb_limit
Обязательно
|
Максимальный объем памяти (в ГБ), который может использовать этот объект WebService. Может выражаться десятичным числом. |
blobfuse_enabled
|
Следует ли включить blobfuse для загрузки модели для этой Веб-службы. Значение по умолчанию: true Default value: None
|
autoscale_enabled
Обязательно
|
Указывает, следует ли включить автомасштабирование для этой Веб-службы.
По умолчанию используется значение True, если |
autoscale_min_replicas
Обязательно
|
Минимальное число контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1. |
autoscale_max_replicas
Обязательно
|
Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию — 10. |
autoscale_refresh_seconds
Обязательно
|
Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1. |
autoscale_target_utilization
Обязательно
|
Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70. |
collect_model_data
Обязательно
|
Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False. |
auth_enabled
Обязательно
|
Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True. |
cpu_cores
Обязательно
|
Количество ядер ЦП, выделяемых для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,1 |
memory_gb
Обязательно
|
Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5 |
enable_app_insights
Обязательно
|
Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False. |
scoring_timeout_ms
Обязательно
|
Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000. |
replica_max_concurrent_requests
Обязательно
|
Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure. |
max_request_wait_time
Обязательно
|
Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500. |
num_replicas
Обязательно
|
Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию. |
primary_key
Обязательно
|
Первичный ключ проверки подлинности, используемый для этой Веб-службы. |
secondary_key
Обязательно
|
Вторичный ключ проверки подлинности, используемый для этой Веб-службы. |
tags
Обязательно
|
Словарь тегов значений ключа для предоставления этой Веб-службе. |
properties
Обязательно
|
Словарь свойств значений ключа для предоставления этой Веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение". |
description
Обязательно
|
Описание для предоставления этой веб-службе. |
gpu_cores
Обязательно
|
Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0. |
period_seconds
Обязательно
|
Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1. |
initial_delay_seconds
Обязательно
|
Количество секунд после запуска контейнера до начала пробы активности. Значение по умолчанию — 310. |
timeout_seconds
Обязательно
|
Количество секунд, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1. |
success_threshold
Обязательно
|
Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение — 1. |
failure_threshold
Обязательно
|
Количество попыток ( |
namespace
Обязательно
|
Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами. |
token_auth_enabled
Обязательно
|
Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False. |
compute_target_name
Обязательно
|
Имя целевого объект вычислений, в который будет выполняться развертывание |
cpu_cores_limit
Обязательно
|
Максимальное число ядер ЦП, которое может использовать этот объект WebService. Может выражаться десятичным числом. |
memory_gb_limit
Обязательно
|
Максимальный объем памяти (в ГБ), который может использовать этот объект WebService. Может выражаться десятичным числом. |
blobfuse_enabled
Обязательно
|
Следует ли включить blobfuse для загрузки модели для этой Веб-службы. Значение по умолчанию: true |
Переменные
Имя | Описание |
---|---|
autoscale_enabled
|
Указывает, следует ли включить автомасштабирование для этой Веб-службы.
По умолчанию используется значение True, если |
autoscale_min_replicas
|
Минимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. По умолчанию равен 1. |
autoscale_max_replicas
|
Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию — 10. |
autoscale_refresh_seconds
|
Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1. |
autoscale_target_utilization
|
Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70. |
collect_model_data
|
Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False. |
auth_enabled
|
Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True. |
cpu_cores
|
Количество ядер ЦП, выделяемых для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,1 |
memory_gb
|
Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5 |
enable_app_insights
|
Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False. |
scoring_timeout_ms
|
Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000. |
replica_max_concurrent_requests
|
Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure. |
max_request_wait_time
|
Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500. |
num_replicas
|
Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию. |
primary_key
|
Первичный ключ проверки подлинности, используемый для этой Веб-службы. |
secondary_key
|
Вторичный ключ проверки подлинности, используемый для этой Веб-службы. |
azureml.core.webservice.AksServiceDeploymentConfiguration.tags
|
Словарь тегов значений ключа для предоставления этой Веб-службе. |
azureml.core.webservice.AksServiceDeploymentConfiguration.properties
|
Словарь свойств значений ключа для предоставления этой Веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение". |
azureml.core.webservice.AksServiceDeploymentConfiguration.description
|
Описание для предоставления этой веб-службе. |
gpu_cores
|
Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0. |
period_seconds
|
Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1. |
initial_delay_seconds
|
Количество секунд после запуска контейнера до начала пробы активности. Значение по умолчанию — 310. |
timeout_seconds
|
Количество секунд, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1. |
success_threshold
|
Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение — 1. |
failure_threshold
|
Количество попыток ( |
azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
|
Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами. |
token_auth_enabled
|
Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False. |
Методы
print_deploy_configuration |
Печать конфигурации развертывания. |
validate_configuration |
Проверка допустимости указанных значений конфигурации. При сбое проверки будет вызвано исключение WebserviceException. |
print_deploy_configuration
Печать конфигурации развертывания.
print_deploy_configuration()
validate_configuration
Проверка допустимости указанных значений конфигурации.
При сбое проверки будет вызвано исключение WebserviceException.
validate_configuration()
Исключения
Тип | Описание |
---|---|