Compartilhar via


AksServiceDeploymentConfiguration Classe

Representa informações de configuração de implantação para um serviço implantado no Serviço de Kubernetes do Azure.

Crie um objeto AksServiceDeploymentConfiguration usando o método deploy_configuration da classe AksWebservice.

Inicialize um objeto de configuração para implantar em um destino de computação do AKS.

Herança
AksServiceDeploymentConfiguration

Construtor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parâmetros

Nome Description
cpu_cores_limit
Obrigatório

O número máximo de núcleos de CPU que esse serviço Web tem permissão para usar. Pode ser um decimal.

memory_gb_limit
Obrigatório

A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal.

autoscale_enabled
Obrigatório

Indica se o cálculo automático deve ser habilitado para esse serviço Web. O padrão será True se num_replicas for None.

autoscale_min_replicas
Obrigatório
int

O número mínimo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 1.

autoscale_max_replicas
Obrigatório
int

O número máximo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 10

autoscale_refresh_seconds
Obrigatório
int

Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.

autoscale_target_utilization
Obrigatório
int

A utilização de destino (em percentual de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O valor padrão é 70.

collect_model_data
Obrigatório

Se a coleta de dados de modelo deve ou não ser habilitada para esse serviço Web. Usa False como padrão.

auth_enabled
Obrigatório

Se a autenticação deve ou não ser habilitada para esse serviço Web. O padrão é True.

cpu_cores
Obrigatório

O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O valor padrão é 0,1

memory_gb
Obrigatório

A quantidade de memória (em GB) alocada para esse serviço Web. Pode ser um decimal. O valor padrão é 0,5

enable_app_insights
Obrigatório

Se o registro em log do Application Insights deve ou não ser habilitado para esse serviço Web. Usa False como padrão

scoring_timeout_ms
Obrigatório
int

Um tempo limite a ser imposto para chamadas de pontuação para este serviço Web. O valor padrão é 60000.

replica_max_concurrent_requests
Obrigatório
int

O número máximo de solicitações simultâneas por réplica permitidas para esse serviço Web. O valor padrão é 1. Não altere o valor padrão 1 dessa configuração, a menos que seja instruído pelo suporte técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

max_request_wait_time
Obrigatório
int

A quantidade máxima de tempo que uma solicitação permanece na fila (em milissegundos) antes de retornar um erro 503. O valor padrão é 500.

num_replicas
Obrigatório
int

O número de contêineres alocados para este serviço Web. Sem padrão; se este parâmetro não for definido, o dimensionamento automático será habilitado por padrão.

primary_key
Obrigatório
str

Uma chave de autenticação primária usada para esse serviço Web.

secondary_key
Obrigatório
str

Uma chave de autenticação secundária usada para esse serviço Web.

tags
Obrigatório

Dicionário de marcas de chave/valor para fornecer a esse serviço Web.

properties
Obrigatório

Dicionário de propriedades de chave/valor fornecidas a esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de chave/valor podem ser adicionados.

description
Obrigatório
str

Uma descrição fornecida a esse serviço Web.

gpu_cores
Obrigatório
int

O número de núcleos de GPU alocados para esse serviço Web. Assume o padrão de 0.

period_seconds
Obrigatório
int

A frequência (em segundos) para realizar a investigação de atividade. O padrão é 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Obrigatório
int

Número de segundos depois que o contêiner é iniciado antes que as investigações de atividade sejam iniciadas. O valor padrão é 310.

timeout_seconds
Obrigatório
int

Número de segundos após os quais a investigação de atividade expira. O valor padrão é 2 segundo. O valor mínimo é 1.

success_threshold
Obrigatório
int

O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1.

failure_threshold
Obrigatório
int

Quando um pod for iniciado e a investigação de atividade falhar, o Kubernetes tentará failureThreshold vezes antes de desistir. O valor padrão é 3. O valor mínimo é 1.

namespace
Obrigatório
str

O namespace do Kubernetes para implantar este serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.

token_auth_enabled
Obrigatório

Se a autenticação do Azure Active Directory deve ou não ser habilitada para esse serviço Web. Se essa instrução estiver habilitada, os usuários poderão acessar esse serviço Web buscando o token de acesso com o uso das suas credenciais do Azure Active Directory. Usa False como padrão.

cpu_cores_limit
Obrigatório

O número máximo de núcleos de CPU que esse serviço Web tem permissão para usar. Pode ser um decimal.

memory_gb_limit
Obrigatório

A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal.

blobfuse_enabled

Se deve ou não habilitar o blobfuse para download de modelo para esse serviço Web. O padrão é True

Valor padrão: None
autoscale_enabled
Obrigatório

Indica se o cálculo automático deve ser habilitado para esse serviço Web. O padrão será True se num_replicas for None.

autoscale_min_replicas
Obrigatório
int

O número mínimo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 1.

autoscale_max_replicas
Obrigatório
int

O número máximo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 10

autoscale_refresh_seconds
Obrigatório
int

Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.

autoscale_target_utilization
Obrigatório
int

A utilização de destino (em percentual de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O valor padrão é 70.

collect_model_data
Obrigatório

Se a coleta de dados de modelo deve ou não ser habilitada para esse serviço Web. Usa False como padrão.

auth_enabled
Obrigatório

Se a autenticação deve ou não ser habilitada para esse serviço Web. O padrão é True.

cpu_cores
Obrigatório

O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O valor padrão é 0,1

memory_gb
Obrigatório

A quantidade de memória (em GB) alocada para esse serviço Web. Pode ser um decimal. O valor padrão é 0,5

enable_app_insights
Obrigatório

Se o registro em log do Application Insights deve ou não ser habilitado para esse serviço Web. Usa False como padrão

scoring_timeout_ms
Obrigatório
int

Um tempo limite a ser imposto para chamadas de pontuação para este serviço Web. O valor padrão é 60000.

replica_max_concurrent_requests
Obrigatório
int

O número máximo de solicitações simultâneas por réplica permitidas para esse serviço Web. O valor padrão é 1. Não altere o valor padrão 1 dessa configuração, a menos que seja instruído pelo suporte técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

max_request_wait_time
Obrigatório
int

A quantidade máxima de tempo que uma solicitação permanece na fila (em milissegundos) antes de retornar um erro 503. O valor padrão é 500.

num_replicas
Obrigatório
int

O número de contêineres alocados para este serviço Web. Sem padrão; se este parâmetro não for definido, o dimensionamento automático será habilitado por padrão.

primary_key
Obrigatório
str

Uma chave de autenticação primária usada para esse serviço Web.

secondary_key
Obrigatório
str

Uma chave de autenticação secundária usada para esse serviço Web.

tags
Obrigatório

Dicionário de marcas de chave/valor para fornecer a esse serviço Web.

properties
Obrigatório

Dicionário de propriedades de chave/valor fornecidas a esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de chave/valor podem ser adicionados.

description
Obrigatório
str

Uma descrição fornecida a esse serviço Web.

gpu_cores
Obrigatório
int

O número de núcleos de GPU alocados para esse serviço Web. Assume o padrão de 0.

period_seconds
Obrigatório
int

A frequência (em segundos) para realizar a investigação de atividade. O padrão é 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Obrigatório
int

Número de segundos depois que o contêiner é iniciado antes que as investigações de atividade sejam iniciadas. O valor padrão é 310.

timeout_seconds
Obrigatório
int

Número de segundos após os quais a investigação de atividade expira. O valor padrão é 2 segundo. O valor mínimo é 1.

success_threshold
Obrigatório
int

O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1.

failure_threshold
Obrigatório
int

Quando um pod for iniciado e a investigação de atividade falhar, o Kubernetes tentará failureThreshold vezes antes de desistir. O valor padrão é 3. O valor mínimo é 1.

namespace
Obrigatório
str

O namespace do Kubernetes para implantar este serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.

token_auth_enabled
Obrigatório

Se a autenticação do Azure Active Directory deve ou não ser habilitada para esse serviço Web. Se essa instrução estiver habilitada, os usuários poderão acessar esse serviço Web buscando o token de acesso com o uso das suas credenciais do Azure Active Directory. Usa False como padrão.

compute_target_name
Obrigatório
str

O nome do destino de computação a ser implantado

cpu_cores_limit
Obrigatório

O número máximo de núcleos de CPU que esse serviço Web tem permissão para usar. Pode ser um decimal.

memory_gb_limit
Obrigatório

A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal.

blobfuse_enabled
Obrigatório

Se deve ou não habilitar o blobfuse para download de modelo para esse serviço Web. O padrão é True

Variáveis

Nome Description
autoscale_enabled

Indica se o cálculo automático deve ser habilitado para esse serviço Web. O padrão será True se num_replicas for None.

autoscale_min_replicas
int

O número mínimo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 1.

autoscale_max_replicas
int

O número máximo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 10

autoscale_refresh_seconds
int

Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1.

autoscale_target_utilization
int

A utilização de destino (em percentual de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O valor padrão é 70.

collect_model_data

Se a coleta de dados de modelo deve ou não ser habilitada para esse serviço Web. Usa False como padrão.

auth_enabled

Se a autenticação deve ou não ser habilitada para esse serviço Web. O padrão é True.

cpu_cores

O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O valor padrão é 0,1

memory_gb

A quantidade de memória (em GB) alocada para esse serviço Web. Pode ser um decimal. O valor padrão é 0,5

enable_app_insights

Se o registro em log do Application Insights deve ou não ser habilitado para esse serviço Web. Usa False como padrão

scoring_timeout_ms
int

Um tempo limite a ser imposto para chamadas de pontuação para este serviço Web. O valor padrão é 60000.

replica_max_concurrent_requests
int

O número máximo de solicitações simultâneas por réplica permitidas para esse serviço Web. O valor padrão é 1. Não altere o valor padrão 1 dessa configuração, a menos que seja instruído pelo suporte técnico da Microsoft ou por um membro da equipe do Azure Machine Learning.

max_request_wait_time
int

A quantidade máxima de tempo que uma solicitação permanece na fila (em milissegundos) antes de retornar um erro 503. O valor padrão é 500.

num_replicas
int

O número de contêineres alocados para este serviço Web. Sem padrão; se este parâmetro não for definido, o dimensionamento automático será habilitado por padrão.

primary_key
str

Uma chave de autenticação primária usada para esse serviço Web.

secondary_key
str

Uma chave de autenticação secundária usada para esse serviço Web.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Dicionário de marcas de chave/valor para fornecer a esse serviço Web.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Dicionário de propriedades de chave/valor fornecidas a esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de chave/valor podem ser adicionados.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Uma descrição fornecida a esse serviço Web.

gpu_cores
int

O número de núcleos de GPU alocados para esse serviço Web. Assume o padrão de 0.

period_seconds
int

A frequência (em segundos) para realizar a investigação de atividade. O padrão é 10 segundos. O valor mínimo é 1.

initial_delay_seconds
int

Número de segundos depois que o contêiner é iniciado antes que as investigações de atividade sejam iniciadas. O valor padrão é 310.

timeout_seconds
int

Número de segundos após os quais a investigação de atividade expira. O valor padrão é 2 segundo. O valor mínimo é 1.

success_threshold
int

O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1.

failure_threshold
int

Quando um pod for iniciado e a investigação de atividade falhar, o Kubernetes tentará failureThreshold vezes antes de desistir. O valor padrão é 3. O valor mínimo é 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

O namespace do Kubernetes para implantar este serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens.

token_auth_enabled

Se a autenticação do Azure Active Directory deve ou não ser habilitada para esse serviço Web. Se essa instrução estiver habilitada, os usuários poderão acessar esse serviço Web buscando o token de acesso com o uso das suas credenciais do Azure Active Directory. Usa False como padrão.

Métodos

print_deploy_configuration

Imprima a configuração de implantação.

validate_configuration

Verifique se os valores de configuração especificados são válidos.

Se a validação falhar, gerará uma WebserviceException.

print_deploy_configuration

Imprima a configuração de implantação.

print_deploy_configuration()

validate_configuration

Verifique se os valores de configuração especificados são válidos.

Se a validação falhar, gerará uma WebserviceException.

validate_configuration()

Exceções

Tipo Description