Esquema YAML do ponto de extremidade online da CLI (v2)
APLICA-SE A: Extensão de ML da CLI do Azurev2 (atual)
O esquema JSON de origem pode ser encontrado no https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json ponto de extremidade online gerenciado e no https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json para o ponto de extremidade online do Kubernetes. As diferenças entre o ponto de extremidade online gerenciado e o ponto de extremidade online do Kubernetes estão descritas na tabela de propriedades deste artigo. O exemplo neste artigo se concentra no ponto de extremidade online gerenciado.
Observação
A sintaxe YAML detalhada neste documento baseia-se no esquema JSON da última versão da extensão de ML da CLI v2. Essa sintaxe só tem a garantia de funcionar com a última versão da extensão de ML da CLI v2. Encontre os esquemas para as versões mais antigas da extensão em https://azuremlschemasprod.azureedge.net/.
Observação
Um YAML de exemplo totalmente especificado para pontos de extremidade online gerenciados está disponível para referência
Sintaxe YAML
Chave | Type | Descrição | Valores permitidos | Valor padrão |
---|---|---|---|---|
$schema |
string | O esquema YAML. Se você usar a extensão do Azure Machine Learning para VS Code para criar o arquivo YAML, a inclusão de $schema no início do arquivo permitirá invocar conclusões de esquema e recursos. |
||
name |
string | Obrigatórios. Nome do ponto de extremidade. Deve ser exclusivo no nível da região do Azure. As regras de nomenclatura são definidas sob limites de ponto de extremidade. |
||
description |
string | Descrição do ponto de extremidade. | ||
tags |
objeto | Dicionário de tags para o ponto de extremidade. | ||
auth_mode |
string | O método de autenticação para invocar o ponto de extremidade (operação do plano de dados). Use key para autenticação baseada em chave. Use aml_token para autenticação baseada em chave do Azure Machine Learning. Use aad_token para autenticação baseada em token do Microsoft Entra. |
key , aml_token , aad_token |
key |
compute |
string | Nome do destino de computação no qual executar as implantações de ponto de extremidade. Este campo só é aplicável a implantações de ponto de extremidade para clusters de Kubernetes habilitados para o Azure Arc (o destino de computação especificado neste campo deve ter type: kubernetes ). Não especifique esse campo se você estiver fazendo uma inferência online gerenciada. |
||
identity |
objeto | A configuração de identidade gerenciada para acessar recursos do Azure para inferência e provisionamento de ponto de extremidade. | ||
identity.type |
string | O tipo de identidade gerenciada. Se o tipo for user_assigned , a propriedade identity.user_assigned_identities também deverá ser especificada. |
system_assigned , user_assigned |
|
identity.user_assigned_identities |
array | Lista de IDs de recurso totalmente qualificadas das identidades atribuídas pelo usuário. | ||
traffic |
objeto | O tráfego representa a porcentagem de solicitações a serem atendidas por implantações diferentes. Ele é representado por um dicionário de pares chave-valor, em que as chaves representam o nome e o valor da implantação representam a porcentagem de tráfego para essa implantação. Por exemplo, blue: 90 green: 10 significa que 90% solicitações são enviadas para a implantação nomeada blue e 10% são enviadas para a implantação green . O tráfego total deve ser 0 ou somar até 100. Consulte Distribuição de Cofre para pontos de extremidade online para ver a configuração de tráfego em ação. Observação: não é possível definir esse campo durante a criação do ponto de extremidade online pois as implantações nesse ponto de extremidade devem ser criadas antes que o tráfego possa ser definido. Você pode atualizar o tráfego para um ponto de extremidade online após as implantações terem sido criadas usando az ml online-endpoint update ; por exemplo, az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10" . |
||
public_network_access |
string | Esse sinalizador controla a visibilidade do ponto de extremidade gerenciado. Quando disabled , as solicitações de pontuação de entrada são recebidas usando o ponto de extremidade privado do workspace do Azure Machine Learning e o ponto de extremidade não pode ser acessado de redes públicas. Esse sinalizador é aplicável somente para pontos de extremidade gerenciados |
enabled , disabled |
enabled |
mirror_traffic |
string | Porcentagem de tráfego dinâmico para espelhar para uma implantação. O espelhamento do tráfego não altera os resultados retornados aos clientes. O percentual espelhado do tráfego é copiado e enviado para a implantação especificada para que você possa coletar métricas e registrar sem afetar os clientes. Por exemplo, para verificar se a latência está dentro dos limites aceitáveis e se não há erros de protocolo HTTP. Ela é representada por um dicionário com um só par chave-valor, em que a chave representa o nome da implantação e o valor representa o percentual do tráfego a ser espelhado para a implantação. Para obter mais informações, consulte Testar uma implantação com tráfego espelhado. |
Comentários
Os comandos az ml online-endpoint
podem ser usados para gerenciar pontos de extremidade online do Azure Machine Learning.
Exemplos
Os exemplos estão disponíveis no repositório de exemplos do GitHub. Vários são mostrados abaixo.
YAML: básico
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key
YAML: identidade atribuída pelo sistema
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key
YAML: identidade atribuída pelo usuário
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
type: user_assigned
user_assigned_identities:
- resource_id: user_identity_ARM_id_place_holder