Compartilhar via


Esquema YAML do ponto de extremidade online da CLI (v2)

APLICA-SE A: Extensão de ML da CLI do Azurev2 (atual)

O esquema JSON de origem pode ser encontrado no https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json ponto de extremidade online gerenciado e no https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json para o ponto de extremidade online do Kubernetes. As diferenças entre o ponto de extremidade online gerenciado e o ponto de extremidade online do Kubernetes estão descritas na tabela de propriedades deste artigo. O exemplo neste artigo se concentra no ponto de extremidade online gerenciado.

Observação

A sintaxe YAML detalhada neste documento baseia-se no esquema JSON da última versão da extensão de ML da CLI v2. Essa sintaxe só tem a garantia de funcionar com a última versão da extensão de ML da CLI v2. Encontre os esquemas para as versões mais antigas da extensão em https://azuremlschemasprod.azureedge.net/.

Observação

Um YAML de exemplo totalmente especificado para pontos de extremidade online gerenciados está disponível para referência

Sintaxe YAML

Chave Type Descrição Valores permitidos Valor padrão
$schema string O esquema YAML. Se você usar a extensão do Azure Machine Learning para VS Code para criar o arquivo YAML, a inclusão de $schema no início do arquivo permitirá invocar conclusões de esquema e recursos.
name string Obrigatórios. Nome do ponto de extremidade. Deve ser exclusivo no nível da região do Azure.

As regras de nomenclatura são definidas sob limites de ponto de extremidade.
description string Descrição do ponto de extremidade.
tags objeto Dicionário de tags para o ponto de extremidade.
auth_mode string O método de autenticação para invocar o ponto de extremidade (operação do plano de dados). Use key para autenticação baseada em chave. Use aml_token para autenticação baseada em chave do Azure Machine Learning. Use aad_token para autenticação baseada em token do Microsoft Entra. key, aml_token, aad_token key
compute string Nome do destino de computação no qual executar as implantações de ponto de extremidade. Este campo só é aplicável a implantações de ponto de extremidade para clusters de Kubernetes habilitados para o Azure Arc (o destino de computação especificado neste campo deve ter type: kubernetes). Não especifique esse campo se você estiver fazendo uma inferência online gerenciada.
identity objeto A configuração de identidade gerenciada para acessar recursos do Azure para inferência e provisionamento de ponto de extremidade.
identity.type string O tipo de identidade gerenciada. Se o tipo for user_assigned, a propriedade identity.user_assigned_identities também deverá ser especificada. system_assigned, user_assigned
identity.user_assigned_identities array Lista de IDs de recurso totalmente qualificadas das identidades atribuídas pelo usuário.
traffic objeto O tráfego representa a porcentagem de solicitações a serem atendidas por implantações diferentes. Ele é representado por um dicionário de pares chave-valor, em que as chaves representam o nome e o valor da implantação representam a porcentagem de tráfego para essa implantação. Por exemplo, blue: 90 green: 10 significa que 90% solicitações são enviadas para a implantação nomeada blue e 10% são enviadas para a implantação green. O tráfego total deve ser 0 ou somar até 100. Consulte Distribuição de Cofre para pontos de extremidade online para ver a configuração de tráfego em ação.

Observação: não é possível definir esse campo durante a criação do ponto de extremidade online pois as implantações nesse ponto de extremidade devem ser criadas antes que o tráfego possa ser definido. Você pode atualizar o tráfego para um ponto de extremidade online após as implantações terem sido criadas usando az ml online-endpoint update; por exemplo, az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10".
public_network_access string Esse sinalizador controla a visibilidade do ponto de extremidade gerenciado. Quando disabled, as solicitações de pontuação de entrada são recebidas usando o ponto de extremidade privado do workspace do Azure Machine Learning e o ponto de extremidade não pode ser acessado de redes públicas. Esse sinalizador é aplicável somente para pontos de extremidade gerenciados enabled, disabled enabled
mirror_traffic string Porcentagem de tráfego dinâmico para espelhar para uma implantação. O espelhamento do tráfego não altera os resultados retornados aos clientes. O percentual espelhado do tráfego é copiado e enviado para a implantação especificada para que você possa coletar métricas e registrar sem afetar os clientes. Por exemplo, para verificar se a latência está dentro dos limites aceitáveis e se não há erros de protocolo HTTP. Ela é representada por um dicionário com um só par chave-valor, em que a chave representa o nome da implantação e o valor representa o percentual do tráfego a ser espelhado para a implantação. Para obter mais informações, consulte Testar uma implantação com tráfego espelhado.

Comentários

Os comandos az ml online-endpoint podem ser usados para gerenciar pontos de extremidade online do Azure Machine Learning.

Exemplos

Os exemplos estão disponíveis no repositório de exemplos do GitHub. Vários são mostrados abaixo.

YAML: básico

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

YAML: identidade atribuída pelo sistema

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key

YAML: identidade atribuída pelo usuário

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
  type: user_assigned
  user_assigned_identities:
    - resource_id: user_identity_ARM_id_place_holder

Próximas etapas