Compartilhar via


Esquema YAML do conjunto de recursos da CLI (v2)

APLICA-SE A: Extensão de ML da CLI do Azurev2 (atual)

Observação

A sintaxe YAML detalhada neste documento baseia-se no esquema JSON da última versão da extensão de ML da CLI v2. Essa sintaxe só tem a garantia de funcionar com a última versão da extensão de ML da CLI v2. Encontre os esquemas para as versões mais antigas da extensão em https://azuremlschemasprod.azureedge.net/.

Sintaxe YAML

Chave Type Descrição Valores permitidos Valor padrão
$schema string O esquema YAML. Se você usar a extensão do Azure Machine Learning para VS Code para criar o arquivo YAML, a inclusão de $schema no início do arquivo permitirá que você ative os preenchimentos de esquema e recursos.
name string Obrigatórios. Nome do conjunto de recursos.
version string Obrigatórios. Versão do conjunto de recursos.
descrição string Descrição do conjunto de recursos.
especificação objeto Obrigatórios. Especificação do conjunto de recursos.
specification.path string Obrigatório Caminho para a pasta especificação do conjunto de recursos local.
entidades objeto (lista de cadeia de caracteres) Obrigatórios. As entidades às quais esse conjunto de recursos está associado.
preparar string Estágio do conjunto de recursos. Desenvolvimento, produção, arquivado Desenvolvimento
marcas objeto Dicionário das tags para a entidade do armazenamento de recursos.
materialization_settings objeto Configuração de materialização do conjunto de recursos.
materialization_settings.offline_enabled booleano Se a materialização de valores de recursos para um armazenamento offline está habilitada. Verdadeiro, Falso
materialization_settings.schedule objeto O agendamento de materialização. Consulte Esquema YAML de agendamento da CLI (v2)
materialization_settings.schedule.frequency string Obrigatório se o agendamento estiver configurado. Enumerar para descrever a frequência de um agendamento de recorrência. Dia, Hora, Minuto, Semana, Mês Dia
materialization_settings.schedule.interval inteiro Obrigatório se o agendamento estiver configurado. O intervalo entre trabalhos recorrentes.
materialization_settings.schedule.time_zone string O fuso horário do gatilho de agendamento. UTC
materialization_settings.schedule.start_time string A hora do gatilho de agendamento.
materialization_settings.notification objeto A configuração de notificação de materialização.
materialization_settings.notification.email_on objeto (lista de cadeia de caracteres) Obrigatório se a notificação estiver configurada. A notificação por email é enviada quando o trabalho status corresponde a essa configuração. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.emails objeto (lista de cadeia de caracteres) Obrigatório se a notificação estiver configurada. O endereço de email para o qual a notificação é enviada.
materialization_settings.resource objeto O recurso de computação do Spark do Azure Machine Learning usado para o trabalho de materialização.
materialization_settings.resource.instance_type string Instância de computação do Spark do Azure Machine Learning. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Consulte Estruturação interativa de dados com o Apache Spark no Azure Machine Learning (versão prévia) para obter uma lista atualizada de tipos com suporte.
materialization_settings.spark_configuration dicionário dicionário de configuração do Spark

Comentários

O az ml feature-set comando pode ser usado para gerenciar o conjunto de recursos.

Exemplos

Os exemplos estão disponíveis no repositório de exemplos do GitHub. Vários são mostrados abaixo.

YAML: básico

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: com configuração de materialização

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Próximas etapas