Compartilhar via


TextClassificationJob Classe

Configuração para o trabalho de classificação de texto do AutoML.

Inicializa uma nova tarefa de Classificação de Texto AutoML.

Herança
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextClassificationJob

Construtor

TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)

Parâmetros

target_column_name
Obrigatório

O nome da coluna de destino

training_data
Obrigatório

Dados de treinamento a serem usados para treinamento

validation_data
Obrigatório

Dados de validação a serem usados para avaliar o modelo treinado

primary_metric
Obrigatório

A métrica primária a ser exibida

log_verbosity
Obrigatório

Nível de detalhamento de log

kwargs
Obrigatório

Argumentos específicos do trabalho

Métodos

dump

Despeja o conteúdo do trabalho em um arquivo no formato YAML.

extend_search_space

Adicione (a) espaço(s) de pesquisa para este trabalho de NLP do AutoML.

set_data
set_featurization
set_limits
set_sweep

Configurações de varredura para todas as tarefas de NLP do AutoML.

set_training_parameters

Corrija determinados parâmetros de treinamento em todo o procedimento de treinamento para todos os candidatos.

Passar. Isso deve ser um inteiro positivo. :palavra-chave learning_rate: taxa de aprendizado inicial. Deve ser um float em (0, 1). :palavra-chave learning_rate_scheduler: o tipo de agendador de taxa de aprendizagem. Deve escolher entre 'linear', 'cosseno', 'cosine_with_restarts', 'polinomial', 'constant' e 'constant_with_warmup'. :palavra-chave model_name: o nome do modelo a ser usado durante o treinamento. Deve escolher entre 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' e 'xlnet-large-cased'. :palavra-chave number_of_epochs: o número de épocas com as quais treinar. Deve ser um número inteiro positivo. :palavra-chave training_batch_size: o tamanho do lote durante o treinamento. Deve ser um número inteiro positivo. :palavra-chave validation_batch_size: o tamanho do lote durante a validação. Deve ser um número inteiro positivo. :palavra-chave warmup_ratio: proporção do total de etapas de treinamento usadas para um aquecimento linear de 0 para learning_rate. Deve ser um float em [0, 1]. :palavra-chave weight_decay: valor de decaimento de peso quando o otimizador é sgd, adam ou adamw. Deve ser um float no intervalo [0, 1]. :return: Nenhum.

dump

Despeja o conteúdo do trabalho em um arquivo no formato YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parâmetros

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Obrigatório

O caminho local ou o fluxo de arquivos no qual gravar o conteúdo YAML. Se dest for um caminho de arquivo, um novo arquivo será criado. Se dest for um arquivo aberto, o arquivo será gravado diretamente.

kwargs
dict

Argumentos adicionais a serem passados para o serializador YAML.

Exceções

Gerado se dest for um caminho de arquivo e o arquivo já existir.

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

extend_search_space

Adicione (a) espaço(s) de pesquisa para este trabalho de NLP do AutoML.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parâmetros

value
Union[SearchSpace, List[SearchSpace]]
Obrigatório

um objeto SearchSpace ou uma lista de objetos SearchSpace com parâmetros específicos de nlp.

Retornos

Nenhum.

Exceções

Gerado se dest for um caminho de arquivo e o arquivo já existir.

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Exceções

Gerado se dest for um caminho de arquivo e o arquivo já existir.

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Exceções

Gerado se dest for um caminho de arquivo e o arquivo já existir.

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Exceções

Gerado se dest for um caminho de arquivo e o arquivo já existir.

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

set_sweep

Configurações de varredura para todas as tarefas de NLP do AutoML.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parâmetros

sampling_algorithm

Obrigatórios. Especifica o tipo de algoritmo de amostragem de hiperparâmetro. Os valores possíveis incluem: "Grid", "Random" e "Bayesian".

early_termination

Política de encerramento antecipado opcional para acabar com candidatos de treinamento com baixo desempenho.

Retornos

Nenhum

Exceções

Gerado se dest for um caminho de arquivo e o arquivo já existir.

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

set_training_parameters

Corrija determinados parâmetros de treinamento em todo o procedimento de treinamento para todos os candidatos.

Passar. Isso deve ser um inteiro positivo. :palavra-chave learning_rate: taxa de aprendizado inicial. Deve ser um float em (0, 1). :palavra-chave learning_rate_scheduler: o tipo de agendador de taxa de aprendizagem. Deve escolher entre 'linear', 'cosseno', 'cosine_with_restarts', 'polinomial', 'constant' e 'constant_with_warmup'. :palavra-chave model_name: o nome do modelo a ser usado durante o treinamento. Deve escolher entre 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' e 'xlnet-large-cased'. :palavra-chave number_of_epochs: o número de épocas com as quais treinar. Deve ser um número inteiro positivo. :palavra-chave training_batch_size: o tamanho do lote durante o treinamento. Deve ser um número inteiro positivo. :palavra-chave validation_batch_size: o tamanho do lote durante a validação. Deve ser um número inteiro positivo. :palavra-chave warmup_ratio: proporção do total de etapas de treinamento usadas para um aquecimento linear de 0 para learning_rate. Deve ser um float em [0, 1]. :palavra-chave weight_decay: valor de decaimento de peso quando o otimizador é sgd, adam ou adamw. Deve ser um float no intervalo [0, 1]. :return: Nenhum.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parâmetros

gradient_accumulation_steps

número de etapas sobre as quais acumular gradientes antes de um retrocesso

Exceções

Gerado se dest for um caminho de arquivo e o arquivo já existir.

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

Atributos

base_path

O caminho base do recurso.

Retornos

O caminho base do recurso.

Tipo de retorno

str

creation_context

O contexto de criação do recurso.

Retornos

Os metadados de criação para o recurso.

Tipo de retorno

featurization

id

A ID do recurso.

Retornos

A ID global do recurso, uma ID do ARM (Resource Manager do Azure).

Tipo de retorno

inputs

limits

log_files

Arquivos de saída do trabalho.

Retornos

O dicionário de nomes de log e URLs.

Tipo de retorno

log_verbosity

outputs

primary_metric

search_space

status

O status do trabalho.

Os valores comuns retornados incluem "Running", "Completed" e "Failed". Todos os valores possíveis são:

  • NotStarted - Esse é um estado temporário em que os objetos Run do lado do cliente estão antes do envio à nuvem.

  • Starting – A Execução começou a ser processada na nuvem. O chamador tem uma ID de execução neste ponto.

  • Provisionamento – a computação sob demanda está sendo criada para um determinado envio de trabalho.

  • Preparando – o ambiente de execução está sendo preparado e está em um dos dois estágios:

    • Build de imagem do Docker

    • conda environment setup

  • Enfileirado – o trabalho está na fila no destino de computação. Por exemplo, no BatchAI, o trabalho está em um estado enfileirado

    enquanto aguarda que todos os nós solicitados estejam prontos.

  • Em execução – o trabalho começou a ser executado no destino de computação.

  • Finalização – a execução do código do usuário foi concluída e a execução está em estágios de pós-processamento.

  • CancelRequested – O cancelamento foi solicitado para o trabalho.

  • Concluído – a execução foi concluída com êxito. Isso inclui a execução e a execução do código do usuário

    estágios de pós-processamento.

  • Failed – A execução falhou. Normalmente, a propriedade de Erro em uma execução fornecerá detalhes sobre o motivo.

  • Canceled – Segue uma solicitação de cancelamento e indica que a execução foi cancelada com êxito.

  • NotResponding – Para execuções que têm Pulsações habilitadas, nenhuma pulsação foi enviada recentemente.

Retornos

Status do trabalho.

Tipo de retorno

studio_url

Ponto de extremidade do Estúdio do Azure ML.

Retornos

A URL para a página de detalhes do trabalho.

Tipo de retorno

sweep

task_type

Obter tipo de tarefa.

Retornos

O tipo de tarefa a ser executado. Os valores possíveis incluem: "classificação", "regressão", "previsão".

Tipo de retorno

str

test_data

Obter dados de teste.

Retornos

Testar entrada de dados

Tipo de retorno

training_data

Obter dados de treinamento.

Retornos

Entrada de dados de treinamento

Tipo de retorno

training_parameters

type

O tipo do trabalho.

Retornos

O tipo do trabalho.

Tipo de retorno

validation_data

Obter dados de validação.

Retornos

Entrada de dados de validação

Tipo de retorno