TextClassificationJob Classe

Referência

Configuração para o trabalho de classificação de texto do AutoML.

Inicializa uma nova tarefa de Classificação de Texto AutoML.

Herança: azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob

TextClassificationJob

Construtor

TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)

Parâmetros

target_column_name

Obrigatório

O nome da coluna de destino

training_data

Obrigatório

Dados de treinamento a serem usados para treinamento

validation_data

Obrigatório

Dados de validação a serem usados para avaliar o modelo treinado

primary_metric

Obrigatório

A métrica primária a ser exibida

log_verbosity

Obrigatório

Nível de detalhamento de log

kwargs

Obrigatório

Argumentos específicos do trabalho

Métodos

dump	Despeja o conteúdo do trabalho em um arquivo no formato YAML.
extend_search_space	Adicione (a) espaço(s) de pesquisa para este trabalho de NLP do AutoML.
set_data
set_featurization
set_limits
set_sweep	Configurações de varredura para todas as tarefas de NLP do AutoML.
set_training_parameters	Corrija determinados parâmetros de treinamento em todo o procedimento de treinamento para todos os candidatos. Passar. Isso deve ser um inteiro positivo. :palavra-chave learning_rate: taxa de aprendizado inicial. Deve ser um float em (0, 1). :palavra-chave learning_rate_scheduler: o tipo de agendador de taxa de aprendizagem. Deve escolher entre 'linear', 'cosseno', 'cosine_with_restarts', 'polinomial', 'constant' e 'constant_with_warmup'. :palavra-chave model_name: o nome do modelo a ser usado durante o treinamento. Deve escolher entre 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' e 'xlnet-large-cased'. :palavra-chave number_of_epochs: o número de épocas com as quais treinar. Deve ser um número inteiro positivo. :palavra-chave training_batch_size: o tamanho do lote durante o treinamento. Deve ser um número inteiro positivo. :palavra-chave validation_batch_size: o tamanho do lote durante a validação. Deve ser um número inteiro positivo. :palavra-chave warmup_ratio: proporção do total de etapas de treinamento usadas para um aquecimento linear de 0 para learning_rate. Deve ser um float em [0, 1]. :palavra-chave weight_decay: valor de decaimento de peso quando o otimizador é sgd, adam ou adamw. Deve ser um float no intervalo [0, 1]. :return: Nenhum.

dump

Despeja o conteúdo do trabalho em um arquivo no formato YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parâmetros

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

Obrigatório

O caminho local ou o fluxo de arquivos no qual gravar o conteúdo YAML. Se dest for um caminho de arquivo, um novo arquivo será criado. Se dest for um arquivo aberto, o arquivo será gravado diretamente.

kwargs: dict

Argumentos adicionais a serem passados para o serializador YAML.

Exceções

FileExistsError

Gerado se dest for um caminho de arquivo e o arquivo já existir.

IOError

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

extend_search_space

Adicione (a) espaço(s) de pesquisa para este trabalho de NLP do AutoML.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parâmetros

value: Union[SearchSpace, List[SearchSpace]]

Obrigatório

um objeto SearchSpace ou uma lista de objetos SearchSpace com parâmetros específicos de nlp.

Retornos

Nenhum.

Exceções

FileExistsError

Gerado se dest for um caminho de arquivo e o arquivo já existir.

IOError

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Exceções

FileExistsError

Gerado se dest for um caminho de arquivo e o arquivo já existir.

IOError

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Exceções

FileExistsError

Gerado se dest for um caminho de arquivo e o arquivo já existir.

IOError

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Exceções

FileExistsError

Gerado se dest for um caminho de arquivo e o arquivo já existir.

IOError

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

set_sweep

Configurações de varredura para todas as tarefas de NLP do AutoML.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parâmetros

sampling_algorithm

Obrigatórios. Especifica o tipo de algoritmo de amostragem de hiperparâmetro. Os valores possíveis incluem: "Grid", "Random" e "Bayesian".

early_termination

Política de encerramento antecipado opcional para acabar com candidatos de treinamento com baixo desempenho.

Retornos

Nenhum

Exceções

FileExistsError

Gerado se dest for um caminho de arquivo e o arquivo já existir.

IOError

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

set_training_parameters

Corrija determinados parâmetros de treinamento em todo o procedimento de treinamento para todos os candidatos.

Passar. Isso deve ser um inteiro positivo. :palavra-chave learning_rate: taxa de aprendizado inicial. Deve ser um float em (0, 1). :palavra-chave learning_rate_scheduler: o tipo de agendador de taxa de aprendizagem. Deve escolher entre 'linear', 'cosseno', 'cosine_with_restarts', 'polinomial', 'constant' e 'constant_with_warmup'. :palavra-chave model_name: o nome do modelo a ser usado durante o treinamento. Deve escolher entre 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' e 'xlnet-large-cased'. :palavra-chave number_of_epochs: o número de épocas com as quais treinar. Deve ser um número inteiro positivo. :palavra-chave training_batch_size: o tamanho do lote durante o treinamento. Deve ser um número inteiro positivo. :palavra-chave validation_batch_size: o tamanho do lote durante a validação. Deve ser um número inteiro positivo. :palavra-chave warmup_ratio: proporção do total de etapas de treinamento usadas para um aquecimento linear de 0 para learning_rate. Deve ser um float em [0, 1]. :palavra-chave weight_decay: valor de decaimento de peso quando o otimizador é sgd, adam ou adamw. Deve ser um float no intervalo [0, 1]. :return: Nenhum.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parâmetros

gradient_accumulation_steps

número de etapas sobre as quais acumular gradientes antes de um retrocesso

Exceções

FileExistsError

Gerado se dest for um caminho de arquivo e o arquivo já existir.

IOError

Gerado se dest for um arquivo aberto e o arquivo não for gravável.

Atributos

base_path

O caminho base do recurso.

Retornos

O caminho base do recurso.

Tipo de retorno

str

creation_context

O contexto de criação do recurso.

Retornos

Os metadados de criação para o recurso.

Tipo de retorno

Optional[SystemData]

featurization

id

A ID do recurso.

Retornos

A ID global do recurso, uma ID do ARM (Resource Manager do Azure).

Tipo de retorno

Optional[str]

inputs

limits

log_files

Arquivos de saída do trabalho.

Retornos

O dicionário de nomes de log e URLs.

Tipo de retorno

Optional[Dict[str, str]]

log_verbosity

outputs

primary_metric

search_space

status

O status do trabalho.

Os valores comuns retornados incluem "Running", "Completed" e "Failed". Todos os valores possíveis são:

NotStarted - Esse é um estado temporário em que os objetos Run do lado do cliente estão antes do envio à nuvem.
Starting – A Execução começou a ser processada na nuvem. O chamador tem uma ID de execução neste ponto.
Provisionamento – a computação sob demanda está sendo criada para um determinado envio de trabalho.
Preparando – o ambiente de execução está sendo preparado e está em um dos dois estágios:
- Build de imagem do Docker
- conda environment setup
Enfileirado – o trabalho está na fila no destino de computação. Por exemplo, no BatchAI, o trabalho está em um estado enfileirado

enquanto aguarda que todos os nós solicitados estejam prontos.
Em execução – o trabalho começou a ser executado no destino de computação.
Finalização – a execução do código do usuário foi concluída e a execução está em estágios de pós-processamento.
CancelRequested – O cancelamento foi solicitado para o trabalho.
Concluído – a execução foi concluída com êxito. Isso inclui a execução e a execução do código do usuário

estágios de pós-processamento.
Failed – A execução falhou. Normalmente, a propriedade de Erro em uma execução fornecerá detalhes sobre o motivo.
Canceled – Segue uma solicitação de cancelamento e indica que a execução foi cancelada com êxito.
NotResponding – Para execuções que têm Pulsações habilitadas, nenhuma pulsação foi enviada recentemente.

Retornos

Status do trabalho.

Tipo de retorno

Optional[str]

studio_url

Ponto de extremidade do Estúdio do Azure ML.

Retornos

A URL para a página de detalhes do trabalho.

Tipo de retorno

Optional[str]

sweep

task_type

Obter tipo de tarefa.

Retornos

O tipo de tarefa a ser executado. Os valores possíveis incluem: "classificação", "regressão", "previsão".

Tipo de retorno

str

test_data

Obter dados de teste.

Retornos

Testar entrada de dados

Tipo de retorno

Input

training_data

Obter dados de treinamento.

Retornos

Entrada de dados de treinamento

Tipo de retorno

Input

training_parameters

type

O tipo do trabalho.

Retornos

O tipo do trabalho.

Tipo de retorno

Optional[str]

validation_data

Obter dados de validação.

Retornos

Entrada de dados de validação

Tipo de retorno

Input

Compartilhar via

TextClassificationJob Classe

Construtor

Parâmetros

Métodos

dump

Parâmetros

Exceções

extend_search_space

Parâmetros

Retornos

Exceções

set_data

Exceções

set_featurization

Exceções

set_limits

Exceções

set_sweep

Parâmetros

Retornos

Exceções

set_training_parameters

Parâmetros

Exceções

Atributos

base_path

Retornos

Tipo de retorno

creation_context

Retornos

Tipo de retorno

featurization

id

Retornos

Tipo de retorno

inputs

limits

log_files

Retornos

Tipo de retorno

log_verbosity

outputs

primary_metric

search_space

status

Retornos

Tipo de retorno

studio_url

Retornos

Tipo de retorno

sweep

task_type

Retornos

Tipo de retorno

test_data

Retornos

Tipo de retorno

training_data

Retornos

Tipo de retorno

training_parameters

type

Retornos

Tipo de retorno

validation_data

Retornos

Tipo de retorno

Recursos adicionais