TextNerJob Classe
Configuração para Trabalho NER de Texto AutoML.
Inicializa uma nova tarefa NER de Texto AutoML.
- Herança
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextNerJob
Construtor
TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)
Parâmetros
- training_data
Dados de treinamento a serem usados para treinamento
- validation_data
Dados de validação a serem usados para avaliar o modelo treinado
- primary_metric
A métrica primária a ser exibida.
- log_verbosity
Nível de detalhamento de log
- kwargs
Argumentos específicos do trabalho
Métodos
dump |
Despeja o conteúdo do trabalho em um arquivo no formato YAML. |
extend_search_space |
Adicione (a) espaço(s) de pesquisa para este trabalho de NLP do AutoML. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
Configurações de varredura para todas as tarefas de NLP do AutoML. |
set_training_parameters |
Corrija determinados parâmetros de treinamento em todo o procedimento de treinamento para todos os candidatos. Passar. Isso deve ser um inteiro positivo. :palavra-chave learning_rate: taxa de aprendizado inicial. Deve ser um float em (0, 1). :palavra-chave learning_rate_scheduler: o tipo de agendador de taxa de aprendizagem. Deve escolher entre 'linear', 'cosseno', 'cosine_with_restarts', 'polinomial', 'constant' e 'constant_with_warmup'. :palavra-chave model_name: o nome do modelo a ser usado durante o treinamento. Deve escolher entre 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' e 'xlnet-large-cased'. :palavra-chave number_of_epochs: o número de épocas com as quais treinar. Deve ser um número inteiro positivo. :palavra-chave training_batch_size: o tamanho do lote durante o treinamento. Deve ser um número inteiro positivo. :palavra-chave validation_batch_size: o tamanho do lote durante a validação. Deve ser um número inteiro positivo. :palavra-chave warmup_ratio: proporção do total de etapas de treinamento usadas para um aquecimento linear de 0 para learning_rate. Deve ser um float em [0, 1]. :palavra-chave weight_decay: valor de decaimento de peso quando o otimizador é sgd, adam ou adamw. Deve ser um float no intervalo [0, 1]. :return: Nenhum. |
dump
Despeja o conteúdo do trabalho em um arquivo no formato YAML.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parâmetros
O caminho local ou o fluxo de arquivos no qual gravar o conteúdo YAML. Se dest for um caminho de arquivo, um novo arquivo será criado. Se dest for um arquivo aberto, o arquivo será gravado diretamente.
- kwargs
- dict
Argumentos adicionais a serem passados para o serializador YAML.
Exceções
Gerado se dest for um caminho de arquivo e o arquivo já existir.
Gerado se dest for um arquivo aberto e o arquivo não for gravável.
extend_search_space
Adicione (a) espaço(s) de pesquisa para este trabalho de NLP do AutoML.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
Parâmetros
- value
- Union[SearchSpace, List[SearchSpace]]
um objeto SearchSpace ou uma lista de objetos SearchSpace com parâmetros específicos de nlp.
Retornos
Nenhum.
Exceções
Gerado se dest for um caminho de arquivo e o arquivo já existir.
Gerado se dest for um arquivo aberto e o arquivo não for gravável.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
Exceções
Gerado se dest for um caminho de arquivo e o arquivo já existir.
Gerado se dest for um arquivo aberto e o arquivo não for gravável.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
Exceções
Gerado se dest for um caminho de arquivo e o arquivo já existir.
Gerado se dest for um arquivo aberto e o arquivo não for gravável.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Exceções
Gerado se dest for um caminho de arquivo e o arquivo já existir.
Gerado se dest for um arquivo aberto e o arquivo não for gravável.
set_sweep
Configurações de varredura para todas as tarefas de NLP do AutoML.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
Parâmetros
- sampling_algorithm
Obrigatórios. Especifica o tipo de algoritmo de amostragem de hiperparâmetro. Os valores possíveis incluem: "Grid", "Random" e "Bayesian".
- early_termination
Política de encerramento antecipado opcional para acabar com candidatos de treinamento com baixo desempenho.
Retornos
Nenhum
Exceções
Gerado se dest for um caminho de arquivo e o arquivo já existir.
Gerado se dest for um arquivo aberto e o arquivo não for gravável.
set_training_parameters
Corrija determinados parâmetros de treinamento em todo o procedimento de treinamento para todos os candidatos.
Passar. Isso deve ser um inteiro positivo. :palavra-chave learning_rate: taxa de aprendizado inicial. Deve ser um float em (0, 1). :palavra-chave learning_rate_scheduler: o tipo de agendador de taxa de aprendizagem. Deve escolher entre 'linear', 'cosseno', 'cosine_with_restarts', 'polinomial', 'constant' e 'constant_with_warmup'. :palavra-chave model_name: o nome do modelo a ser usado durante o treinamento. Deve escolher entre 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' e 'xlnet-large-cased'. :palavra-chave number_of_epochs: o número de épocas com as quais treinar. Deve ser um número inteiro positivo. :palavra-chave training_batch_size: o tamanho do lote durante o treinamento. Deve ser um número inteiro positivo. :palavra-chave validation_batch_size: o tamanho do lote durante a validação. Deve ser um número inteiro positivo. :palavra-chave warmup_ratio: proporção do total de etapas de treinamento usadas para um aquecimento linear de 0 para learning_rate. Deve ser um float em [0, 1]. :palavra-chave weight_decay: valor de decaimento de peso quando o otimizador é sgd, adam ou adamw. Deve ser um float no intervalo [0, 1]. :return: Nenhum.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
Parâmetros
- gradient_accumulation_steps
número de etapas sobre as quais acumular gradientes antes de um retrocesso
Exceções
Gerado se dest for um caminho de arquivo e o arquivo já existir.
Gerado se dest for um arquivo aberto e o arquivo não for gravável.
Atributos
base_path
creation_context
O contexto de criação do recurso.
Retornos
Os metadados de criação para o recurso.
Tipo de retorno
featurization
id
A ID do recurso.
Retornos
A ID global do recurso, uma ID do ARM (Resource Manager do Azure).
Tipo de retorno
inputs
limits
log_files
Arquivos de saída do trabalho.
Retornos
O dicionário de nomes de log e URLs.
Tipo de retorno
log_verbosity
outputs
primary_metric
search_space
status
O status do trabalho.
Os valores comuns retornados incluem "Running", "Completed" e "Failed". Todos os valores possíveis são:
NotStarted - Esse é um estado temporário em que os objetos Run do lado do cliente estão antes do envio à nuvem.
Starting – A Execução começou a ser processada na nuvem. O chamador tem uma ID de execução neste ponto.
Provisionamento – a computação sob demanda está sendo criada para um determinado envio de trabalho.
Preparando – o ambiente de execução está sendo preparado e está em um dos dois estágios:
Build de imagem do Docker
conda environment setup
Enfileirado – o trabalho está na fila no destino de computação. Por exemplo, no BatchAI, o trabalho está em um estado enfileirado
enquanto aguarda que todos os nós solicitados estejam prontos.
Em execução – o trabalho começou a ser executado no destino de computação.
Finalização – a execução do código do usuário foi concluída e a execução está em estágios de pós-processamento.
CancelRequested – O cancelamento foi solicitado para o trabalho.
Concluído – a execução foi concluída com êxito. Isso inclui a execução e a execução do código do usuário
estágios de pós-processamento.
Failed – A execução falhou. Normalmente, a propriedade de Erro em uma execução fornecerá detalhes sobre o motivo.
Canceled – Segue uma solicitação de cancelamento e indica que a execução foi cancelada com êxito.
NotResponding – Para execuções que têm Pulsações habilitadas, nenhuma pulsação foi enviada recentemente.
Retornos
Status do trabalho.
Tipo de retorno
studio_url
Ponto de extremidade do Estúdio do Azure ML.
Retornos
A URL para a página de detalhes do trabalho.
Tipo de retorno
sweep
task_type
Obter tipo de tarefa.
Retornos
O tipo de tarefa a ser executado. Os valores possíveis incluem: "classificação", "regressão", "previsão".
Tipo de retorno
test_data
training_data
training_parameters
type
validation_data
Azure SDK for Python