Partilhar via


Árvore de Decisões Elevada Multiclasse

Este artigo descreve um componente no designer do Azure Machine Learning.

Use este componente para criar um modelo de aprendizado de máquina baseado no algoritmo de árvores de decisão impulsionadas.

Uma árvore de decisão impulsionada é um método de aprendizagem de conjunto em que a segunda árvore corrige os erros da primeira árvore, a terceira árvore corrige os erros da primeira e segunda árvores, e assim por diante. As previsões são baseadas no conjunto de árvores juntas.

Como configurar

Este componente cria um modelo de classificação não treinado. Como a classificação é um método de aprendizagem supervisionada, você precisa de um conjunto de dados rotulado que inclua uma coluna de rótulo com um valor para todas as linhas.

Você pode treinar este tipo de modelo usando o Modelo de Trem.

  1. Adicione o componente Árvore de Decisão Impulsionada Multiclasse ao seu pipeline.

  2. Especifique como você deseja que o modelo seja treinado definindo a opção Criar modo de treinador.

    • Parâmetro único: Se você souber como deseja configurar o modelo, poderá fornecer um conjunto específico de valores como argumentos.

    • Intervalo de parâmetros: selecione esta opção se não tiver certeza dos melhores parâmetros e quiser executar uma varredura de parâmetros. Selecione um intervalo de valores para iterar e o Tune Model Hyperparameters itera sobre todas as combinações possíveis das configurações fornecidas para determinar os hiperparâmetros que produzem os resultados ideais.

  3. O número máximo de folhas por árvore limita o número máximo de nós terminais (folhas) que podem ser criados em qualquer árvore.

    Ao aumentar esse valor, você potencialmente aumenta o tamanho da árvore e obtém maior precisão, sob o risco de sobreajuste e maior tempo de treinamento.

  4. O número mínimo de amostras por nó foliar indica o número de casos necessários para criar qualquer nó terminal (folha) numa árvore.

    Ao aumentar esse valor, você aumenta o limite para a criação de novas regras. Por exemplo, com o valor padrão de 1, até mesmo um único caso pode fazer com que uma nova regra seja criada. Se você aumentar o valor para 5, os dados de treinamento terão que conter pelo menos cinco casos que atendam às mesmas condições.

  5. A taxa de aprendizagem define o tamanho do passo durante a aprendizagem. Insira um número entre 0 e 1.

    A taxa de aprendizagem determina a rapidez ou lentidão com que o/a aluno/a converge para uma solução ótima. Se o tamanho da etapa for muito grande, você pode ultrapassar a solução ideal. Se o tamanho do passo for muito pequeno, o treinamento leva mais tempo para convergir para a melhor solução.

  6. O número de árvores construídas indica o número total de árvores de decisão a criar no conjunto. Ao criar mais árvores de decisão, você pode potencialmente obter uma melhor cobertura, mas o tempo de treinamento aumentará.

  7. Semente de número aleatório opcionalmente define um inteiro não negativo para usar como o valor de semente aleatória. A especificação de uma semente garante a reprodutibilidade em execuções que têm os mesmos dados e parâmetros.

    A semente aleatória é definida por padrão como 42. Execuções sucessivas usando diferentes sementes aleatórias podem ter resultados diferentes.

  8. Treine o modelo:

    • Se você definir Create trainer mode como Single Parameter, conecte um conjunto de dados marcado e o componente Train Model .

    • Se você definir Criar modo de treinamento como Intervalo de parâmetros, conecte um conjunto de dados marcado e treine o modelo usando Ajustar hiperparâmetros do modelo.

    Nota

    Se você passar um intervalo de parâmetros para Train Model, ele usará apenas o valor padrão na lista de parâmetros únicos.

    Se você passar um único conjunto de valores de parâmetro para o componente Ajustar Hiperparâmetros do Modelo, quando ele espera um intervalo de configurações para cada parâmetro, ele ignora os valores e usa os valores padrão para o aluno.

    Se você selecionar a opção Intervalo de parâmetros e inserir um único valor para qualquer parâmetro, esse único valor especificado será usado durante toda a varredura, mesmo que outros parâmetros sejam alterados em um intervalo de valores.

Próximos passos

Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.