Partilhar via


Componente: Atribuir dados a clusters

Este artigo descreve como usar o componente Atribuir dados a clusters no designer do Azure Machine Learning. O componente gera previsões através de um modelo de agrupamento que foi treinado com o algoritmo de agrupamento K-means.

O componente Atribuir dados a clusters retorna um conjunto de dados que contém as atribuições prováveis para cada novo ponto de dados.

Como usar Atribuir dados a clusters

  1. No designer do Azure Machine Learning, localize um modelo de clustering treinado anteriormente. Você pode criar e treinar um modelo de clustering usando um dos seguintes métodos:

    • Configure o algoritmo de clustering K-means usando o componente K-Means Clustering e treine o modelo usando um conjunto de dados e o componente Train Clustering Model (este artigo).

    • Você também pode adicionar um modelo de clustering treinado existente do grupo Modelos Salvos em seu espaço de trabalho.

  2. Anexe o modelo treinado à porta de entrada esquerda de Atribuir dados a clusters.

  3. Anexe um novo conjunto de dados como entrada.

    Neste conjunto de dados, os rótulos são opcionais. Geralmente, o agrupamento é um método de aprendizagem não supervisionado. Não se espera que conheça as categorias com antecedência. No entanto, as colunas de entrada devem ser as mesmas que as colunas que foram usadas no treinamento do modelo de clustering, ou ocorre um erro.

    Gorjeta

    Para reduzir o número de colunas gravadas no designer a partir das previsões de cluster, use Selecionar colunas no conjunto de dados e selecione um subconjunto das colunas.

  4. Deixe a caixa de seleção Verificar se acrescenta ou desmarque somente resultado marcada se desejar que os resultados contenham o conjunto de dados de entrada completo, incluindo uma coluna que exiba os resultados (atribuições de cluster).

    Se você desmarcar essa caixa de seleção, somente os resultados serão retornados. Essa opção pode ser útil quando você cria previsões como parte de um serviço Web.

  5. Envie o pipeline.

Resultados

  • Para exibir os valores no conjunto de dados, clique com o botão direito do mouse no componente e selecione Visualizar. Ou Selecione o componente e alterne para a guia Saídas no painel direito, clique no ícone de histograma nas saídas de porta para visualizar o resultado.