Partilhar via


Prevendo associações (Tutorial de mineração de dados intermediário)

Depois que os modelos forem processados, você pode usar as informações sobre associações armazenadas no modelo para criar previsões. Na tarefa final desta lição, você aprenderá a criar consultas de previsão em modelos de associação criados por você. Esta lição supõe que você já saiba usar o Construtor de Consultas de Previsão e que deseja aprender a criar consultas de previsão em modelos de associação. Para obter mais informações sobre como usar o Construtor de Consultas de Previsão, consulte Criando consultas de previsão DMX.

Criando uma consulta de previsão singleton

A previsão associativa pode servir para muitos propósitos, como a recomendação de itens a um cliente ou a localização de relacionamentos entre produtos. Para criar uma consulta de previsão, primeiro selecione o modelo de associação que deseja usar e especifique os dados de entrada. As entradas podem vir de uma fonte de dados externa, como uma lista de valores, ou você pode criar uma consulta singleton e fornecer valores à medida que avança.

Para este cenário, primeiro você criará algumas consultas de previsão singleton, para ter uma idéia de como funciona a previsão. Em seguida, você criará uma consulta para previsões em lote que poderá ser usada para fazer recomendações baseadas em compras atuais de um cliente.

Para criar uma consulta de previsão em um modelo de associação

  1. Clique na guia Previsão do Modelo de Mineração do Designer de Mineração de Dados.

  2. No painel Modelo de Mineração, clique em Selecionar Modelo (ignore esta etapa e a próxima se o modelo correto já estiver selecionado).

  3. Na caixa de diálogoSelecionar Modelo de Mineração, expanda o nó que representa a estrutura de mineração Associação e selecione o modelo Associação. Clique em OK.

    Por ora, ignore o painel de entrada.

  4. Na grade, clique na célula vazia sob Origem e selecione Função de Previsão. Na célula sob Campo, selecione PredictAssociation.

    Você também pode usar a função Predict para prever associações. Nesse caso, não se esqueça de escolher a versão da função Predict que utiliza uma coluna da tabela como argumento.

  5. No painel Modelo de Mineração, selecione a tabela aninhada vAssocSeqLineItems e arraste-a para a grade, até a caixa Critérios/Argumento para a função PredictAssociation.

    Arrastar e soltar nomes de tabela e de coluna permite que você crie instruções complexas sem erros de sintaxe. No entanto, isso substitui o conteúdo atual da célula, o que inclui outros argumentos opcionais para a função PredictAssociation. Para exibir os outros argumentos, você pode adicionar temporariamente uma segunda instância da função à grade para referência.

  6. Clique na caixa Critérios/Argumento e digite o seguinte texto após o nome da tabela: ,3

    O texto completo da caixa Critérios/Argumento deve ser:

    [Association].[v Assoc Seq Line Items],3

  7. Clique no botão Resultados no canto superior do Construtor de Consultas de Previsão.

Os resultados esperados contêm uma única coluna com o título Expressão. A coluna Expressão contém uma tabela aninhada com uma única coluna e com as três linhas a seguir. Como você não especificou um valor de entrada, estas previsões representam as associações de produto mais prováveis para o modelo como um todo.

Modelo

Women's Mountain Shorts

Garrafa d’Água

Touring-3000

Em seguida, você usará o painel Entrada de Consulta Singleton para especificar um produto como entrada para a consulta e exibirá os produtos que têm mais probabilidade de estarem associados ao item.

Para criar uma consulta de previsão singleton com entradas de tabela aninhada

  1. Clique no botão Design no canto superior do Construtor de Consultas de Previsão para voltar à grade de criação de consultas.

  2. No menu Modelo de Mineração, selecione Consulta Singleton.

  3. Na caixa de diálogo Modelo de Mineração, selecione o modeloAssociação.

  4. Na grade, clique na célula vazia sob Origem e selecione Função de Previsão. Na célula sob Campo, selecione PredictAssociation.

  5. No painel Modelo de Mineração, selecione a tabela aninhada vAssocSeqLineItems e arraste-a para a grade, até a caixa Critérios/Argumento para a função PredictAssociation. Digite ,3 após nome da tabela aninhada, como feito no procedimento anterior.

  6. Na caixa de diálogo Entrada de Consulta Singleton, clique na caixa Valor ao lado de vAssoc Seq Line Items e clique no botão (…).

  7. Na caixa de diálogo Entrada de Tabela Aninhada, selecione Pneu de Passeio no painel Coluna de chave e clique em Adicionar.

  8. Clique no botão Resultados.

Os resultados mostrarão as previsões para produtos que têm mais probabilidade de estarem associados ao Pneu de Passeio.

Modelo

Tubo de Pneu para Passeio

Sport-100

Garrafa d’Água

No entanto, você já sabe, pela exploração do modelo, que o Tubo de Pneu para Passeio é freqüentemente comprado com o Pneu de Passeio; você está mais interessado em saber que produtos poderá recomendar aos clientes que compram esses itens juntos. Altere a consulta para que ela preveja produtos relacionados baseados em dois itens da cesta. Você também modificará a consulta para adicionar a probabilidade de cada produto previsto.

Para adicionar entradas e probabilidades à consulta de previsão singleton

  1. Clique no botão Design no canto superior do Construtor de Consultas de Previsão para voltar à grade de criação de consultas.

  2. Na caixa de diálogo Entrada de Consulta Singleton, clique na caixa Valor ao lado de vAssoc Seq Line Items e clique no botão (…).

  3. No painel Coluna de chave, selecione Pneu de Passeio e clique em Adicionar.

  4. Na grade, clique na célula vazia sob Origem e selecione Função de Previsão. Na célula sob Campo, selecione PredictAssociation.

  5. No painel Modelo de Mineração, selecione a tabela aninhada vAssocSeqLineItems e arraste-a para a grade, até a caixa Critérios/Argumento para a função PredictAssociation. Digite ,3 após nome da tabela aninhada, como feito no procedimento anterior.

  6. Na caixa de diálogo Entrada de Tabela Aninhada, selecione Tubo de Pneu para Passeio no painel Coluna de chave e clique em Adicionar.

  7. Na grade, na linha da função PredictAssociation, clique na caixa Critérios/Argumentos e altere os argumentos para adicionar INCLUDE_STATISTICS.

    O texto completo da caixa Critérios/Argumento deve ser:

    [Association].[v Assoc Seq Line Items], INCLUDE_STATISTICS, 3

  8. Clique no botão Resultados.

Os resultados da tabela aninhada foram alterados para mostrar as previsões, além do suporte e da probabilidade. Para obter mais informações sobre como interpretar esses valores, consulte Conteúdo do modelo de mineração para modelos de associação (Analysis Services – Mineração de Dados).

Modelo

$SUPPORT

$PROBABILITY

$ADJUSTEDPROBABILITY

Sport-100

4334

0,291…

0,252…

Garrafa d’Água

2866

0,192…

0,175…

Kit de Conserto

2113

0,142…

0,132

Trabalhando com resultados

Quando houver muitas tabelas aninhadas nos resultados, talvez seja melhor mesclá-los para obter uma exibição melhor. Para isso, modifique a consulta manualmente e adicione a palavra-chave FLATTENED.

Para mesclar conjuntos de linhas aninhadas em uma consulta de previsão

  1. Clique no botão SQL no canto do Construtor de Consultas de Previsão.

    A grade se transformará em um painel aberto, onde você poderá exibir e modificar a instrução DMX criada pelo Construtor de Consultas de Previsão.

  2. Após a palavra-chave SELECT, digite FLATTENED.

    O texto completo da consulta deve ser assim:

    SELECT FLATTENED
      PredictAssociation([Association].[v Assoc Seq Line Items],INCLUDE_STATISTICS,3)
    FROM
      [Association]
    NATURAL PREDICTION JOIN
    (SELECT (SELECT 'Touring Tire' AS [Model]
      UNION SELECT 'Touring Tire Tube' AS [Model]) AS [v Assoc Seq Line Items]) AS t
    
  3. Clique no botão Resultados no canto superior do Construtor de Consultas de Previsão.

Observe que, depois de editar manualmente uma consulta, você não conseguirá voltar ao modo Design sem perder as alterações. Se quiser salvar a consulta, copie a instrução DMX criada manualmente em um arquivo de texto. Quando você voltar ao modo Design, a consulta será revertida para a última versão válida desse modo.

Criando várias previsões

Suponha que você queira saber quais são as melhores previsões para clientes individuais com base em compras passadas. Você pode usar dados externos como entrada para a consulta de previsão, como tabelas com a ID do cliente a as compras de produtos mais recentes. É necessário que as tabelas de dados já estejam definidas como uma exibição da fonte de dados do Analysis Services; além disso, os dados de entrada devem conter tabelas de caso e aninhadas como as usadas no modelo. Elas não precisam ter os mesmos nomes, mas a estrutura deve ser similar. Para fins deste tutorial, serão usadas as tabelas originais nas quais o modelo foi treinado.

Para alterar o método de entrada da consulta de previsão

  1. No menu Modelo de Mineração, selecione Consulta Singleton novamente para apagar a marca de seleção.

  2. Será exibida uma mensagem de erro avisando que a sua consulta singleton será perdida. Clique em Sim.

    O nome da caixa de diálogo de entrada muda para Selecionar Tabela(s) de Entrada.

Como você está interessado na criação de uma consulta de previsão que ofereça ID do Cliente e uma lista de produtos como entrada, adicione a tabela de clientes como uma tabela de casos e a tabela de compras como a tabela aninhada. Em seguida, adicione funções de previsão para criar recomendações.

Para criar uma consulta de previsão usando entradas de tabela aninhada

  1. No painel Modelo de Mineração, selecione o modelo Associação Filtrada.

  2. Na caixa de diálogo Selecionar Tabela(s) de Entrada, clique em Selecionar Tabela de Casos.

  3. Na caixa de diálogo Selecionar Tabela, para Fonte de Dados, selecione AdventureWorksDW2008. Na lista Nome da Tabela/Exibição, selecione vAssocSeqOrders e clique em OK.

    A tabela vAssocSeqOrders será adicionada ao painel.

  4. Na caixa de diálogo Selecionar Tabela(s) de Entrada, clique em Selecionar Tabela Aninhada.

  5. Na caixa de diálogo Selecionar Tabela, para Fonte de Dados, selecione AdventureWorksDW2008. Na lista Nome da Tabela/Exibição, selecione vAssocSeqLineItems e clique em OK.

    A tabela vAssocSeqLineItems será adicionada ao painel.

  6. A caixa de diálogo Especificar Junção Aninhada, arraste o campo OrderNumber da tabela de casos e solte-o no campo OrderNumber da tabela aninhada.

    Também é possível clicar em Adicionar Relacionamento e criar o relacionamento ao selecionar colunas em uma lista.

  7. Na caixa de diálogo Especificar Relacionamento, verifique se os campos OrderNumber foram mapeados corretamente e clique em OK.

  8. Clique em OK para fechar a caixa de diálogo Especificar Junção Aninhada.

    As tabelas de casos e aninhada são atualizadas no painel de design para mostrarem as junções que conectam as colunas de dados externos às colunas do modelo. Se os relacionamentos estiverem incorretos, clique com o botão direito do mouse na linha de junção e selecione Modificar Conexões para editar o mapeamento da coluna ou clique com o botão direito do mouse na linha de junção e selecione Excluir para remover completamente o relacionamento.

  9. Adicione uma nova linha à grade. Em Origem, selecione tabela vAssocSeqOrders. Em Campo, selecione CustomerKey.

  10. Adicione uma nova linha à grade. Em Origem, selecione tabela vAssocSeqOrders. Em Campo, selecione Região.

  11. Adicione uma nova linha à grade. Em Origem, selecione Função de Previsão e em Campo, selecione PredictAssociation.

  12. Arraste vAssocSeqLineItems até a caixa Critérios/Argumentos da linha PredictAssociation. Clique no fim da caixa Critérios/Argumento e digite o texto a seguir: INCLUDE_STATISTICS,3

    O texto completo da caixa Critérios/Argumento deve ser: [Association].[v Assoc Seq Line Items], INCLUDE_STATISTICS, 3

  13. Clique no botão Resultado para exibir as previsões para cada cliente.

Você pode tentar criar uma consulta de previsão similar nos vários modelos para ver se a filtragem altera os resultados da previsão. Para obter mais informações sobre a criação de previsões e de outros tipos de consultas, consulte Consultando um modelo de associação (Analysis Services - Mineração de dados).