Condividi tramite


Creazione di una struttura del modello di data mining Sequence Clustering (Esercitazione intermedia sul data mining)

 

Si applica a: SQL Server 2016 Preview

Il primo passaggio nella creazione di un modello di data mining Sequence Clustering consiste nell'utilizzo della Creazione guidata modello di data mining per la creazione di una nuova struttura di data mining e di un modello di data mining sulla base dell'algoritmo Microsoft Sequence Clustering.

Si utilizzerà la stessa vista origine dati utilizzata per l'analisi degli acquisti, ma si aggiungerà una colonna che contiene il sequenza identificatore. In questo scenario la sequenza indica l'ordine in cui il cliente ha incluso gli articoli tra gli acquisti.

Verranno anche aggiunte alcune colonne utilizzate in uno dei modelli per raggruppare i clienti in base ai dati demografici.

Per creare una struttura e un modello di data mining Sequence Clustering

  1. In Esplora soluzioni in SQL Server Data Tools (SSDT), fare doppio clic su strutture di Data Mining e selezionare nuova struttura di Data Mining.

  2. Nella pagina iniziale Creazione guidata modello di data mining fare clic su Avanti.

  3. Nel Selezione metodo di definizione verificare che da esistenti database relazionale o data warehouse sia selezionata e quindi fare clic su Avanti.

  4. Nel Crea struttura di Data Mining verificare che l'opzione Crea struttura di data mining con un modello di data mining è selezionata. Successivamente, fare clic sull'elenco a discesa per l'opzione tecnica di data mining da utilizzare?, e selezionare Microsoft Sequence Clustering. Scegliere Avanti.

    Il Selezione Vista origine dati verrà visualizzata la pagina. In viste origine dati disponibili, selezionare ordini.

    Orders è la stessa vista origine dati utilizzata per lo scenario di analisi degli acquisti. Se non è stato creato questa vista origine dati, vedere aggiunta di una vista origine dati con tabelle nidificate ( Intermediate Data Mining Tutorial ).

  5. Scegliere Avanti.

  6. Nel specificare tipi di tabella pagina, selezionare il Case casella di controllo accanto al vAssocSeqOrders tabella e selezionare il Nested casella di controllo accanto al vAssocSeqLineItems tabella. Scegliere Avanti.

    Nota


    Se si verifica un errore quando si seleziona il Case o Nested caselle di controllo, è possibile che il join nella vista origine dati non è corretto. La tabella nidificata, vAssocSeqLineItems, deve essere connessa alla tabella del case, vAssocSeqOrders tramite un join molti-a-uno. È possibile modificare la relazione facendo clic con il pulsante destro del mouse sulla linea di join e invertendo la direzione del join. Per ulteriori informazioni, vedere creare o modificare la finestra di dialogo relazione ( Analysis Services - dati multidimensionali e 41 #;.

  7. Nel specificare i dati di Training pagina, scegliere le colonne da utilizzare nel modello selezionando una casella di controllo, come indicato di seguito:

    • IncomeGroupSelezionare il Input casella di controllo.

      Questa colonna contiene interessanti informazioni sui clienti che è possibile utilizzare per il clustering. Verranno utilizzate nel primo modello e ignorate nel secondo modello.

    • OrderNumberSelezionare il chiave casella di controllo.

      Questo campo verrà utilizzato come identificatore per la tabella del case o chiave. In generale, è consigliabile non utilizzare mai il campo chiave della tabella del case come input, perché la chiave contiene valori univoci che non sono utili per il clustering.

    • AreaSelezionare il Input casella di controllo.

      Questa colonna contiene interessanti informazioni sui clienti che è possibile utilizzare per il clustering. Verranno utilizzate nel primo modello e ignorate nel secondo modello.

    • LineNumberSelezionare il chiave e Input caselle di controllo.

      Il LineNumber campo verrà utilizzato come identificatore per la tabella nidificata o chiave di sequenza. La chiave di una tabella nidificata deve essere sempre utilizzata per l'input.

    • ModelloSelezionare il Input e stimabile caselle di controllo.

    Verificare che le selezioni siano corrette e quindi fare clic su Avanti.

  8. Nel di contenuto e tipo di dati specificare colonne pagina, verificare che la griglia contenga le colonne, tipi di contenuto e tipi di dati indicati nella tabella seguente e quindi fare clic su Avanti.

    Tabelle/Colonne Tipo di contenuto Tipo di dati
    IncomeGroup Discreto Text
    OrderNumber Key Text
    Region Discreto Text
    vAssocSeqLineItems
    Line Number Key Sequence Long
    Modello Discreto Text
  9. Nel Crea Set di Testing pagina, modificare il percentuale di dati per il testing su 20, quindi fare clic su Avanti.

  10. Nel Completamento procedura guidata pagina per il Nome struttura di Data Mining, tipo Sequence Clustering with Region.

  11. Per il nome del modello di Data Mining, tipo Sequence Clustering with Region.

  12. Controllare il Consenti drill-through casella e quindi fare clic su Fine.

Attività successiva della lezione

Elaborazione del modello Sequence Clustering

Vedere anche

Progettazione modelli di data mining
Algoritmo Microsoft Sequence Clustering