Condividi tramite


Personalizzazione ed elaborazione del modello di previsione (Esercitazione intermedia sul data mining)

L'algoritmo Microsoft Time Series fornisce parametri che influiscono sulle modalità di creazione di un modello e di analisi dei dati temporali. È possibile modificare queste proprietà per controllare il modo in cui il modello di data mining esegue le stime.

In questa attività dell'esercitazione i parametri verranno modificati nel modo seguente:

  • Verrà modificato il valore del parametro PERIODICITY_HINT per il modello Forecasting. Questo parametro fornisce all'algoritmo informazioni relative alla frequenza di ripetizione dello schema nei dati. Il criterio di ricorrenza dei dati contenuti nel database Adventure Works DW2008R2 è su base mensile e la periodicità è annuale. Pertanto, il parametro PERIODICITY_HINT verrà impostato su 12 per indicare che lo schema viene ripetuto ogni 12 mesi.

Verranno inoltre verificate le impostazioni di due importanti parametri introdotti in SQL Server 2008 come parte dei miglioramenti apportati all'algoritmo Microsoft Time Series.

  • Il parametro FORECAST_METHOD controlla se l'algoritmo Time Series è ottimizzato per le stime a breve o a lungo termine. Per impostazione predefinita, il parametro FORECAST_METHOD è impostato su MIXED, che indica che due diversi algoritmi di stima vengono combinati per eseguire una stima sia a breve termine che a lungo termine.

  • Il parametro PREDICTION_SMOOTHING controlla la combinazione delle stime a breve e a lungo termine. Per impostazione predefinita, questo parametro è impostato su 0,5, che generalmente fornisce il miglior bilanciamento per l'accuratezza complessiva.

Dopo avere apportato le modifiche, si procederà all'elaborazione del modello.

Per modificare i parametri dell'algoritmo

  1. Nella scheda Modelli di data mining fare clic con il pulsante destro del mouse su Forecasting e scegliere Imposta parametri algoritmo.

  2. Nella riga PERIODICITY_HINT della finestra di dialogo Parametri algoritmo fare clic sulla colonna Valore, quindi digitare {12}, incluse le parentesi graffe.

  3. Nella riga FORECAST_METHOD verificare che la casella di testo Valore sia vuota o impostata su MIXED. Se è stato inserito un valore diverso, digitare MIXED per ripristinare il valore predefinito del parametro.

  4. Nella riga PREDICTION_SMOOTHING verificare che la casella di testo Valore sia vuota o impostata su 0,5. Se è stato inserito un valore diverso, fare clic su Valore e digitare 0,5 per ripristinare il valore predefinito del parametro.

    Nota

    Il parametro PREDICTION_SMOOTHING è disponibile solo in SQL Server Enterprise. Non è pertanto possibile visualizzare o modificare il valore di tale parametro in SQL Server Standard. Il comportamento predefinito è tuttavia equivalente.

  5. Scegliere OK.

Per elaborare il modello di previsione

  1. Scegliere Elabora struttura di data mining e tutti i modelli dal menu Modello di data mining di BI Development Studio.

  2. Nella finestra di avviso che chiede se si desidera compilare e distribuire il progetto fare clic su .

  3. Nella finestra di dialogo Elabora struttura di data mining - Forecasting fare clic su Esegui.

    Verrà aperta la finestra di dialogo Stato elaborazione in cui sono visualizzate le informazioni sull'elaborazione del modello. L'elaborazione del modello può richiedere alcuni minuti.

  4. Al termine dell'elaborazione, fare clic su Chiudi per chiudere la finestra di dialogo Stato elaborazione.

  5. Fare nuovamente clic su Chiudi per chiudere la finestra di dialogo Elabora struttura di data mining - Forecasting .

Gestione di dati mancanti (facoltativo)

In diversi casi, è possibile che nei dati di vendita siano presenti lacune colmate con valori Null oppure che un negozio non sia stato in grado di inviare il report prima della scadenza, lasciando una cella vuota alla fine della serie. In questi casi, in Analysis Services viene generato l'errore seguente e il modello non viene elaborato.

"Errore (data mining): Timestamp non sincronizzati a partire dalla serie <nome serie> del modello di data mining <nome modello>. Tutte le serie temporali devono terminare allo stesso contrassegno temporale e i punti dati non possono essere omessi arbitrariamente. Se si imposta il parametro MISSING_VALUE_SUBSTITUTION su Previous o su una costante numerica, i punti dati mancanti verranno aggiunti automaticamente ove possibile."

Per evitare l'errore, è possibile impostare Analysis Services in modo da fornire automaticamente nuovi valori per colmare le lacune tramite i metodi seguenti:

  • Utilizzo di un valore medio. La media viene calcolata utilizzando tutti i valori validi nella stessa serie di dati.

  • Utilizzo del valore precedente. È possibile sostituire i valori precedenti di più celle mancanti, ma non è possibile riempire i valori iniziali.

  • Utilizzo di un valore costante fornito dall'utente.

Per specificare che le lacune vengano colmate tramite valori medi

  1. Nella scheda Modelli di data mining fare clic con il pulsante destro del mouse sulla colonna Forecasting e scegliere Imposta parametri algoritmo.

  2. Nella riga MISSING_VALUE_SUBSTITUTION della finestra di dialogo Parametri algoritmo fare clic sulla colonna Valore e digitare Mean.