Condividi tramite


Regressione di Poisson

Avviso

Questo componente È STATO DEPRECATO perché la relativa dipendenza, il progetto NimbusML , non viene più gestita attivamente. Di conseguenza, questo componente non riceverà aggiornamenti futuri o patch di sicurezza. Questo componente verrà rimosso nelle prossime versioni. Gli utenti sono consigliati per eseguire la migrazione a soluzioni alternative per garantire il supporto e la sicurezza continui.

Questo articolo descrive un componente nella finestra di progettazione di Azure Machine Learning.

Usare questo componente per creare un modello di regressione Poisson in una pipeline. La regressione di Poisson è destinata alla stima dei valori numerici, in genere conteggi. Pertanto, è consigliabile usare questo componente per creare il modello di regressione solo se i valori che si sta tentando di stimare soddisfano le condizioni seguenti:

  • La variabile di risposta ha una distribuzione di Poisson.

  • I conteggi non possono essere negativi. Il metodo avrà esito negativo se si tenta di usarlo con etichette negative.

  • Una distribuzione di Poisson è una distribuzione discreta; pertanto, non è significativo usare questo metodo con numeri non interi.

Suggerimento

Se la destinazione non è un conteggio, la regressione di Poisson probabilmente non è un metodo appropriato. Provare altri componenti di regressione nella finestra di progettazione.

Dopo aver configurato il metodo di regressione, è necessario eseguire il training del modello usando un set di dati contenente esempi del valore da stimare. Il modello sottoposto a training può quindi essere usato per eseguire stime.

Altre informazioni sulla regressione di Poisson

La regressione Poisson è un tipo speciale di analisi della regressione che viene in genere usata per il conteggio dei modelli. Ad esempio, la regressione poisson sarebbe utile in questi scenari:

  • Modellazione del numero di freddo associati ai voli aerei

  • Stima del numero di chiamate al servizio di emergenza durante un evento

  • Progetto del numero di richieste dei clienti successive a una promozione

  • Creazione di tabelle di emergenza

Poiché la variabile di risposta ha una distribuzione di Poisson, il modello presuppone presupposti diversi sui dati e sulla relativa distribuzione delle probabilità rispetto alla regressione dei minimi quadrati. Pertanto, i modelli Poisson devono essere interpretati in modo diverso da altri modelli di regressione.

Come configurare la regressione di Poisson

  1. Aggiungere il componente Poisson Regression alla pipeline nella finestra di progettazione. È possibile trovare questo componente in Algoritmi di Machine Learning nella categoria Regressione .

  2. Aggiungere un set di dati contenente i dati di training del tipo corretto.

    È consigliabile usare Normalize Data per normalizzare il set di dati di input prima di usarlo per eseguire il training del regressore.

  3. Nel riquadro destro del componente Poisson Regression specificare la modalità di training del modello impostando l'opzione Crea modalità di training.

    • Singolo parametro: se si sa come configurare il modello, specificare un set specifico di valori come argomenti.

    • Intervallo di parametri: se non si è certi dei parametri migliori, eseguire uno sweep di parametri usando il componente Ottimizza iperparametri del modello. Il formatore esegue l'iterazione su più valori specificati per trovare la configurazione ottimale.

  4. Tolleranza di ottimizzazione: digitare un valore che definisce l'intervallo di tolleranza durante l'ottimizzazione. Minore è il valore, più lento e più accurato è il montaggio.

  5. Peso regolarizzazione L1 e Peso regolarizzazione L2: valori di tipo da utilizzare per la regolarizzazione L1 e L2. La regolarizzazione aggiunge vincoli all'algoritmo relativi agli aspetti del modello indipendenti dai dati di training. La regolarizzazione viene comunemente usata per evitare l'overfitting.

    • La regolarizzazione L1 è utile se l'obiettivo è avere un modello il più sparse possibile.

      La regolarizzazione L1 viene eseguita sottraendo il peso L1 del vettore di peso dall'espressione di perdita che l'apprendimento sta tentando di ridurre al minimo. La norma L1 è una buona approssimazione alla norma L0, che è il numero di coordinate non zero.

    • La regolarizzazione L2 impedisce a qualsiasi singola coordinata nel vettore di peso di crescere troppo in grandezza. La regolarizzazione L2 è utile se l'obiettivo è avere un modello con pesi complessivi ridotti.

    In questo componente è possibile applicare una combinazione di regolarizzazioni L1 e L2. Combinando la regolarizzazione L1 e L2, è possibile imporre una penalità sulla grandezza dei valori dei parametri. L'apprendimento tenta di ridurre al minimo la penalità, in un compromesso con la riduzione al minimo della perdita.

    Per una buona descrizione della regolarizzazione L1 e L2, vedere Regolarizzazione L1 e L2 per Machine Learning.

  6. Dimensioni della memoria per L-BFGS: specificare la quantità di memoria da riservare per l'adattamento e l'ottimizzazione del modello.

    L-BFGS è un metodo specifico per l'ottimizzazione, basato sull'algoritmo Broyden-Fletcher–Goldfarb–Shanno (BFGS). Il metodo usa una quantità limitata di memoria (L) per calcolare la direzione del passaggio successivo.

    Modificando questo parametro, è possibile influire sul numero di posizioni e sfumature passate archiviate per il calcolo del passaggio successivo.

  7. Connettere il set di dati di training e il modello non sottoposto a training a uno dei componenti di training:

    • Se si imposta Create trainer mode (Crea modalità trainer) su Single Parameter (Parametro singolo), usare il componente Train Model (Esegui training modello).

    • Se si imposta Crea modalità di training su Intervallo di parametri, usare il componente Ottimizza iperparametri del modello.

    Avviso

    • Se si passa un intervallo di parametri a Train Model, viene usato solo il primo valore nell'elenco di intervalli di parametri.

    • Se si passa un singolo set di valori di parametro al componente Tune Model Hyperparameters , quando prevede un intervallo di impostazioni per ogni parametro, ignora i valori e usa i valori predefiniti per lo strumento di apprendimento.

    • Se si seleziona l'opzione Intervallo di parametri e si immette un singolo valore per qualsiasi parametro, tale singolo valore specificato viene usato durante lo sweep, anche se altri parametri cambiano in un intervallo di valori.

  8. Inviare la pipeline.

Risultati

Al termine del training:

  • Per salvare uno snapshot del modello sottoposto a training, selezionare il componente di training e quindi passare alla scheda Output e log nel pannello a destra. Fare clic sull'icona Registra set di dati. È possibile trovare il modello salvato come componente nell'albero dei componenti.

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.