Ordinal Regression
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Crea un modello di regressione ordinale
Categoria: Machine Learning/Inizializza modello/Regressione
Nota
Si applica a: Machine Learning Studio (versione classica)
Nella finestra di progettazione sono disponibili moduli simili Azure Machine Learning trascinamento della selezione.
Panoramica del modulo
Questo articolo descrive come usare il modulo Regressione ordinale in Machine Learning Studio (versione classica) per creare un modello di regressione che può essere usato per stimare i valori classificati.
Alcuni esempi di valori classificati:
- Risposte ai sondaggi che acquisiscono i marchi preferiti dell'utente in una scala da 1 a 5
- L'ordine dei finisher in una corsa
- URL nei risultati della ricerca classificata
Altre informazioni sulla regressione ordinale
La regressione ordinale viene usata quando l'etichetta o la colonna di destinazione contiene numeri, ma i numeri rappresentano una classificazione o un ordine anziché una misura numerica.
La stima dei numeri ordinali richiede un algoritmo diverso rispetto alla stima dei valori dei numeri su una scala continua, perché i numeri assegnati per rappresentare l'ordine di classificazione non hanno una scala intrinseca.
Ad esempio, per stimare i punteggi dei test degli studenti, è necessario usare un modello di regressione standard, perché i punteggi dei test degli studenti variano in base a una scala continua e possono essere misurati. Tuttavia, per stimare la classificazione delle classi, è necessario usare un modello di regressione ordinale.
Per altre informazioni sulla ricerca alla base di questo algoritmo, vedere questo documento (PDF scaricabile): https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf
Come configurare la regressione ordinale
Questo modulo risolve un problema di classificazione come una serie di problemi di classificazione correlati. Pertanto, l'algoritmo crea una serie di esempi di training esteso usando un modello binario per ogni classificazione ed esercite il training su tale set esteso. Questa operazione può essere dispendiosa dal punto di vista del calcolo.
Aggiungere il modulo Ordinal Regression Model (Modello di regressione ordinale) all'esperimento in Studio (versione classica). È possibile trovare questo modulo in Machine Learning - Inizializza nella categoria Regressione.
Aggiungere un modulo che supporta la classificazione binaria e configurare il modello. Esistono diversi moduli a due classi nella categoria di classificazione.
Connessione modello di classificazione binaria come input per il modulo Ordinal Regression Model.
Nel modello di regressione ordinale non sono necessari parametri aggiuntivi. L'algoritmo è stato preconfigurato con i parametri più efficaci per la risoluzione di un problema di classificazione.
Connessione set di dati di training e il modulo Train Model (Training modello).
Nel modulo Train Model (Training modello) selezionare la colonna che contiene i valori di classificazione.
I valori di rango devono essere valori numerici, ma non devono essere numeri interi o positivi, purché rappresentino una sequenza.
Ai fini dell'elaborazione, si presuppone che le classificazioni presentino l'ordine da 1 a K, dove 1 è il rango più basso e K è il rango più alto. Tuttavia, il modulo Train Model (Training modello) può funzionare anche se la semantica della scalabilità è inversa.
Ad esempio, se nel sondaggio originale 1 è il punteggio più alto e 5 è il più basso, non influisce sull'elaborazione del modello.
Eseguire l'esperimento.
Risultati
Al termine del training:
Per eseguire stime, connettere il modello con training, insieme ai nuovi dati, al modulo Score Model (Punteggio modello).
Per eseguire la convalida incrociata su un set di dati con etichetta, connettere il modello senza training al modello di convalida incrociata.
Esempio
Per esempi di come viene usata la regressione ordinale in Machine Learning, vedere l'Azure AI Gallery.
- Manutenzione predittiva - Passaggio C: in questo esempio viene usata la regressione ordinale per classificare i valori restituiti da un modello di classificazione, presupponendo che il valore rifletta la gravità della classificazione degli errori.
Note tecniche
L'algoritmo di regressione ordinale usato in questo strumento di apprendimento viene implementato mediante classificazione binaria estesa, come descritto nel documento intitolato Ordinal Regression by Extended Binary Classification di Ling Li and Hsuan-Tien Lin, NIPS 2006.
Restrizioni sui dati di input
È possibile usare qualsiasi colonna numerica come destinazione di un modello di regressione ordinale, ma in pratica è consigliabile usare solo i dati che rappresentano un tipo di ordinamento o classificazione.
Si presuppone che gli intervalli tra le classificazioni siano sconosciuti e che le dimensioni dell'intervallo non siano importanti per il modello. Tuttavia, il modello presuppone che la sequenza di classificazioni segua l'ordinamento naturale dei numeri.
Il modello stesso non assegna alcun significato a una particolare scala. In altre parole, è possibile creare un modello in cui 1 è un buon rango e 10 è il peggiore e in un altro modello si presuppone che 10 sia il rango desiderato e 1 sia il peggiore.
Algoritmo di classificazione
Il set di training (X,Y) è costituito da vettori di input x ed etichette y. Le etichette rappresentano classificazioni comprese tra 1 e k in sequenza: 1,2, ... , K. Si presuppone che le classificazioni siano ordinate in modo che 1 sia il rango più basso o il peggiore e K sia il rango migliore o più alto.
Il punto cruciale dell'algoritmo consiste nella modifica delle caratteristiche di input X e delle etichette Y fornite in modo da usare esempi estesi e quindi nell'uso di un classificatore binario per risolvere il problema della regressione ordinale. Il classificatore binario viene addestrato per fornire una risposta sì/no alla domanda "Il rango è maggiore di r?"
Ad esempio, per ogni caso nel set di training sono presenti esempi estesi K-1 e la classificazione massima osservata è K. Le funzionalità estese vengono formate aggiungendo l'esima riga di una matrice di identità K-1 x K-1 alle funzionalità di input per tutti i. Le etichette vengono date +1 per le prime righe r-1 se il relativo rango è r e -1 per il resto.
Calcoli di esempio
Per illustrare il funzionamento, lasciare che x1 sia la funzionalità di training il cui rango è 3, dove il rango massimo osservato è 5. Gli esempi estesi corrispondenti a questa funzionalità sono i seguenti:
Caso | Test | Etichetta risultante |
---|---|---|
X11000 | La classificazione è maggiore di 1? | Sì; pertanto +1 |
X10100 | La classificazione è maggiore di 2? | Sì; pertanto +1 |
X10010 | La classificazione è maggiore di 3? | No; pertanto nessuna funzionalità aggiuntiva |
X10001 | La classificazione è maggiore di 4? | No; pertanto nessuna funzionalità aggiuntiva |
Input previsti
Nome | Tipo | Descrizione |
---|---|---|
Modello di classificazione binaria senza training | ILearner interface | Modello di classificazione binaria senza training |
Output
Nome | Tipo | Descrizione |
---|---|---|
Untrained model | ILearner interface | Modello di regressione ordinale senza training |