Condividi tramite


Machine Learning - Training

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Questo articolo descrive i moduli forniti in Machine Learning Studio (versione classica) per il training di un modello di Machine Learning. Il training è il processo di analisi dei dati di input usando i parametri di un modello predefinito. Da questa analisi, il modello apprende i modelli e li salva sotto forma di modello con training.

Nota

Si applica a: Machine Learning Studio (versione classica)

Nella finestra di progettazione sono disponibili moduli simili Azure Machine Learning trascinamento della selezione.

Questo articolo descrive anche il processo complessivo in Machine Learning Studio (versione classica) per la creazione, il training, la valutazione e l'assegnazione dei punteggi del modello.

Creare e usare modelli di Machine Learning

Il flusso di lavoro tipico per Machine Learning include queste fasi:

  • Scelta di un algoritmo appropriato e impostazione delle opzioni iniziali.
  • Training del modello su dati compatibili.
  • Creazione di stime tramite nuovi dati, in base ai modelli nel modello.
  • Valutazione del modello per determinare se le stime sono accurate, quanto errore è presente e se è presente un overfitting.

Machine Learning Studio (versione classica) supporta un framework flessibile e personalizzabile per Machine Learning. Ogni attività in questo processo viene eseguita da un tipo specifico di modulo, che può essere modificato, aggiunto o rimosso, senza interrompere il resto dell'esperimento.

I moduli in questa categoria supportano il training per diversi tipi di modelli. Durante il training, i dati vengono analizzati dall'algoritmo di Machine Learning. Questo algoritmo analizza la distribuzione e il tipo dei dati, compila le statistiche e crea modelli che possono essere usati in un secondo momento per la stima.

Altre informazioni sul training del modello

Quando Machine Learning esegue il training di un modello, le righe con valori mancanti vengono ignorate. Pertanto, se si vogliono correggere i valori manualmente, usare l'imputazione o specificare un metodo diverso per la gestione dei valori mancanti, usare il modulo Clean Missing Data (Pulisci dati mancanti) prima di eseguire il training sul set di dati.

È consigliabile usare il modulo Edit Metadata (Modifica metadati) per risolvere eventuali altri problemi relativi ai dati. Potrebbe essere necessario contrassegnare la colonna etichetta, modificare i tipi di dati o i nomi di colonna corretti.

Per altre attività comuni di pulizia dei dati, ad esempio normalizzazione, campionamento, binning e ridimensionamento, vedere la categoria Trasformazione dati.

Scegliere l'trainer più giusto

Il metodo utilizzato per eseguire il training di un modello dipende dal tipo di modello che si sta creando e dal tipo di dati richiesto dal modello. Ad esempio, Machine Learning moduli specifici per il training di modelli di rilevamento anomalie, modelli di raccomandazione e altro ancora.

Controllare l'elenco dei moduli di training per determinare quale sia corretto per il proprio scenario.

Se non si è certi dei parametri migliori da usare durante il training di un modello, usare uno dei moduli forniti per lo sweep e la convalida dei parametri:

  • L'ottimizzazione degli iperparamezzi del modello può eseguire uno sweep di parametri su quasi tutti i modelli di classificazione e regressione. Viene quindi esetuato più modelli e viene restituito il modello migliore.

  • Il modulo Sweep Clustering supporta l'ottimizzazione del modello durante il processo di training ed è destinato all'uso solo con i modelli di clustering. È possibile specificare un intervallo di centroidi ed eseguire il training dei dati rilevando automaticamente i parametri migliori.

  • Il modulo Cross-Validate Model (Convalida incrociata modello) è utile anche per l'ottimizzazione del modello, ma non restituisce un modello con training. Fornisce invece metriche che è possibile usare per determinare il modello migliore.

Ripetere il training dei modelli

Se è necessario eseguire nuovamente il training di un modello di produzione, è possibile eseguire nuovamente l'esperimento in qualsiasi momento.

È anche possibile automatizzare il processo di riesificazione usando i servizi Web. Per una procedura dettagliata, vedere Retraining and updating Machine Learning models with Azure Data Factory (Training e aggiornamento di modelli con Azure Data Factory).

Usare modelli con training preliminare

Machine Learning include alcuni modelli con training preliminare, ad esempio il modulo Pretrained Cascade Image Classification (Classificazione immagini a cascata con training preliminare). È possibile usare questi modelli per l'assegnazione dei punteggi senza input di dati aggiuntivi.

Inoltre, alcuni moduli, ad esempio il rilevamento anomalie delle serie temporizzato, non generano un modello con training nel formato iLearner. Ma accettano i dati di training e creano un modello internamente, che può quindi essere usato per eseguire stime. Per usarli, è sufficiente configurare i parametri e fornire i dati.

Salvare uno snapshot di un modello con training

Se si vuole salvare o esportare il modello, fare clic con il pulsante destro del mouse sul modulo di training e scegliere Salva come modello con training. Il modello viene esportato nel formato iLearner e salvato nell'area di lavoro in Modelli con training. I modelli con training possono essere usati nuovamente in altri esperimenti o connessi ad altri moduli per l'assegnazione dei punteggi.

È anche possibile usare il modulo Load Trained Model in un esperimento per recuperare un modello archiviato.

Elenco dei moduli

La categoria Train (Training) include i moduli seguenti:

  • Sweep Clustering: esegue un'operazione di sweep dei parametri su un modello di clustering per determinare le impostazioni ottimali dei parametri ed esegue il trains del modello migliore.
  • Train Anomaly Detection Model (Training del modello di rilevamento anomalie): consente di training di un modello di rilevamento anomalie ed etichetta i dati da un set di training.
  • Train Clustering Model (Training modello di clustering): consente di eseguire il training di un modello di clustering e di assegnare i dati dal set di training ai cluster.
  • Train Matchbox Recommender (Strumento di raccomandazione matchbox di training): consente di eseguire il training di un sistema di raccomandazione Bayes usando l'algoritmo Matchbox.
  • Train Model (Training modello): training di un modello di classificazione o regressione da un set di training.
  • Ottimizzare gli iperparamezzi del modello: esegue uno sweep di parametri su un modello di regressione o di classificazione per determinare le impostazioni ottimali dei parametri ed esegue il data mining del modello migliore.

Alcuni moduli non sono in questa categoria perché richiedono un formato speciale o sono personalizzati per un'attività specifica:

Vedi anche