Condividi tramite


Trasformazioni dei dati

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Questo articolo elenca i moduli forniti in Machine Learning Studio (versione classica) per la trasformazione dei dati. Per l'apprendimento automatico, la trasformazione dei dati comporta alcune attività molto generali, ad esempio l'unione di set di dati o la modifica dei nomi di colonna. Ma include anche molte attività specifiche di Machine Learning, ad esempio normalizzazione, binning e raggruppamento e inferenza dei valori mancanti.

Nota

Si applica a: Machine Learning Studio (versione classica)

Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.

Importante

I dati che si usano in Machine Learning Studio (versione classica) dovrebbero in genere essere "ordinati" prima di importarlo in Machine Learning Studio (versione classica). La preparazione dei dati può includere, ad esempio, la verifica che i dati usino la codifica corretta e che i dati includano uno schema coerente.

I moduli per la trasformazione dei dati sono raggruppati nelle categorie basate sulle attività seguenti:

  • Creazione di filtri per l'elaborazione del segnale digitale: i filtri del segnale digitale possono essere applicati ai dati numerici per supportare attività di Machine Learning, ad esempio il riconoscimento delle immagini, il riconoscimento vocale e l'analisi delle forme d'onda.
  • Generazione e uso di funzionalità basate sul conteggio: i moduli di featurizzazione basati sul conteggio consentono di sviluppare funzionalità compatte da usare in Machine Learning.
  • Manipolazione e preparazione generali dei dati: unione di set di dati, pulizia dei valori mancanti, raggruppamento e riepilogo dei dati, modifica dei nomi di colonna e dei tipi di dati o indicazione di quale colonna è un'etichetta o una funzionalità.
  • Campionamento e suddivisione dei set di dati: suddividere i dati in set di training e test, suddividere i set di dati in base alla percentuale o a una condizione di filtro o eseguire il campionamento.
  • Ridimensionamento e riduzione dei dati: preparare i dati numerici per l'analisi applicando la normalizzazione o il ridimensionamento. Collocare i dati in gruppi, rimuovere o sostituire gli outlier o eseguire l'analisi dei componenti principali (PCA).

Elenco di moduli

Le categorie di moduli seguenti sono incluse nella categoria Trasformazione dati:

Vedi anche