Condividi tramite


Trasformazione dati - Filtro

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Questo articolo descrive come usare i moduli di filtro in Machine Learning Studio (versione classica) per trasformare i dati digitali. I moduli in questo gruppo di strumenti per Machine Learning Studio (versione classica) sono basati sui filtri sviluppati per la tecnologia di elaborazione dei segnali digitali.

Nota

Si applica a: solo Machine Learning Studio (versione classica)

I moduli di trascinamento e rilascio simili sono disponibili in Azure Machine Learning finestra di progettazione.

I filtri vengono in genere applicati ai dati nella fase di elaborazione dati o alla fase di pre-elaborazione. I filtri migliorano la chiarezza del segnale usato per Machine Learning. Ad esempio, è possibile usare i moduli di filtro in Machine Learning Studio (versione classica) per queste attività di elaborazione:

  • Pulire le forme d'onda usate per il riconoscimento vocale.
  • Rilevare tendenze o rimuovere effetti stagionali in dati di vendita o economici che includono rumore.
  • Analizzare i modelli o gli artefatti nei segnali di telemetria.

Questi moduli offrono una semplice configurazione dei filtri usando algoritmi ben ricercati per trasformare matematicamente i dati della forma d'onda. È anche possibile creare un filtro personalizzato, se sono già stati determinati i coefficienti corretti da applicare ai dati.

Se è necessario eseguire attività quali l'esclusione dei dati da un set di dati in base a riga, la rimozione di valori mancanti o la riduzione delle dimensioni di un set di dati, usare questi moduli:

  • Pulire i dati mancanti: rimuovere valori mancanti o sostituire i valori mancanti con i segnaposto.
  • Partizionamento e esempio: dividere o filtrare il set di dati usando criteri quali un intervallo di date, un valore specifico o espressioni regolari.
  • Valori clip: impostare un intervallo di valori e mantenere solo i valori all'interno di tale intervallo.

Filtri nell'elaborazione del segnale digitale

Proprio come è possibile collegare un filtro a una fotocamera per compensare l'illuminazione o creare effetti speciali, è possibile applicare un filtro ai dati usati per l'apprendimento automatico. I filtri possono aiutare a migliorare la chiarezza di un segnale, acquisire caratteristiche interessanti o ridurre il rumore.

Il filtro ideale eliminerebbe tutti i rumori e avrà una sensibilità uniforme per il segnale desiderato. Tuttavia, la progettazione di un filtro abbastanza buono potrebbe richiedere molte iterazioni o combinazioni di tecniche. Se si riesce a progettare un filtro efficace, è consigliabile salvare il filtro in modo da poterlo riutilizzare quando si trasformano nuovi dati.

In genere, i filtri sono basati sui principi dell'analisi della forma d'onda. Quando si progetta un filtro, si cercano modi per eliminare o amplificare parti del segnale, per esporre tendenze sottostanti, per ridurre il rumore e l'interferenza o per identificare i valori di dati che altrimenti potrebbero non essere percepiti.

Vengono applicate varie tecniche per decomporsi di singole tendenze o componenti waveform che creano valori di dati effettivi. La serie di valori può essere analizzata usando funzioni trigonometriche per identificare e isolare singole forme d'onda. Questo è vero se si tratta di una serie econometrica o delle frequenze composte di segnali audio. I filtri possono quindi essere applicati a queste forme d'onda per eliminare il rumore, amplificare alcune onde o rimuovere componenti mirati.

Quando si applicano filtri a una serie con rumore per isolare componenti diversi, è possibile specificare le frequenze da rimuovere o rafforzare indicando la banda di frequenze da usare.

Filtri digitali in Machine Learning Studio (versione classica)

I tipi di filtri seguenti sono supportati in Machine Learning Studio (versione classica):

  • Filtri basati sulla scomposizione della forma onda. Gli esempi includono filtri di risposta a impulsi finiti (FIR) e una risposta a impulsi infinito (IIR). Questi filtri funzionano rimuovendo componenti specifici da una serie complessiva. È quindi possibile visualizzare e analizzare la forma onda semplificata.
  • Filtri basati su medie mobili o su valori medi. Questi filtri riducono le variazioni in una serie di dati, calcolando la media su intervalli di tempo. Gli intervalli possono essere fissi o variabili e possono avere forme diverse. Ad esempio, un intervallo triangolare presenta un picco in corrispondenza del punto di dati attuale (attribuisce un peso maggiore al valore attuale) e si riduce prima e dopo tale punto di dati (attribuisce ai valori precedenti e seguenti un peso minore).
  • Filtri definiti dall'utente o personalizzati. Se si conoscono già le trasformazioni che devono essere applicate a una serie di dati, è possibile creare un filtro definito dall'utente. Vengono forniti i coefficienti numerici applicati per trasformare la serie di dati. Un filtro personalizzato può emulare un filtro FIR o IIR. Tuttavia, con un filtro personalizzato, è possibile controllare più sui valori da applicare a ogni punto della serie.

Terminologia del filtro

L'elenco seguente include definizioni semplici di termini usati nei parametri e nelle proprietà dei filtri:

  • Passband: intervallo di frequenze che possono passare attraverso un filtro senza essere attenuato o indebolito.
  • Banda di interruzioni: intervallo di frequenze tra i limiti specificati attraverso i quali i segnali non vengono passati. Per definire la banda di arresto, è necessario impostare le frequenze di taglio.
  • Passaggio elevato: lascia che solo le frequenze elevate attraverso.
  • Passaggio basso: accetta solo frequenze sotto un valore di taglio specificato.
  • Angolo: definisce il limite tra le frequenze di banda e passband. È in genere possibile decidere se il taglio è incluso o escluso dalla banda. Un filtro di primo ordine causa un'attenuazione graduale fino alla frequenza dell'angolo. In seguito, il filtro causa un'attenuazione esponenziale. I filtri con ordine superiore (ad esempio i filtri Butterworth e Chebyshev) hanno pendenza più ripida dopo la frequenza dell'angolo. I filtri con ordine superiore attenuano i valori nella banda di arresto molto più rapidamente e completamente.
  • Filtro bandtop (chiamato anche filtro di rifiuto banda o filtro notch ): ha solo una banda di arresto. Si definisce la banda di interruzione specificando due frequenze: frequenza di taglio elevato e frequenza di taglio basso. Un filtro bandpass include in genere due bande di arresto: uno su entrambi i lati del componente desiderato.
  • Ripple: una piccola variazione indesiderata che si verifica periodicamente. In Machine Learning è possibile specificare la quantità di increspature da tollerare come parte dei parametri nella progettazione del filtro IIR.

Suggerimento

Se sono necessarie altre informazioni, Se non si ha esperienza con l'elaborazione del segnale digitale, vedere Introduzione all'elaborazione del segnale digitale. Il sito Web fornisce definizioni e utili sussidi visivi che illustrano la terminologia e i concetti di base.

Elenco dei moduli

I moduli seguenti sono inclusi nella categoria Trasformazione dati - Filtro :

  • Applica filtro: applica un filtro alle colonne specificate di un set di dati.
  • Filtro FIR: crea un filtro FIR per l'elaborazione dei segnali.
  • Filtro IIR: crea un filtro IIR per l'elaborazione dei segnali.
  • Filtro mediano: crea un filtro mediano usato per regolare i dati per l'analisi delle tendenze.
  • Filtro medio mobile: crea un filtro medio mobile che consente di regolare i dati per l'analisi delle tendenze.
  • Filtro soglia: crea un filtro soglia che limita i valori.
  • Filtro definito dall'utente: crea un filtro FIR o IIR personalizzato.

Vedere anche