Condividi tramite


Trasformazione Window nel flusso di dati per mapping

SI APPLICA A: Azure Data Factory Azure Synapse Analytics

Suggerimento

Provare Data Factory in Microsoft Fabric, una soluzione di analisi all-in-one per le aziende. Microsoft Fabric copre tutto, dallo spostamento dati al data science, all'analisi in tempo reale, alla business intelligence e alla creazione di report. Vedere le informazioni su come iniziare una nuova prova gratuita!

I flussi di dati sono disponibili nelle pipeline sia di Azure Data Factory che di Azure Synapse. Questo articolo si applica ai flussi di dati per mapping. Se non si ha esperienza con le trasformazioni, vedere l'articolo introduttivo Trasformare i dati con un flusso di dati per mapping.

La trasformazione Window è la posizione in cui vengono definite le aggregazioni basate su finestra delle colonne nei flussi di dati. Nel Generatore di espressioni è possibile definire diversi tipi di aggregazioni basate su finestre di dati o temporali (clausola OVER SQL), ad esempio LEAD, LAG, NTILE, CUMEDIST e RANK. Viene generato un nuovo campo nell'output che include queste aggregazioni. È anche possibile includere campi di raggruppamento facoltativi.

Screenshot che mostra l'opzione Windowing selezionata dal menu.

Over (Selezione)

Impostare il partizionamento dei dati di colonna per la trasformazione Finestra. L'equivalente SQL è Partition By nella clausola Over in SQL. Per creare un calcolo o un'espressione da usare per il partizionamento, è possibile passare il mouse sul nome della colonna e selezionare Colonna calcolata.

Screenshot che mostra le impostazioni di windowing con la scheda Oltre selezionata.

Ordinamento

Un'altra parte della clausola Over è l'impostazione di Order By. Questa clausola imposta l'ordinamento dei dati. È anche possibile creare un'espressione per calcolare un valore in questo campo della colonna per l'ordinamento.

Screenshot che mostra le impostazioni di windowing con la scheda Ordina selezionata.

Range By (Criteri intervallo)

Impostare poi l'intervallo della finestra come Unbounded (Non vincolato) o Bounded (Vincolato). Per impostare un intervallo della finestra non vincolato, impostare il dispositivo di scorrimento su Unbounded (Non vincolato) su entrambe le estremità. Se si sceglie un'impostazione compresa tra Unbounded (Non vincolato) e Current Row (Riga corrente), è necessario impostare i valori di inizio e fine per Offset. Entrambi i valori sono numeri interi positivi. È possibile usare numeri relativi o valori dai dati.

Nel dispositivo di scorrimento della finestra è necessario impostare due valori: i valori prima della riga corrente e i valori dopo la riga corrente. L'offset di inizio e di fine corrisponde ai due selettori nel dispositivo di scorrimento.

Screenshot che mostra le impostazioni di windowing con la scheda Intervallo selezionata.

Colonne della finestra

Infine, usare il generatore di espressioni per definire le aggregazioni da usare con le finestre di dati, come RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG e così via.

L'elenco completo delle funzioni di aggregazione e analisi disponibili per l'uso nel linguaggio per le espressioni per i flussi di dati di tramite il Generatore di espressioni è disponibile in Espressioni di trasformazione dei dati nel flusso di dati per mapping.

Per una semplice aggregazione group-by, usare la trasformazione aggregazione