Partilhar via


Funções de janela no mapeamento do fluxo de dados

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Os fluxos de dados estão disponíveis no Azure Data Factory e no Azure Synapse Pipelines. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.

Os artigos a seguir fornecem detalhes sobre funções de janela suportadas pelo Azure Data Factory e pelo Azure Synapse Analytics no mapeamento de fluxos de dados.

Lista de funções da janela

As funções a seguir só estão disponíveis em transformações de janela.

Função janela Task
cumeDist A função CumeDist calcula a posição de um valor em relação a todos os valores na partição. O resultado é o número de linhas anteriores ou iguais à linha atual na ordenação da partição dividido pelo número total de linhas na partição da janela. Qualquer valor de empate na ordem será avaliado para a mesma posição.
denseRank Calcula a classificação de um valor em um grupo de valores especificados na ordem de uma janela por cláusula. O resultado é um mais o número de linhas anteriores ou iguais à linha atual na ordem da partição. Os valores não produzirão lacunas na sequência. A classificação densa funciona mesmo quando os dados não são classificados e procura alterações nos valores.
Defasagem Obtém o valor do primeiro parâmetro avaliado n linhas antes da linha atual. O segundo parâmetro é o número de linhas para olhar para trás e o valor padrão é 1. Se não houver tantas linhas, um valor de null será retornado, a menos que um valor padrão seja especificado.
Chumbo Obtém o valor do primeiro parâmetro avaliado n linhas após a linha atual. O segundo parâmetro é o número de linhas para olhar para a frente e o valor padrão é 1. Se não houver tantas linhas, um valor de null será retornado, a menos que um valor padrão seja especificado.
nTile A NTile função divide as linhas de cada partição de janela em n buckets que variam de 1 a, no máximo n. Os valores do bucket serão diferentes em, no máximo, 1. Se o número de linhas na partição não se dividir uniformemente no número de buckets, os valores restantes serão distribuídos um por bucket, começando com o primeiro bucket. A NTile função é útil para o cálculo de tertilesquartis, decis e outras estatísticas resumidas comuns. A função calcula duas variáveis durante a inicialização: O tamanho de um bucket regular terá uma linha extra adicionada a ele. Ambas as variáveis são baseadas no tamanho da partição atual. Durante o processo de cálculo, a função controla o número da linha atual, o número do bucket atual e o número da linha na qual o bucket será alterado (bucketThreshold). Quando o número de linha atual atinge o limite do bucket, o valor do bucket é aumentado em um e o limite é aumentado pelo tamanho do bucket (mais um extra se o bucket atual for acolchoado).
Posição Calcula a classificação de um valor em um grupo de valores especificados na ordem de uma janela por cláusula. O resultado é um mais o número de linhas anteriores ou iguais à linha atual na ordem da partição. Os valores produzirão lacunas na sequência. A classificação funciona mesmo quando os dados não são ordenados e procura alterações nos valores.
número-linha Atribui uma numeração de linha sequencial para linhas em uma janela que começa com 1.