Funções de janela no mapeamento do fluxo de dados

Artigo
05/15/2024

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Os fluxos de dados estão disponíveis no Azure Data Factory e no Azure Synapse Pipelines. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.

Os artigos a seguir fornecem detalhes sobre funções de janela suportadas pelo Azure Data Factory e pelo Azure Synapse Analytics no mapeamento de fluxos de dados.

Lista de funções da janela

As funções a seguir só estão disponíveis em transformações de janela.

Função janela	Task
cumeDist	A função CumeDist calcula a posição de um valor em relação a todos os valores na partição. O resultado é o número de linhas anteriores ou iguais à linha atual na ordenação da partição dividido pelo número total de linhas na partição da janela. Qualquer valor de empate na ordem será avaliado para a mesma posição.
denseRank	Calcula a classificação de um valor em um grupo de valores especificados na ordem de uma janela por cláusula. O resultado é um mais o número de linhas anteriores ou iguais à linha atual na ordem da partição. Os valores não produzirão lacunas na sequência. A classificação densa funciona mesmo quando os dados não são classificados e procura alterações nos valores.
Defasagem	Obtém o valor do primeiro parâmetro avaliado n linhas antes da linha atual. O segundo parâmetro é o número de linhas para olhar para trás e o valor padrão é 1. Se não houver tantas linhas, um valor de null será retornado, a menos que um valor padrão seja especificado.
Chumbo	Obtém o valor do primeiro parâmetro avaliado n linhas após a linha atual. O segundo parâmetro é o número de linhas para olhar para a frente e o valor padrão é 1. Se não houver tantas linhas, um valor de null será retornado, a menos que um valor padrão seja especificado.
nTile	A `NTile` função divide as linhas de cada partição de janela em `n` buckets que variam de 1 a, no máximo `n`. Os valores do bucket serão diferentes em, no máximo, 1. Se o número de linhas na partição não se dividir uniformemente no número de buckets, os valores restantes serão distribuídos um por bucket, começando com o primeiro bucket. A `NTile` função é útil para o cálculo de `tertiles`quartis, decis e outras estatísticas resumidas comuns. A função calcula duas variáveis durante a inicialização: O tamanho de um bucket regular terá uma linha extra adicionada a ele. Ambas as variáveis são baseadas no tamanho da partição atual. Durante o processo de cálculo, a função controla o número da linha atual, o número do bucket atual e o número da linha na qual o bucket será alterado (bucketThreshold). Quando o número de linha atual atinge o limite do bucket, o valor do bucket é aumentado em um e o limite é aumentado pelo tamanho do bucket (mais um extra se o bucket atual for acolchoado).
Posição	Calcula a classificação de um valor em um grupo de valores especificados na ordem de uma janela por cláusula. O resultado é um mais o número de linhas anteriores ou iguais à linha atual na ordem da partição. Os valores produzirão lacunas na sequência. A classificação funciona mesmo quando os dados não são ordenados e procura alterações nos valores.
número-linha	Atribui uma numeração de linha sequencial para linhas em uma janela que começa com 1.

Lista de todas as funções agregadas.
Lista de todas as funções da matriz.
Lista de todas as funções de pesquisa em cache.
Lista de todas as funções de conversão.
Lista de todas as funções de data e hora.
Lista de todas as funções de expressão.
Lista de todas as funções do mapa.
Lista de todas as metafunções.
Detalhes de uso de todas as expressões de transformação de dados.
Saiba como usar o Construtor de Expressões.

Partilhar via

Funções de janela no mapeamento do fluxo de dados

Lista de funções da janela

Comentários

Recursos adicionais

Partilhar via

Funções de janela no mapeamento do fluxo de dados

Lista de funções da janela

Conteúdos relacionados

Comentários

Recursos adicionais