매핑 데이터 흐름의 집계 함수
적용 대상: Azure Data Factory Azure Synapse Analytics
팁
기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아봅니다!
데이터 흐름은 Azure Data Factory 및 Azure Synapse Pipelines 모두에서 사용할 수 있습니다. 이 문서는 매핑 데이터 흐름에 적용됩니다. 변환을 처음 사용하는 경우 매핑 데이터 흐름을 사용하여 데이터 변환 소개 문서를 참조하세요.
다음 문서에서는 Azure Data Factory 및 Azure Synapse Analytics에서 지원하는 매핑 데이터 흐름의 집계 함수에 관해 자세히 설명합니다.
집계 함수 목록
다음 함수는 집계, 피벗, 피벗 해제 및 창 변환에서만 사용할 수 있습니다.
집계 함수 | 작업 |
---|---|
approxDistinctCount | 열에 대한 고유 값의 대략적인 집계 수를 가져옵니다. 선택적 두 번째 매개 변수는 예측 오류를 제어하는 것입니다. |
avg | 열 값의 평균을 구합니다. |
avgIf | 조건에 따라 열 값의 평균을 구합니다. |
collect | 집계 그룹에 있는 식의 모든 값을 배열로 수집합니다. 이 프로세스 중에 구조를 수집하고 대체 구조로 변환할 수 있습니다. 항목 수는 해당 그룹의 행 수와 동일하며 Null 값을 포함할 수 있습니다. 수집된 항목 수는 적어야 합니다. |
collectUnique | 집계된 그룹에 있는 식의 모든 값을 고유한 배열로 수집합니다. 이 프로세스 동안 구조를 수집하고 대체 구조로 변환할 수 있습니다. 항목 수는 해당 그룹의 행 수보다 작거나 같으며 null 값을 포함할 수 있습니다. 수집된 항목 수는 적어야 합니다. |
count | 값의 집계 개수를 가져옵니다. 선택적 열을 지정하면 개수에서 Null 값을 무시합니다. |
countAll | NULL을 포함한 값의 집계 수를 가져옵니다. |
countDistinct | 열 세트의 고유 값에 대한 집계 합계를 구합니다. |
countAllDistinct | NULL을 포함한 열 세트에 있는 고유 값의 집계 수를 가져옵니다. |
countIf | 조건에 따라 값의 집계 개수를 가져옵니다. 선택적 열을 지정하면 개수에서 Null 값을 무시합니다. |
covariancePopulation | 두 열 간의 모집단 공 분산을 구합니다. |
covariancePopulationIf | 조건에 따라 두 열의 모집단 공 분산을 구합니다. |
covarianceSample | 두 열의 샘플 공 분산을 구합니다. |
covarianceSampleIf | 조건에 따라 두 열의 샘플 공 분산을 구합니다. |
first | 열 그룹의 첫 번째 값을 가져옵니다. 두 번째 매개 변수 ignoreNulls를 생략하면 false로 간주됩니다. |
isDistinct | 열 또는 열 집합이 고유한지 확인합니다. null은 고유 값으로 계산하지 않습니다. |
kurtosis | 열의 첨도를 구합니다. |
kurtosisIf | 조건에 따라 열의 첨도를 구합니다. |
last | 열 그룹의 마지막 값을 가져옵니다. 두 번째 매개 변수 ignoreNulls를 생략하면 false로 간주됩니다. |
max | 열의 최댓값을 구합니다. |
maxIf | 조건에 따라 열의 최댓값을 구합니다. |
mean | 열 값의 평균값을 가져옵니다. AVG와 같습니다. |
meanIf | 조건에 따라 열 값의 평균값을 가져옵니다. avgIf와 같습니다. |
min | 열의 최솟값을 구합니다. |
minIf | 조건에 따라 열의 최솟값을 구합니다. |
skewness | 열의 왜도를 구합니다. |
skewnessIf | 조건에 따라 열의 왜도를 구합니다. |
stddev | 열의 표준 편차를 구합니다. |
stddevIf | 조건에 따라 열의 표준 편차를 구합니다. |
stddevPopulation | 열의 모집단 표준 편차를 구합니다. |
stddevPopulationIf | 조건에 따라 열의 모집단 표준 편차를 구합니다. |
stddevSample | 열의 샘플 표준 편차를 구합니다. |
stddevSampleIf | 조건에 따라 열의 샘플 표준 편차를 구합니다. |
sum | 숫자 열의 집계 합계를 구합니다. |
sumDistinct | 숫자 열의 고유 값에 대한 집계 합계를 구합니다. |
sumDistinctIf | 기준에 따라 숫자 열의 집계 합계를 가져옵니다. 조건의 기준은 어떤 열도 될 수 있습니다. |
sumIf | 기준에 따라 숫자 열의 집계 합계를 가져옵니다. 조건의 기준은 어떤 열도 될 수 있습니다. |
topN | 이 열의 상위 N개 값을 가져옵니다. |
분산 | 열의 분산을 구합니다. |
varianceIf | 조건에 따라 열의 분산을 구합니다. |
variancePopulation | 열의 모집단 분산을 구합니다. |
variancePopulationIf | 조건에 따라 열의 모집단 분산을 구합니다. |
varianceSample | 열의 불편 분산을 구합니다. |
varianceSampleIf | 조건에 따라 열의 불편 분산을 구합니다. |
관련 콘텐츠
- 모든 배열 함수 목록입니다.
- 모든 캐시된 조회 함수 목록입니다.
- 모든 변환 함수 목록입니다.
- 모든 날짜 및 시간 함수 목록입니다.
- 모든 식 함수 목록입니다.
- 모든 맵 함수 목록입니다.
- 모든 메타함수 목록입니다.
- 모든 창 함수 목록입니다.
- 모든 데이터 변환 식의 사용량 세부 정보입니다.
- 식 작성기를 사용하는 방법을 알아보세요.