다음을 통해 공유


Dataflow Gen2를 사용하여 2GB의 온-프레미스 CSV 데이터를 레이크하우스 테이블에 로드하는 가격 책정 시나리오

이 시나리오에서는 Dataflow Gen2를 사용하여 Microsoft Fabric의 레이크하우스 테이블에 2GB의 온-프레미스 CSV 데이터를 로드했습니다.

다음 예제에 사용된 가격은 가상의 가격이며 정확한 실제 가격 책정을 의미하지는 않습니다. 이는 Microsoft Fabric의 Data Factory 프로젝트에 대한 비용을 예측, 계획 및 관리하는 방법을 보여줍니다. 또한 패브릭 용량은 지역마다 고유하게 가격이 책정되므로 시간당 CU별 $0.18로 미국 서부 2(일반적인 Azure 지역)의 패브릭 용량에 대해 종량제 가격을 사용합니다. 다른 패브릭 용량 가격 책정 옵션을 살펴보려면 여기에서 Microsoft Fabric - 가격 책정을 참조하세요.

구성

시나리오를 달성하려면 다음 단계를 사용하여데이터 흐름을 만들어야 합니다.

  1. 데이터 흐름 초기화: 온-프레미스 환경에서 데이터 흐름으로 2GB CSV 파일을 업로드하여 시작합니다.
  2. Power Query 구성:
    1. Power Query로 이동합니다.
    2. 쿼리를 준비하는 옵션을 사용하지 않도록 설정합니다.
    3. CSV 파일을 결합합니다.
  3. 데이터 변환:
    1. 명확성을 위해 헤더를 승격합니다.
    2. 불필요한 열을 제거합니다.
    3. 필요에 따라 열 데이터 형식을 조정합니다.
  4. 출력 데이터 대상 정의:
    1. 레이크하우스를 데이터 출력 대상으로 구성합니다.
    2. 이 예제에서는 패브릭 내의 레이크하우스를 만들고 활용했습니다.

패브릭 메트릭 앱을 사용하여 비용 예측

패브릭 메트릭 앱에서 작업의 기간 및 CU 사용량을 보여주는 스크린샷.

데이터 흐름 Gen2 새로 고침 비용에 대한 세부 정보를 보여 주는 스크린샷

실행에 사용된 Dataflow Gen2 대규모 데이터 흐름 컴퓨팅 사용량에 대한 세부 정보를 보여주는 스크린샷.

실행에 사용된 두 번째 Dataflow Gen2 대규모 데이터 흐름 컴퓨팅 사용량에 대한 세부 정보를 보여주는 스크린샷.

Dataflow Gen2 새로 고침 작업은 4749.42 CU 초를 사용했으며, 두 개의 대규모 데이터 흐름 컴퓨팅 작업은 각각 7.78 CU 초 + 7.85 CU 초를 소비했습니다.

참고 항목

메트릭으로 보고되지만 실행의 실제 기간은 패브릭 메트릭 앱을 사용하여 유효한 CU 시간을 계산할 때와 관련이 없습니다. CU 초 메트릭도 이미 해당 기간을 고려한다고 보고하기 때문입니다.

메트릭 컴퓨팅 사용량
Dataflow Gen2 새로 고침 CU 초 4749.42 CU 초
대규모 데이터 흐름 컴퓨팅 CU 초 (7.78 + 7.85) 15.63 CU 초
청구 대상 유효 CU 시간 (4749.42 + 15.63) / (60*60) = 1.32 CU 시간

총 실행 비용 $0.18/CU 시간 = (1.32 CU 시간) * ($0.18/CU 시간) ~= $0.24