Microsoft Fabric 웨어하우스의 차원 모델링
적용 대상:Microsoft Fabric의 ✅ SQL 분석 엔드포인트 및 웨어하우스
이 문서는 웨어하우스 내의 차원 모델링에 관한 시리즈 중 첫 번째 문서입니다. 테이블 만들기 및 테이블 데이터 관리 등 많은 T-SQL 기능을 지원하는 환경인 Microsoft Fabric의 웨어하우스에 대한 실질적인 지침을 제공합니다. 따라서 차원 모델 테이블을 만들고 데이터로 로드하는 작업을 완벽하게 제어할 수 있습니다.
참고 항목
이 문서에서 Data Warehouse라는 용어는 조직 전반에 걸쳐 중요한 데이터를 포괄적으로 통합하는 엔터프라이즈 Data Warehouse를 의미합니다. 반면, 독립 실행형 용어 웨어하우스는 Data Warehouse를 구현하는 데 사용할 수 있는 SaaS(Software as a Service) 관계형 데이터베이스 제품인 Fabric 웨어하우스를 의미합니다. 명확하게 하기 위해, 이 문서에서 후자는 Fabric 웨어하우스로 언급됩니다.
팁
차원 모델링에 대한 경험이 부족한 경우 이 문서 시리즈를 첫 번째 단계로 고려해 보세요. 차원 모델링 디자인에 대한 완전한 토론을 제공하기 위한 것은 아닙니다. 자세한 내용은 Ralph Kimball의 Data Warehouse 도구 키트: 차원 모델링에 대한 결정적 가이드(2013년 3판)와 같은 널리 출판된 콘텐츠를 직접 참조하세요.
별모양 스키마 디자인
별모양 스키마는 관계형 Data Warehouse에서 채택한 차원 모델링 디자인 기법입니다. Fabric 웨어하우스를 만들 때 권장되는 디자인 접근 방식입니다. 별모양 스키마는 팩트 테이블과 차원 테이블로 구성됩니다.
- 차원 테이블은 조직 및 분석 요구 사항과 관련된 엔터티를 설명합니다. 대체로 이는 모델링하는 항목을 나타냅니다. 항목은 제품, 사람, 장소 또는 날짜 및 시간을 포함한 기타 개념일 수 있습니다. 자세한 내용 및 디자인 모범 사례는 이 시리즈의 차원 테이블을 참조하세요.
- 팩트 테이블은 관찰 또는 이벤트와 관련된 측정값을 저장합니다. 판매 주문, 재고 잔량, 환율, 온도 판독값 등을 저장할 수 있습니다. 팩트 테이블에는 집계할 수 있는 세분화된 값과 함께 차원 키가 포함되어 있습니다. 자세한 내용 및 디자인 모범 사례는 이 시리즈의 팩트 테이블을 참조하세요.
별모양 스키마 디자인은 분석 쿼리 워크로드에 최적화되어 있습니다. 이러한 이유로 엔터프라이즈 Power BI 의미 체계 모델의 필수 조건으로 간주됩니다. 분석 쿼리는 데이터 필터링, 그룹화, 정렬 및 요약과 관련이 있습니다. 팩트 데이터는 관련 차원 테이블의 필터 및 그룹화 컨텍스트 내에서 요약됩니다.
별모양 스키마라고 불리는 이유는 팩트 테이블이 별의 중심을 형성하고 관련 차원 테이블이 별의 점을 형성하기 때문입니다.
별모양 스키마에는 여러 팩트 테이블이 포함되는 경우가 많으므로 여러 개의 별이 포함됩니다.
잘 설계된 별모양 스키마는 테이블 조인 수가 적고 유용한 인덱스가 있을 가능성이 높기 때문에 고성능(관계형) 쿼리를 제공합니다. 또한 별모양 스키마는 Data Warehouse 디자인이 발전함에 따라 유지 관리가 덜 필요한 경우가 많습니다. 예를 들어 새 특성에 의한 분석을 지원하기 위해 차원 테이블에 새 열을 추가하는 작업은 비교적 간단한 작업입니다. Data Warehouse의 범위가 발전함에 따라 새로운 팩트 및 차원을 추가하는 것도 마찬가지입니다.
차원 모델의 테이블은 ETL(추출, 변환 및 로드) 프로세스에 의해 주기적으로, 아마도 매일 업데이트되고 로드됩니다. 이 프로세스는 운영 데이터를 저장하는 원본 시스템과 데이터를 동기화합니다. 자세한 내용은 이 시리즈의 테이블 로드를 참조하세요.
Power BI를 위한 차원 모델링
엔터프라이즈 솔루션의 경우 Fabric 웨어하우스의 차원 모델은 Power BI 의미 체계 모델을 만드는 데 권장되는 필수 조건입니다. 차원 모델은 의미 체계 모델을 지원할 뿐만 아니라 기계 학습 모델과 같은 다른 환경을 위한 데이터 원본이기도 합니다.
그러나 특정 상황에서는 이것이 최선의 접근 방식이 아닐 수 있습니다. 예를 들어, IT에 의존하지 않고 신속하게 행동하기 위해 자유와 민첩성이 필요한 셀프 서비스 분석가는 원본 데이터에 직접 연결되는 의미 체계 모델을 만들 수 있습니다. 이러한 경우 차원 모델링 이론은 여전히 관련이 있습니다. 이 이론은 분석가가 Data Warehouse에서 차원 모델을 만들고 로드할 필요 없이 직관적이고 효율적인 모델을 만드는 데 도움이 됩니다. 대신, 의미 체계 모델 테이블을 만들고 로드하기 위해 원본 데이터에 연결하고 변환하는 논리를 정의하는 Power Query를 사용하여 준차원 모델을 만들 수 있습니다. 자세한 내용은 별모양 스키마 및 Power BI에서의 중요도 이해를 참조하세요.
Important
Power Query를 사용하여 의미 체계 모델에서 차원 모델을 정의하는 경우 과거 내용을 정확하게 분석하는 데 필요할 수 있는 기록 변경을 관리할 수 없습니다. 이것이 요구 사항인 경우 Data Warehouse를 만들고 주기적인 ETL 프로세스를 통해 차원 변경 내용을 캡처하고 적절하게 저장하도록 허용해야 합니다.
Data Warehouse 계획
Data Warehouse를 만들고 차원 모델을 디자인하는 것은 진지하고 중요한 작업으로 접근해야 합니다. 이는 Data Warehouse가 데이터 플랫폼의 핵심 구성 요소이기 때문입니다. 조직 전체에 대한 분석 및 보고를 지원하여 의사 결정을 내리는 견고한 기반을 형성해야 합니다.
이를 위해 Data Warehouse는 품질, 준수 및 역사적으로 정확한 데이터를 단일 버전의 진실로 저장하기 위해 노력해야 합니다. 빠른 성능으로 이해할 수 있고 탐색 가능한 데이터를 제공하고, 적절한 사람만 올바른 데이터에 액세스할 수 있도록 권한을 적용해야 합니다. 요구 사항이 발전함에 따라 변화에 적응할 수 있도록 복원력을 갖춘 Data Warehouse를 설계하도록 노력해야 합니다.
Data Warehouse의 성공적인 구현은 올바른 계획에 달려 있습니다. 전략적 및 전술적 고려 사항과 Fabric 및 Data Warehouse의 성공적인 채택으로 이어지는 작업 항목에 대한 자세한 내용은 Microsoft Fabric 채택 로드맵을 참조하세요.
팁
엔터프라이즈 Data Warehouse를 반복적으로 빌드하는 것이 좋습니다. 먼저 가장 중요한 주제 영역으로 시작한 다음, 우선 순위 및 리소스에 따라 시간이 지남에 따라 Data Warehouse를 다른 주제 영역으로 확장합니다.
관련 콘텐츠
이 시리즈의 다음 문서에서는 차원 테이블에 대한 지침 및 디자인 모범 사례에 대해 알아봅니다.