Microsoft Purview의 데이터 품질 보고서
DQ(데이터 품질) 보고서는 organization 또는 시스템 내의 데이터 품질을 평가하고 요약하는 포괄적인 문서입니다. 일반적으로 다양한 데이터 품질 차원에 대한 평가와 관련자가 데이터의 정확도, 완전성, 일관성, 안정성 및 타임라인을 이해하는 데 도움이 되는 메트릭이 포함됩니다. 이 데이터 품질 보고서를 통해 팀은 건강 관리 진행 상황을 한눈에 추적하고 데이터 자산의 데이터 품질을 개선하기 위해 더 많은 작업이 필요한 영역을 식별할 수 있습니다.
이 문서에서는 이 보고서에 액세스할 수 있는 방법과 제공된 데이터 품질 측정값이 건강 관리에 어떤 의미가 있는지를 설명합니다.
이 데이터 품질 보고서의 목적
모니터링 및 거버넌스: 데이터의 품질을 지속적으로 모니터링하고 관리하여 organization 표준 및 규정 요구 사항을 충족하는지 확인합니다.
의사 결정 지원: 관련자에게 정보에 입각한 비즈니스 의사 결정을 내리기 위한 신뢰할 수 있는 데이터를 제공합니다.
문제 식별: 데이터 품질 문제를 검색하고 문서화하여 적시에 수정할 수 있습니다.
데이터 관리 개선: 데이터 품질 문제의 근본 원인을 식별하고 수정 조치를 구현하여 데이터 관리 사례를 향상시킵니다.
성능 측정: 데이터 품질 이니셔티브의 효과를 측정하고 시간에 따른 개선 사항을 추적합니다.
이해 관계자 커뮤니케이션: 관리, 데이터 제품 소유자, 데이터 관리자 및 IT 팀을 비롯한 이해 관계자에게 데이터 품질 상태 및 진행 상황을 전달합니다. 이러한 보고서는 데이터 품질 상태에 대한 명확하고 포괄적인 보기를 제공하여 organization 내에서 데이터의 무결성과 유용성을 유지하는 데 중요한 역할을 합니다.
필수 구성 요소
- 데이터 자산 상태 정보를 볼 수 있도록 데이터 상태 판독 기 권한이 필요합니다.
데이터 거버넌스 상태 보고서 보기
- Microsoft Purview 포털을 열고 통합 카탈로그 선택합니다.
- 상태 관리 드롭다운을 선택합니다.
- 보고서를 선택합니다.
- 데이터 상태 보고서를 선택합니다.
데이터 품질 차원 보고
이 보고서에서 개요 페이지에는 데이터 품질 차원 점수, 데이터 품질 규칙 계층 구조, 차원별 데이터 품질 상태 및 데이터 품질 차원 & 다양한 데이터 자산에 사용되는 규칙 유형이 포함됩니다. 상위 컨트롤은 전체 상태 관리를 한눈에 이해하는 데 도움이 됩니다.
필터를 사용하여 특정 상태 특정 거버넌스 도메인, 데이터 제품 또는 데이터 제품에 대한 정보를 볼 수 있습니다(예: 초안).
데이터 품질 차원 | 설명 |
---|---|
정확도 | 데이터는 실제 엔터티를 정확하게 나타내야 합니다. 컨텍스트가 중요합니다! 예를 들어 고객 주소를 저장하는 경우 실제 위치와 일치하는지 확인합니다. |
완전성 | 이 규칙의 목적은 빈 데이터, null 또는 누락된 데이터를 식별하는 것입니다. 이 규칙은 모든 값이 있는지 확인합니다(반드시 올바르지는 않지만). |
적합성 | 이 규칙은 데이터가 날짜, 주소 및 허용되는 값의 표현과 같은 데이터 서식 표준을 따르도록 합니다. |
일관성 | 이 규칙은 동일한 레코드의 다른 값이 지정된 규칙에 부합하고 모순이 없는지 확인합니다. 데이터 일관성을 통해 동일한 정보가 서로 다른 레코드에서 균일하게 표현됩니다. instance 제품 카탈로그가 있는 경우 일관된 제품 이름과 설명이 중요합니다. |
적시성 | 이 규칙은 가능한 한 짧은 시간 안에 데이터에 액세스할 수 있도록 하는 것을 목표로 합니다. 데이터가 최신 상태인지 확인합니다. |
고유성 | 이 규칙은 값이 중복되지 않는지 확인합니다. 예를 들어 고객당 하나의 레코드만 있어야 하는 경우 동일한 고객에 대한 여러 레코드가 없습니다. 각 고객, 제품 또는 트랜잭션에는 고유한 식별자가 있어야 합니다. |
데이터 품질 전체 점수 및 차원 점수는 데이터 실무자와 데이터 자산 소유자가 데이터가 얼마나 완전하고 정확하며 일관되며 신뢰할 수 있는지 이해하는 데 도움이 됩니다. 또한 데이터 자산의 품질을 향상시키기 위해 수행해야 하는 개선 작업을 나타냅니다.
팁
필터를 사용하는 경우 이러한 KPI는 선택한 거버넌스 도메인 또는 데이터 제품에 대한 점수를 반영합니다.
차원별 데이터 품질 상태
데이터 품질 차원 점수는 각 거버넌스 도메인에 대해 계산됩니다. 규칙을 사용하여 매핑된 차원 및 점수는 데이터 자산 열에서 데이터 자산, 데이터 자산에서 각 산업 표준 차원에 대한 데이터 제품 및 거버넌스 도메인 수준으로 롤업됩니다. 거버넌스 도메인당 차원 수준 점수를 필터링하여 자세한 내용을 조사할 수 있습니다.
데이터 품질 규칙 통과 및 실패 비율
데이터 품질 규칙의 통과 및 실패 비율은 데이터 제품의 각 DQ 차원에 대해 측정되었습니다. 이 측정값은 데이터 소유자와 데이터 실무자가 데이터 제품의 데이터 비율이 정확하지 않거나, 일관되지 않거나, 불완전하거나, 중복되거나, 예상대로 충분히 신선하지 않은지 이해하는 데 도움이 됩니다. 또한 이 측정값은 적용된 규칙이 올바르지 않거나 데이터가 잘못된지 조사하고 이해하는 데 도움이 됩니다.
데이터 품질 세부 정보 보고서
이 보고서는 데이터 제품, 데이터 자산 및 중요한 데이터 요소에 적용되는 규칙 수를 파악하여 organization 전체 데이터 자산의 품질을 측정하고 모니터링하는 데 도움이 됩니다. 드릴다운하여 규칙 유형에 실패한 데이터 자산의 레코드 수, 더 나은 성능의 규칙 유형, 신뢰할 수 있는 데이터를 게시하고 유지 관리하는 거버넌스 도메인 및 데이터 제품을 확인할 수 있습니다. 거버넌스 도메인 및 데이터 제품별로 측정값을 필터링하여 현재 상태를 이해하고 개선 작업을 계획할 수 있습니다.
참고
- 데이터 품질 상태 보고서에는 데이터 상태 제어 및 Purview 메타데이터 셀프 서비스 분석 모델에 대한 종속성이 있습니다. 고객이 Data Health Controls를 사용하지 않고 Purview 통합 카탈로그 메타데이터를 구독하지 않으면 데이터 품질 상태 보고서가 새로 고쳐지지 않습니다. 고객은 Data Health Controls를 사용해야 하거나 셀프 서비스 분석을 위해 purview 메타데이터를 구독하여 데이터 품질 상태 보고서를 새로 고쳐야 합니다.
- 고객이 데이터 품질 기능을 사용하지 않는 경우 데이터 품질 검사 기능에서 생성되는 데이터를 사용하여 Data Qualty Health 보고서가 만들어지므로 데이터 품질 상태 보고서는 비어 있습니다.