Microsoft Purview 中的數據質量報告
數據品質 (DQ) 報表是一份完整的檔,可評估和摘要組織或系統內的數據品質。 它通常包含各種數據品質維度的評估,以及可協助專案關係人瞭解其數據正確性、完整性、一致性、可靠性和時效性的計量。 此數據質量報告可讓您的小組一目了然地追蹤健康情況管理進度,並找出需要更多工作才能改善數據資產中數據質量的區域。
本文涵蓋如何存取此報告,以及所提供的數據品質量值對健康情況管理的意義。
此數據品質報表的目的
監視和控管:持續監視和管理數據品質,確保數據符合組織的標準和法規需求。
決策支援:為項目關係人提供可靠的數據,以做出明智的商務決策。
識別問題:偵測並記錄數據質量問題,以便及時補救。
改善 資料管理:藉由識別數據質量問題的根本原因並實作矯正措施來增強數據管理實務。
效能測量:測量數據質量計劃的有效性,並追蹤一段時間的改善。
專案關係人通訊:與專案關係人溝通數據質量狀態和進度,包括管理、數據產品擁有者、數據管理者和IT小組。 藉由提供清楚且完整的數據品質狀態檢視,這些報表在維護組織內數據的完整性和實用性方面扮演著重要的角色。
必要條件
- 您需要 數據健康情況讀取器 許可權,才能檢視數據資產健康情況資訊。
檢視數據控管健康情況報告
- 開啟 Microsoft Purview 入口網站,然後選取 [整合式目錄]。
- 選取 [ 健康情況管理 ] 下拉式清單。
- 選取 [報告]
- 選取 [數據健康情況 報告]。
數據品質維度報告
在這份報告中,概觀頁面涵蓋數據品質維度分數、數據品質規則階層、依維度的數據質量狀態,以及數據品質維度 & 用於不同數據資產的規則類型。 最上層控件可協助您一目了然地了解整體健康情況管理。
使用篩選條件來查看特定狀態下特定治理網域、數據產品或數據產品的資訊 (例如:草稿) 。
數據質量維度 | 描述 |
---|---|
正確性 | 數據應該正確地代表真實世界的實體。 內容很重要! 例如,如果您要儲存客戶位址,請確定其符合實際位置。 |
完整性 | 此規則的目標是要識別空白、Null 或遺漏的數據。 此規則會驗證所有值都存在 (但不一定正確) 。 |
整合 | 此規則可確保數據遵循數據格式化標準,例如日期、地址和允許值的表示法。 |
一致性 | 此規則會檢查相同記錄的不同值是否與指定的規則一致,而且沒有任何異常。 數據一致性可確保相同的資訊會在不同的記錄之間以一致的方式表示。 例如,如果您有產品目錄,一致的產品名稱和描述就很重要。 |
及時 | 此規則旨在確保數據能在最短的時間記憶體取。 它可確保數據是最新的。 |
唯一性 | 此規則會檢查值不會重複,例如,如果每個客戶只能有一筆記錄,則同一個客戶沒有多個記錄。 每個客戶、產品或交易都應該有唯一標識碼。 |
數據質量整體分數和維度分數可協助數據從業人員和數據資產擁有者瞭解其數據的完整性、精確性、一致性和可信任性。 它也指出需要採取哪些改進動作,以增強其數據資產的品質。
提示
如果您使用篩選條件,這些 KPI 會反映所選控管網域或數據產品的分數。
依維度的數據質量狀態
數據品質維度分數會針對每個治理網域計算。 與規則對應的維度,以及從數據資產數據行到數據資產,以及從數據資產到數據產品,以及每個產業標準維度治理領域層級的分數匯總。 您可以篩選出每個治理網域的維度層級分數,以調查更多詳細數據。
數據質量規則通過和失敗率
已針對數據產品的每個 DQ 維度測量數據品質規則的傳遞和失敗率。 此量值可協助數據擁有者和數據從業人員了解數據產品中的數據百分比不正確、不一致、不完整、重複,或不夠如預期般更新。 此量值也有助於調查及瞭解套用的規則是否不正確或數據不正確。
數據品質詳細數據報告
此報表可協助您瞭解套用至數據產品、數據資產和重要數據元素的規則數目,以測量和監視整個組織數據資產的品質。 您可以向下切入以查看規則類型的數據資產有多少筆記錄失敗、哪一種規則類型執行得更好,以及哪些治理網域和數據產品正在發佈和維護值得信任的數據。 您可以依控管網域和數據產品篩選量值,以瞭解目前的狀態並規劃改進動作。
注意事項
- 數據品質健康情況報告相依於數據健康情況控制項和 Purview 元數據自助式分析模型。 如果客戶未使用數據健康情況控制,且未訂閱 Purview 整合式目錄 元數據,則不會重新整理數據品質健康情況報告。 客戶需要使用數據健康情況控制,或需要訂閱 purview 元數據以進行自助式分析,以重新整理數據品質健康情況報告。
- 如果客戶未使用資料品質功能,數據品質健康狀態報告會顯示空白,因為數據品質健康狀態報告是使用從數據品質掃描功能產生的數據所建立。