Microsoft Purview 中的數據產品
數據產品是一組數據資產, (數據表、檔案、PBI 報表等 ) ,這是一種封裝的供應專案,可提供資產與要與數據取用者共用的使用案例。
在 Microsoft Purview 中,數據控管不只是確保數據安全且符合規範的方式,也是加速數據商業價值的工具。 將資產中的數據編目可讓您更妥善地管理數據以供正確使用,但也提供數據環境的完整概觀。 現在已有每個可用數據資產的清單,使用者不再需要依賴網路或小組知識來尋找所需的資訊;他們可以自行搜尋目錄。 但是,為每位使用者提供所有可用數據的原始清單是相當龐大的,而且本身並無用。 即使有良好的描述、標記和詞彙,也很難知道您要尋找的內容。 而對於完整的數據視覺效果,您可能需要數個數據資產,而不只是一個。 隨著 整合式目錄 成長,內容必須與它一起成長,讓您的使用者更容易找到並要求存取所需的數據。
為了提供可調整的數據內容和存取管理,Microsoft Purview 引進了數據產品。
什麼是數據產品?
數據產品是一種商務概念,具有名稱、描述、擁有者,最重要的是相關聯的數據資產清單。 數據產品會提供這些資產的內容,並根據數據取用者的使用案例將它們分組。 治理網域可以裝載許多數據產品,但數據產品是由單一 治理網域 所管理,而且可以在許多網域中探索。
成功的數據產品可讓數據取用者輕鬆地使用其日常語言辨識寶貴的數據,同時簡化這些數據資產的擁有權責任。 讓我們來探索看起來的樣子。
可調整的數據內容
例如,數據科學家會建立一組數據資產,供其數據模型取用,而且希望其他人能夠使用相同的數據集。
若沒有數據產品,數據科學家可以使用 整合式目錄 將詞彙新增至所有相關的數據資產。 使用者可能不知道要搜尋哪一個詞彙,因此最好將描述新增至每個數據資產,使其在搜尋類似資訊時更加相關。 但這兩項新增並不保證其他使用者會看到所有相關聯的數據資產。 它們可能會分組在其他不相關的資產中,或遺漏重要數據片段,並花時間重複原始數據科學家已執行的研究。
使用數據產品時,數據科學家可以建立數據產品,列出用來建立其數據模型的所有資產。 描述提供完整的使用案例,以及如何使用數據的範例或建議。 數據科學家現在是數據產品擁有者,他們透過協助他們取得這一個數據產品中所需的一切,改善了數據取用者的搜尋體驗。
可調整的數據控管
數據產品也可簡化數據資產的治理。 使用建立一組數據資產之數據科學家的相同範例:
如果沒有數據產品,如果使用者想要存取數據集的數據資產,則必須個別要求存取每個數據資產。 數據擁有者可能知道這些資產正用於機器學習模型,但如果對其安全性和使用案例的原則進行任何變更,數據擁有者必須個別移至每個資產來進行這些更新。
使用數據產品時,使用者可以找到數據產品,要求存取數據產品,這會在核准之後提供 (存取權,) 所有相關聯的數據資產。 如果針對機器學習的數據集設定更多核准或數據使用原則,數據擁有者只需要將新的原則套用至數據產品,它們就會自動向下推送至資產。
數據產品也會與商務健康情況控制和 OKR相關聯。 這些控制項可讓數據擁有者評估數據健康情況,並排定需要注意之資產的優先順序,並評估哪些數據資產提供商業價值。 這不只支持在資產中完成數據控管的進度,也鼓勵從您的數據開發商業價值。 資產已不再是抽象的,而是系結至小組可專注於的實際使用案例和業務目標。
數據存取原則
數據安全性和存取是成功數據控管的核心租使用者。 但是,若要實作數據控管並成功推動數據使用 (,因此) 價值,數據存取程序必須安全、方便且可針對數據資產的所有案例進行自定義。 某些數據應該廣泛使用且可存取,有些數據必須經過嚴格的核准和監視,以確保正確使用。
每個數據產品都有存取原則,可決定使用者要求存取權的方式、數據的使用規定,以及誰應該核准數據的存取權。 這些存取原則都可自定義以供適當使用,而且未來將會發展成涵蓋更多使用案例。 所有使用者都需要選取數據產品內 的 [要求存取 ],系統會自動引導他們完成程式,以同意使用規定並取得正確合作物件的核准。
如需數據產品存取權的詳細資訊,請參閱在 Microsoft Purview 中管理 整合式目錄 存取原則的文章。