共用方式為


整合式目錄 開發最佳做法

在本文中,我們會檢閱您可以實作的數據控管策略,以維護狀況良好、有價值、可探索的數據。 如需設定 Microsoft Purview 整合式目錄的技術步驟清單,請參閱開始使用 整合式目錄 指南

  1. 使用商務概念來瞭解您的數據
    1. 建立治理網域
    2. 建立資料產品
    3. 定義詞彙
  2. 解除鎖定商業價值
    1. 讓使用者搜尋和瀏覽您的新網域和產品
    2. 建立 OKR
    3. 符合規範的數據存取
    4. 使用關鍵數據元素建置邏輯數據模型
  3. 增強數據成熟度
    1. 使用以治理為主的動作來改善數據產品
    2. 使用數據品質改善數據的可信度\
    3. 使用主要數據管理建立真實數據產品的來源
    4. 使用數據健康情況控制來測量治理成熟度
    5. 建置領域特定標準

使用商務概念來瞭解您的數據

治理領域、數據產品和詞彙等商務概念會將您的數據與日常商務做法結合在一起。 這不僅可讓您的數據取用者更輕鬆地瞭解其所使用的數據,還可讓您將這些資源的數據控管大眾化。 使用您現有的專家和數據風雲人物,將 整合式目錄 建置到豐富的資源中。

建立治理網域

治理網域可用來散發擁有權和維護工作,讓使用者更容易找到所需的數據。 依控管網域散發資訊可讓用戶達到所需的正確資訊層級,而不需要周游整個數據資產。

建立治理網域或檢閱治理網域結構時,以下是一些要考慮的事項:

  1. 治理領域結構模型
  2. 開發規劃

治理領域結構模型

  • 中央網域 (良好的) - 對小型組織而言,使用單一網域可能很有效率,但可能無法妥善調整,而且容易在成長期間發生瓶頸。
  • 部門型網域 (良好的) - 部門不會一致地做出決策,如果部門定期轉移,您可能需要轉移 整合式目錄 結構。
  • 功能性/治理領域 (更好的) - 為小組授與彈性,並與現有的商務模型一致。 這可能難以大規模管理,而且可能需要許多子網域來強化數據決策者的能力。 它也可以建立數據使用尋址接收器,這是 整合式目錄 治理方法的對立面。
  • 網域混合 (最佳) - 跨主題領域/數據網域、功能性網域、法規網域和專案域的定義域組合,讓您的數據與專家保持一致。 在 整合式目錄 中,您的數據專家是您最強大的資源;他們知道需要套用哪些原則,以及其他人需要知道哪些才能充分利用數據。 此結構也是組織更新最持久的方式,因為它是根據數據在日常的使用方式而非商務結構。

治理網域開發規劃

  1. 當您開始建立治理網域時,請從幾個已具備強式數據管理許可權的小組對齊的網域開始:
    1. 將數據管理者和數據產品擁有者指派給您的控管網域,並讓他們開始開發符合其目前做法的詞彙和數據產品。
    2. 如有需要,請平行掃描數據對應中的數據,以補充您的數據產品。
    3. 讓治理網域保持 草稿 狀態,直到開發好一些數據產品並準備好供使用者使用為止。
  2. 發佈您的治理網域,並將 整合式目錄 讀取者許可權指派給您的第一個使用者,讓他們開始探索。
  3. 透過第一批使用者的意見反應,逐一查看現有的數據產品,或展開至下一個數據產品或治理網域。
  4. 從一些大部分具有數據產品完整涵蓋範圍的治理網域開始,可確保數據取用者 整合式目錄 具有所需的內容,而且可以繼續返回。

提示

不建議將治理網域與平臺網域對齊。 IT 通常會與技術結構或服務/應用程式一致,且與商務小組使用數據的方式不一致。 數據對應中的平臺網域可能會與這些技術小組對齊,而不是您的商務小組。 治理網域的目標是要讓商務使用者與最有用的資訊一致。 專注於數據使用,而不是數據結構,以開發您的治理網域。

建立資料產品

現今儲存的大部分數據幾乎都不具已知價值,而且需要花費時間和手動來評估和了解數據,才能移除或改善。 將焦點放在具有已知價值和使用方式的數據,可讓更多小組建立一致的價值,並顯示擁有充分瞭解和高度使用數據的優點。 這可推動數據控管實務的進一步採用,並隨著每個數據資產的價值變得更清楚,更輕鬆地清除數據資產。

將焦點放在您組織中已存在的數據資源。 將這些專案新增為 整合式目錄 中的數據產品,可讓您的使用者更輕鬆地探索它們。 它也會讓存取更具延展性,並透過譜系、數據質量和責任提升可信度。 現有資料資源的一些範例包括:

  1. 金級區域數據湖、高度策劃的 SQL 存放區、策劃的數據倉儲/數據湖倉儲,小組可用來支援其日常做法。
  2. 用來做出決策的報表。
  3. 報表環境中使用的數據表。
  4. 主要和參考數據。

數據產品開發規劃

  1. 當數據源新增至 Microsoft Purview 資料對應 時,規劃數據產品應該成為您的取用程式的一部分。 數據產品擁有者應該知道哪些數據存放區正在註冊和掃描,哪些數據存放區已準備好要新增至 整合式目錄。
  2. 從已掃描到數據對應的核心數據資產建置您的第一個數據產品。
  3. 當您的使用者準備好使用該網域的數據時,請發佈您的第一個數據產品。

定義詞彙

當您建置字詞時,請從您已經知道的內容開始,並繼續從數據中建置價值,以顯示最具影響力的工作。 以下是建立和管理詞彙以建立最大價值時可遵循的一些秘訣。

  1. 將數據提供給最熱衷的使用者,示範能夠持續成長的價值,並提供更多治理的優先順序。
  2. 許多商務小組已經有一個詞彙,可協助新員工將自己導向企業。 請使用這些作為您的第一個詞彙候選專案,以描述治理網域及其數據。
  3. 如果您不確定字詞是否代表另一個概念, (如實體或商務程式) 新增字詞是很好的開始位置,因此會收集最基本的元數據。 如有需要,第一個字詞可以過期,而且可以使用新的概念來收集更多元數據,並推動預期的端對端體驗。
  4. 新增詞彙之後,將這些詞彙連結至數據產品將會改善數據產品的可探索性,並增強取用者對數據的知識。
  5. 定期檢查對應至字詞的數據產品,讓數據管理人更瞭解其在數據資產中的使用方式。
  6. 字詞定義一律可以改善和編輯。 等候發佈字詞直到其完全一致,將會延遲小組使用該字詞,並防止新價值建立或擴大可能的改善。

詞彙開發規劃

  1. 數據負責人應該瞭解治理網域的架構,然後開始新增已知詞彙並開始開發新的詞彙。
  2. 應開發詞彙定義,並包含重要的資訊,讓取用者瞭解其內容和使用方式。
  3. 第一組條款和數據產品應該一起發佈,讓取用者開始其數據使用案例,並在目錄中探索數據。
  4. 建置語意知識永遠不會停止,因此請規劃如何讓小組在整個治理生命週期中繼續貢獻詞彙。

解除鎖定商業價值

既然您的基本 整合式目錄 結構已就緒,現在就可以開始解除鎖定數據的價值,方法是讓使用者可以存取數據,並直接將其與您的商務目標系結。 從數據建立價值來自於使用該數據,但使用數據表示公司中的每個人都需要在正確的時間和正確的格式尋找正確的數據,以提供所需的深入解析或功能。 數據取用者是從數據產生新商業價值的關鍵。

讓用戶搜尋和流覽治理網域和數據產品

您已花時間建置治理網域和數據產品,因此請讓您的數據取用者能夠使用它們,並查看其運作方式。 商務使用者可能正在尋找策略性報告,這些報告已經可供他們以及時且明智的方式做出商務決策所需的深入解析。

以下說明如何策略性地將存取權授與使用者:

  • 請勿從將 整合式目錄的存取權授與公司中的每個人開始。 先啟用需要您目錄中數據的小組。 如果您的數據產品無法以數據科學家所需的格式提供,或數據不在商務使用者預先定義的報表中,他們將失去對您目錄的信任。 讓正確的角色能夠先使用目錄來建置成功路徑。
  • 請先從需要您目錄中數據的小組開始。 您為誰建置資料產品? 哪些小組協助開發您的詞彙? 這些是不錯的初始候選專案。
  • 請從分析人員和數據專家開始,這些專家可以告訴您目錄中存在間距的位置。 其可協助指向可參與 整合式目錄的專家和企業擁有者。 經過一段時間后,整合式目錄的完整性就足以讓公司中的每個人都能夠找到大部分的數據需求。

建立 OKR

藉由建置目標和關鍵結果,並將其系結至有助於推動或測量該價值的數據產品,來示範數據的商業價值。 確保商務領導者瞭解其數據的價值,以及治理的重要性,將推動小組如何建置、維護及控管其數據以建立深入解析的優先順序和新整合。

建置目標可讓您立即辨識數據對使用者及其推動之業務的重要性。 這可大幅增強對特定數據在商務程式中所扮演角色或達成其目標能力的瞭解。

  1. 請考慮OKR來改善程式、質量問題、主要策略目標,以及您可使用資料測量的其他任何專案,以示範商業價值和變更。
  2. 請務必為每個目標建立關鍵結果,以顯示如何測量和評估目標,並建立責任以符合該目標。
  3. 有一些複雜的目標需要許多關鍵結果才能完成。 關鍵結果可能會獨立於測量可以顯示需要優先順序或協助回到追蹤區域的其他重要結果之外。

符合規範的數據存取

提供數據存取權可能會對您的公司帶來風險。 遵循已知的標準和原則對於確保適當授與存取權,以及負責使用數據至關重要。 在探索或使用數據時,整合式目錄 中的使用者可以完成數據存取表單。 將此表單和程式保留為目錄的一部分,可讓高變數和技術數據資產的存取、安全、快速且一致。 以下是您可以在目錄中成功設定存取權的一些方式:

  • 請確定數據產品上已備妥適當的核准者,並了解數據產品的處理需求。
  • 某些數據產品可能會有數百或數千個存取要求,因此可能需要分散式時區中的小組,以確保及時進行存取核准和布建。
  • 準備群組或備份核准者,以防有假期或非計劃性休假。
  • 治理網域擁有者應該定期檢查存取要求摘要,以驗證預期,並查看監視存取要求程式的控件變更是否正在推動所需的響應時間。

使用重要數據元素建置邏輯數據模型

改善數據實體和元素的深入技術理解和期望,將包含新的控件,以判斷數據是否符合這些期望。 建立數據的字典和邏輯模型可提供數據的結構和深層商務期望,以確保數據符合其用途。 藉由將這項知識併入 整合式目錄 小組將立即了解數據的結構和原因,以及實體數據資產中實際可用的專案有何差異。

  • 將焦點放在對您的網域而言最重要的數據元素。 重要數據元素會顯示數據對您業務具有的深度專業知識和重要性。
  • 請勿 將焦點放在整個網域中元素的完整性。 並非每個數據行都需要此層級的控制,而且許多數據元素可能對用戶來說都是一目了然的。
  • 評估不同小組的重要數據元素,可確保商務小組對於其數據有共同的瞭解,以及一個小組所建立的內容如何影響業務的其他許多領域。
  • 將存取原則與重要數據元素對齊,可確保整個數據資產中的重要數據都具備適當的訪問控制。
  • 建置重要數據元素的數據質量規則,可確保數據無論使用何處或使用方式,都符合預期。

增強數據成熟度

改善您的數據資產和治理,以填滿缺口並移除建立價值的瓶頸:

  • 監視您的健康情況動作,以累加方式改善整個 整合式目錄 的治理。
  • 針對數據的新用途進行優化,並藉由改善數據品質來消除數據問題。
  • 使用主要數據管理,為單一事實來源建立最佳的類別數據產品。
  • 評估您的數據健康情況,並排定最大價值影響的優先順序。

深入投資執行您公司的核心數據,可確保此數據可在整個企業中使用,一致地消除數據問題,並提供穩定的深入解析建立基礎。 擁有數據問題的辨識項有助於確保數據控管的可採取動作性,但它會推動改善功能,以立即解除鎖定新價值,而不會投資價值較低的數據區域,但尚未完全瞭解。 持續改善數據成熟度可協助小組彼此共享學習,並在變更發生時顯示改善證明。

使用以治理為主的動作來改善數據產品

在數據中建立信任需要持續改進和支援。 雖然取用者需要一些時間來尋找和套用數據,但要注意問題或支援需求,還是可以根據最佳做法事先採取簡單的動作。 健康情況管理中的健全狀況動作會提供這些適用於 整合式目錄 的實用動作完整清單,以協助您專注在改善治理的下一步。 以下是使用健康情況動作取得最大價值的一些最佳做法:

  • 檢查數據產品仍處於草稿狀態時的動作。 這可確保當您發佈時,會涵蓋基本概念,並讓取用者放心地發佈此數據。
  • 並非所有動作都必須同時採取。 當您深入了解數據,或與負責人合作以建立更清楚的功能時,某些動作可能需要一些時間才能解決。 請持續檢查動作,以查看已準備好進行新改善的位置。
  • 如果動作開始變得難以控制、不必要或像是低價值雜訊,請考慮變更您的健康情況控制。 優化任何人員所採取的動作數目,可確保將正確的治理層級套用至數據。

使用數據品質改善數據的可信度

數據品質通常是一次性專案,無法修正數據中的特定問題。 這些改善,但不會持續進行。 良好的數據品質需要持續評估和改進,以確保問題不會傳回或未建立新問題。

  • 定義數據品質期望的基準之後,建立及時補救問題的方案對於讓商務運作符合數據以供使用至關重要。
  • 將您的數據質量掃描排程為定期執行,有助於確保取用者持續改善數據並受到高度支援。
  • 設定重要規則和分數變更的警示,可讓數據提供者在取用者發現或遇到問題之前更正問題。 警示也可用來在取用者發現問題之前,或根據品質不佳的數據做出決策,以透明方式與取用者分享問題。

使用主要數據管理建立真實數據產品的來源

某些數據對幾乎所有程式和整個企業來說都非常重要,因此它能夠獲得卓越的管理和治理層級。 這些數據實體通常是跨領域實體,例如客戶清單或員工配置檔,而且在許多商務程式中都需要深入的商務專業知識和經驗。 某些數據具有高可用性但規模低,而且仍然受益於更深入的控制和管理層級;例如國家/地區、貨幣或產業區段的參考數據屬性。 這些數據類型都受益於主要數據管理解決方案,以建置適合整個企業使用的真實來源。

  • 練習具有數據品質的主要數據管理,對於確保此重要數據是乾淨且一致的非常重要。
  • 此層級的數據管理是高度投入心力,因此請選擇寶貴的數據元素或高風險的數據元素,以確保您的工作會產生高價值。
  • 建立重要數據元素和主控數據的數據產品。 這些夥伴物件有助於提升您在 整合式目錄 中的主要數據,並增加其使用和瞭解。
  • 為主要數據建置新的健康情況控制,以持續大規模評估其使用量,並防止新的未主控數據獲得使用,並在快速演進的數據資產中造成混淆。

使用數據健康情況控制來測量治理成熟度

需要評估整個企業大規模的數據控管成熟度,以確保治理有效並建立商業價值。 藉由套用控件的內建度量,健康情況管理可讓中央數據辦公室或個別治理網域查看還有更多任務作。 大規模收集此辨識項可快速提高影響業務的最重要數據問題,其中一個問題可能會影響許多業務領域。 此辨識項有助於解決進行數據管理變更的優先順序問題,並快速示範適當治理層級的價值。

  1. 建立業務節奏以檢閱健康情況管理做法:
    1. 請與治理領域領導者和中央數據辦公室進行每月檢閱,以討論新治理或技術解決方案的優先順序和需求。
    2. 讓小組能夠深入瞭解其健康情況管理報告,以確保他們能做出最佳決策,以建立其業務中所需的價值。
    3. 將健康情況管理從 SLT 帶入企業的所有層級給個別的監管人,以確保治理的層級正確且一致可採取動作。
    4. 如果數據有較大的問題需要跨企業共同作業或更深入的治理,請考慮建立新的治理網域,並定義推動該數據控管的擁有權。
  2. 請勿預期所有治理網域都具有相同層級的成熟度,或專注於治理的相同層面:
    1. 在正確的層級啟用控管,可讓企業擁有者針對如何處理其數據做出最有價值的決策。
    2. 並非所有企業都有相同的數據需求,而強制更深入的治理層級,可能無法在焦點位於其他位置時建立商業價值。
    3. 某些數據在數據資產中較不具價值或新興,而且該值尚無法完全得知。 讓小組能夠快速移動並適應其需求,他們可以利用數據的價值來使治理成熟。
  3. 一致地評估健康情況管理,以尋找可能表示需要注意之大型問題或新學習的大型變更。
  4. 共用您的健康情況管理分數。 共用可以將小組整合在一起,以瞭解其適用的專案,或如何尋找新的控件,以在網域內建立新價值。 查看「良好」的健康情況可能會鼓勵其他小組進行改善,並確保他們也會為其取用者提供寶貴的數據。

建置領域特定標準

確保數據控管的大小正確,以達到所需的價值和控制層級,最適合由數據的企業擁有者處理。 這些商務小組已經有數據的相依性,且處於定義其期望的最佳位置,而且需要確保數據有價值。

  • 讓治理網域能夠為其數據建立新的控件,而不論數據的使用位置為何。
  • 請勿預期所有治理網域都需要相同層級的控件,或採用所有控件。 根據設計,限制為用於單一業務部分的數據,可能無法從高層級的控制中獲益。 對沒有適當值的數據建立更多控制權,可能會讓小組無法收集或保留未充分利用的數據。
  • 使用正確的控制層級來協助排定可從治理網域移除低價值數據的優先順序,以消除風險並增加數據資產的價值。