在數據網格中管理主要數據
使用數據網格架構的企業通常會有大量的網域,每個網域都包含唯一的系統和數據。
這種廣泛的數據分佈會增加複雜度,因為此設定中可能有多個相同數據版本。 整合需要更多努力,因為擁有者必須整合和協調來自多個網域之相同數據的所有不同部分。 這些不同網域之間的數據可能會不一致,而數據品質也可能有所不同。 套用 主要數據管理 (MDM) 來解決這些挑戰。
網域導向的主數據管理
主識別號碼是您 MDM 的重要組成部分。 這些數據會連結主數據和您網域中的其他數據。 對於追蹤已掌握的數據,以及哪些數據屬於一起的能力至關重要。 您只能識別唯一的數據,並集中指派主要標識符,而不是在系統內的本地指派。 您從不同系統來的主數據必須在 MDM 解決方案中集中管理。
MDM 在網域導向架構中的運作方式不同,因為其分散式本質。 因為您依賴網域內的 MDM,因此難以達到一致性。
達成一致性的其中一種方法是要求網域在散發
您也可以在將 MDM 活動分組並使用主要資料存放區作為集中式存放庫時,建立新的 MDM 網域。 每個新的 MDM 網域都應該包含特定數據對象,以識別和控制您的主數據為中心。 此數據的一些已知範例包括客戶、產品、員工、地理位置,以及財務和風險資訊。 來自這些主數據管理(MDM)領域的精選數據必須回流到其他領域。 此數據分布類似於您的數據產品的分布。
您可以界定主數據管理,並允許數據產品分佈的不同方法。 在特定範圍的界限內,數據產品不需要符合企業主要數據,但超出範圍界限,數據產品必須符合。 您也可以反向套用此模式,而需要只在特定範圍內遵守主要數據,而不是在外部。 在這些設定中,您的主控數據會在 MDM 解決方案內集中管理。 您的領域需要交換主數據,以便知道本地數據應對應至中央主數據。 識別並維護這些關聯性,讓您知道哪些數據已掌握,以及哪些數據可以快速連結在一起。 如果操作系統中的本機網域密鑰變更,主要標識碼是唯一系結所有項目的專案。
當您散發主要標識碼時,請勿將 MDM 主要識別碼推斷到所有來源系統。 這樣做可能會導致一致性問題。 只有受 MDM 約束的應用程式或系統才能從 MDM 中樞取得主要識別碼。 不受 MDM 管理的系統應該使用其自身的本地(域)完整性。
網域層級主要數據管理
當您尋找重疊的數據時,您可能會發現不同程度的重疊。 某些數據是泛型的,而且跨越許多網域。 其他數據有有限的重疊,而且只跨越幾個網域。 藉由將 MDM 擴充至網域層級 MDM 來區分數據重疊及其重要性。 您可以在特定範圍內建立主數據的部分檢視來實現此操作。 當您的數據在一些網域之間共用,但並非全部時,這非常有用。
重疊領域應該管理數據,但不應存在中央依賴性。 MDM 解決方案可協助您達成此目的。 您可以透過將基礎設施抽象化,並將 MDM 以服務的形式提供給您的網域,來大幅簡化使用方式。 如果您使用中央解決方案,請針對每個個別網域或範圍套用隔離檢視。
使用可重複使用的元件達到一致性
程式代碼共享是確保主要數據共同作業和重複使用的另一種方式。 您不需要共用主要數據,而是共用基礎程式代碼(代碼段和腳本),以產生輸出並提升有效重複使用。 將此基礎程式碼儲存在具有版本控制的中央公開存放庫中。 您的小組都可以參與並改善存在於此存放庫中的程序代碼。
在此模型中,您只能在網域內套用商業規則。 您的小組可以偏離、進行改進,或使用稍微優化的邏輯版本,因為它們認為適合。 您可以重新產生結果,因為來自社群的改進會加入您的中央程式碼儲存庫。
請注意,讓您的小組修改其程式代碼可能會讓各種小組之間的比較結果更加困難,這可能會影響一致性。
主要數據管理摘要
使用者只有在使用的數據一致且正確時,才能做出正確的決策。 藉由使用 MDM,您可以確保數據在企業層級的一致性和品質。
您的組織必須找到 MDM 的正確平衡。 擁有太多主數據或參考值區域會導致過多的跨域協調。 完全沒有企業數據,就不可能比較任何結果。 以平衡的方式開始使用 MDM 的實用方式是實作存放庫。 這是管理組織主要數據的最簡單方式。 使用存放庫時,您不需要調整網域系統,即可瞭解哪些數據品質低或需要對齊。 透過可協助您取得該資訊的存放庫,您可以更快速地傳遞價值。
實作存放庫之後,您必須概述清楚的範圍。 不要因為選擇所有數據而落入企業數據統一的陷阱。 僅管控您最重要欄位的數據。 首先,選取可新增最多值的主體,例如客戶、合約、產品和組織單位。 您的屬性數目應該在數十個,而不是數百或數千個。
在您與各領域達成協議之後,請調整您的過程與治理結構。 將任何關於時程和審查的協議明確傳達給所有相關領域。 此外,請確定您改進元數據。 為您的主要數據編錄目錄。 請確保您的網域了解哪些資料元素是來自來源系統的候選元素,以及這些元素如何通過您的資料管道。
最後一個步驟和您的最終目標是實現共存。 您的改進應該會直接回饋到您的領域。 這是程式中最困難的部分,因為它需要您進行許多架構變更。 您的網域必須能夠處理從集中管理的 MDM 解決方案傳送的更正和改進。