共用方式為


資料管理著陸區

數據管理登陸區域是雲端規模分析的核心管理功能。 該區域負責分析平台的治理。

資料管理登陸區域概觀圖表。

您的資料管理登陸區域是一個獨立的訂閱,具有相同的標準 Azure 登陸區域服務。 它允許透過編目程式對您的數據進行治理,使用爬蟲來連接到數據登陸區中的數據湖和多語儲存。 虛擬網路對等互連將您的資料管理登陸區域與您的資料登陸區域和連線訂閱相連結。

此架構是起點,您可以在規劃數據管理登陸區域實作時修改它,以符合您的特定商務和技術需求。

注意

多語言持續性是一個儲存術語,描述您在不同的數據儲存技術之間選擇,以支援各種數據類型及其儲存需求。 基本上,多語言持續性的概念是應用程式可以使用一種以上的核心資料庫或儲存技術。

重要

您的資料管理登陸區域必須在具有適當治理權的管理群組下,作為獨立訂閱來部署。 然後,您可以控制整個組織的治理。 Azure 登陸區域加速器說明您應該如何處理 Azure 登陸區域。

數據控管

雲端規模分析建議使用 Microsoft Purview。 或者,也可以部署Microsoft合作夥伴解決方案來管理特定數據控管功能。 架構中要考慮的主要功能包括全域數據目錄、主要數據管理、數據共享和合約、API 目錄、數據品質管理,以及數據模型存放庫。

需要在訂閱服務中部署的 Microsoft 合作夥伴數據控管產品,應部署到數據管理著陸區內的數據控管資源群組。

資料目錄

資料目錄將資料資訊集中登錄和維護,並提供給組織使用。 可確保企業避免因不同專案團隊複寫擷取資料而造成的複寫資料產品。 建議您建立資料目錄服務,以定義儲存在數據登陸區域的數據產品元數據。

雲端級分析依賴 Microsoft Purview 來登錄企業資料來源、對資料來源進行分類、確保資料品質,並提供安全的自助式存取。

Microsoft Purview 是以租用戶為基礎的服務,可藉由建立部署至數據登陸區域區域的受控虛擬網路,與每個數據登陸區域通訊。 您可以在任何可用的 Microsoft Purview 區域中的 Microsoft Purview Managed Virtual Networks 內部署 Azure Managed Virtual Network Integration Runtimes (IR)。 從那裡,受控虛擬網路 IR 可以使用私有端點安全地連接和掃描支援的資料來源。 如需更多資訊,請參閱使用含 Microsoft Purview 帳戶的受控虛擬網路。 在受控虛擬網路中建立受控虛擬網路 IR 可確保資料整合程序是隔離且安全的。

使用 Azure Databricks 時,除了 Microsoft Purview 之外,我們建議使用 Azure Databricks Unity 目錄。 Azure Databricks Unity 目錄提供跨 Databricks 工作區的集中式訪問控制、稽核、譜系和數據探索功能。 如需設定 Unity 目錄的最佳做法,請參閱 Unity 目錄最佳做法

注意

雖然本文件主要著重於使用 Microsoft Purview 進行治理,但企業可能已投資其他產品,例如 Alation、Okera 或 Collibra。 這些解決方案是以訂用帳戶為基礎,建議您將它們部署到數據管理登陸區域。 請注意,可能需要一些自訂整合。

主要資料管理

主資料管理控制位於資料管理登陸區域。 資料網格中的主資料管理包含您應該針對資料網格提出的特定注意事項。

許多主資料管理解決方案與 Microsoft Entra ID 完全整合。 此整合可讓您保護資料安全,並為不同的使用者群組提供不同的檢視。

如需更多資訊,請參閱主資料管理系統

資料共用和合約

雲端級分析使用 Microsoft Entra 權利管理Microsoft Purview 原則來控制資料分享的存取。 即使如此,您可能仍需要一個共用與合約存放庫。 此存放庫屬於組織功能,應該位於您的資料管理登陸區域。

您的合約應提供有關資料驗證、模型和安全原則的資訊。

如需詳細資訊,請參閱 資料合約

API 目錄

您的數據應用程式小組會為其數據應用程式建立各種 API。 可能很難在您的組織中發現這些 API。 在您的資料管理登陸區域放置 API 目錄可以解決這個問題。

API 目錄可協助您將文件標準化,並為 API 的內部協作提供場所。 該目錄還可以推動整個組織的消費、發佈和治理控制。

資料品質管理

繼續使用目前的解決方案。

盡可能接近數據源管理數據品質,以防止質量問題分散到分析和 AI 系統。 藉由將品質計量和驗證整合到您的數據程式中,您可以讓品質管理與最熟悉數據的小組一致,以確保更深入地瞭解和更妥善地處理數據資產。

數據譜系除了提高數據品質的信賴度外,您還應為所有數據產品提供此信賴保障。

有關資料品質管理的更多資訊,請參閱資料品質

資料模型存放庫

您應該在您的數據管理著陸區的中央位置擷取並存儲實體關係模型,為數據取用者提供尋找概念圖的單一位置。

許多客戶在導入數據產品之前,會使用 ER StudioOrbusInfinity 對其數據產品建模。

服務層

您的組織可能會決定建立許多自動化服務,以增強雲端級分析功能。 這些自動化服務為您的分析狀態推動符合性和上線解決方案。

如果您決定建立這些自動化服務,您應該有一個使用者介面,同時作為資料市場和操作主控台。 此介面應該依賴基礎元資料存放區,例如 元資料標準

您的資料市場或作業主控台會呼叫微服務的中間層,以促進上線、中繼資料註冊、安全性佈建、資料生命週期和可檢視性。

您可以布建 服務層 資源群組來裝載元數據存放區。

重要

這些自動化服務都不是產品,而且不代表任何路線圖項目。 列出這些服務是為了幫助您考慮可能要自動化的項目。

服務 服務範圍
資料登陸區域佈建 此服務會建立新的資料登陸區域。 這個功能不太可能具有高使用量率,但包含在端到端上線解決方案的完整性中。 如需更多資訊,請參閱佈建雲端級分析
資料產品上線 此服務會建立和修改與已上線租用戶相關的資源群組。 它也包含升級和降級 SKU 的功能,以及啟用和停用任何上線租用戶或服務的資源群組。 此服務建立了新的資料登陸區域 DevOps。 如需更多資訊,請參閱佈建雲端級分析
資料無關擷取 此微服務透過與每個資料著陸區的 Azure Data Factory SQL 資料庫中介儲存溝通,來建立新的資料來源,以便將其引入資料著陸區。 如需更多資訊,請參閱自動化擷取架構如何在 Azure 中支援雲端級分析
中繼資料 此服務會公開並建立平臺的元數據。 如需更多資訊,請參閱中繼資料標準
存取佈建 此服務會使用SPN/UPN建立存取套件、存取原則和資產存取核准程式(手動或自動)。 它也可以公開 API,以提供使用者在過去 90 天內提交的訂用帳戶要求(資產)清單。 如需更多資訊,請參閱資料存取管理
資料生命週期 這項服務負責根據中繼資料維護您的資料生命週期。 此維護可包括將資料移至冷儲存體,以及刪除不再需要保留的記錄。 如需更多資訊,請參閱資料生命週期管理
資料網域上線 僅適用於資料網格。 此服務會擷取與新網域相關的中繼資料,並視需要加入新網域。 也可以建立、更新、啟用及停用您可能建立到微服務中的任何網域或服務項目。 如需更多資訊,請參閱佈建雲端級分析

Azure Container Registry

您的資料管理登陸區域託管 Azure Container Registry。 Azure Container Registry 可讓您的資料平台作業部署標準容器,供資料應用程式團隊使用的資料科學專案使用。

下一步