次の方法で共有


セルフサービス分析と分析情報 (プレビュー)

セルフサービス分析と分析情報は、ビジネス ユーザーがデータに個別にアクセスし、分析し、データから分析情報を生成できるようにするデータ、ツール、プラットフォームを指します。 Microsoft Purview データ ガバナンス アプリケーションは、メタデータのドメイン モデルを Fabric OneLake と AdlsG2 (Azure Data Lake Storage) に公開し、お客様が独自のツールとコンピューティングを持ち込むことで分析情報を分析および生成できるようにします。 データ ガバナンス メタデータのセルフサービス分析は、データ資産の分析情報と正常性管理へのアクセスを民主化することで、顧客のデータ資産の正常性管理を継続的に改善し、organization全体でデータドリブン カルチャを促進する上で役立ちます。

主要なコンポーネント

  • データ モデル: ドメインとディメンションの詳細を含む 3NF モデル
  • メタデータ: 次を含むデータ ガバナンス メタデータ:
    • ガバナンス ドメイン
    • データ製品
    • データ資産
    • 用語集の用語
    • サブスクリプション要求
    • データ品質ルール
    • 寸法
    • データ品質の事実 (合格と失敗のカウント)

利点

  • エンパワーメント: データ実践者、データ製品所有者、データ スチュワード、アナリストがデータ ガバナンス メタデータを探索し、さまざまなソースからメタデータをリンクして分析情報を導き出す権限を与えます。
  • 柔軟性と効率性: お客様は、正常性管理ですぐに使用できるレポートに加えて、カスタム レポートを作成できます。
  • 敏捷: お客様の組織が、正常性管理の問題と修復に迅速に対応できるようにします。
  • 費用 対 効果: プラットフォームとビルド ツールを設定する必要性を減らします。 すべてのデータは OneLake で使用でき、お客様は OneLake で使用可能なツール (Fabric セマンティック モデル、PBI レポート、データ フロー、ノートブック) を使用できます。

現在使用可能なレポート (すぐに使用できる)

すぐに利用できるレポートを次に示します。 これらのレポートはカスタマイズできません。

purview メタデータ分析情報を示すスクリーンショット。

セルフサービス分析メタデータのデータ モデル

3NF ドメイン モデルは、リレーショナル データベース設計の正規化プロセスの一部であり、データベースに冗長性と更新の異常がないことを保証します。 データベース スキーマは、第 1 標準および第 2 標準Formsの要件を満たし、その属性がすべて主キーにのみ機能的に依存している場合、3 番目の標準形式になります。 3NF ドメイン モデルの目的は、重複を最小限に抑え、データの整合性を確保する方法でデータを構造化するために使用されます。 ここでは、各情報が 1 回だけ格納される、より小さな関連テーブルにデータを分割することに重点を置いています。

特性:

  • 推移的な依存関係の削除: キー以外の属性は、他のキー以外の属性に依存しないでください。
  • 論理グループ化: データは、その機能または意味に基づいてドメインに論理的にグループ化されます。
  • Entity-Relationship ダイアグラム (ERD): エンティティの相互関係を示す 3NF ドメイン モデルを表すために一般的に使用されます。
テーブル名 説明 リレーションシップ キー
アクセス ポリシーのプロビジョニング状態 プロビジョニング状態に関する情報は、この表に格納されます。 ProvisioningStateId
アクセス ポリシー リソースの種類 アクセス porlich リソース情報は、このテーブルに格納されます。 ResourceTypeId
アクセス ポリシー セット この表には、アクセス ポリシー、ポリシーユース ケースの詳細、ポリシーが適用された場所などに関する全体的な情報が格納されます。 AccessPolicySetId (UniqueId)、ResourceTypeId (FK)、ProvisioningStateId (FK)
ビジネス ドメイン ビジネス ドメイン名、説明、状態、所有権の詳細は、ビジネス ドメイン テーブルに発行されます ユーザー ID (FK) によって作成された親ビジネス ドメイン ID (FK)、ユーザー ID によって最後に変更された (FK)
分類 データ資産分類情報は、この表に格納されます。 ClassificationId
カスタム アクセスユース ケース アクセス ユース ケース情報は、この表に格納されます。 AccessPolicySetId
データ資産 データ資産の名前、説明、およびソース情報は、この表に格納されます。 DataAssetId (UniqueId)、DataAssetTypeId (FK)、CreatedByUserId (FK)、LastModifiedByUserId (FK)
データ資産列 データ資産の列名、列の説明、および参照は、このテーブルに格納されます。 DataAssetId (FK)、ColumnId (Unique)、DataAssetTypeId (FK)、DataTypeId (FK)、作成されたユーザー ID (FK)、最終変更ユーザー ID (FK)
データ資産列分類の割り当て データ分類割り当て関連の参照キーは、この表に格納されます。 DataAssetId (FK)、ColumnId (FK)、ClassificationId (FK)
データ資産ドメインの割り当て データ資産ガバナンス ドメインの割り当てに関連する情報については、この表を参照してください。 DataAssetId (FK)、BusinessDomainId (FK)、AssignedByUserId (FK)
データ資産所有者 この表に格納されているデータ資産所有者情報。 DataAssetOwnerId
データ資産所有者の割り当て データ資産所有者の割り当て情報は、このテーブルに格納されます。 DataAssetId、DataAssetOwnerId
データ資産の種類 データ型 データ資産の種類の情報は、このテーブルに格納されます。 DataTypeId (UniqueId)、DataAssetTypeId (FK)
Data Product この表に格納されているデータ製品名、説明、ユース ケース、状態、その他の関連情報。 DataProductId (UniqueId)、DataProductTypeId (FK)、DataProductStatusId (FK)、UpdateFrequencyId (FK)、CreatedByUserId (FK)、LastUpdatedByUserId (FK)
データ製品資産の割り当て データ製品とデータ資産の割り当て情報は、この表に格納されます。 DataProductId、DataAssetId
Data Product Business Domain Assignment データ製品とガバナンス ドメインの割り当て情報は、この表に格納されます。 DataProductId (FK)、BusinessDomainId (FK)、AssignedByUserId (FK)
Data Product のドキュメント データ製品ドキュメントのリファレンス情報は、この表に格納されます。 DataProductId、DocumentationId
データ製品の所有者 この表には、データ製品所有者情報が格納されます。 DataProductId、DataProductOwnerId
データ製品の状態 この表に格納されているデータ製品の状態 (公開済みまたは下書きなど) 関連情報。 DataProductStatusId
データ製品の使用条件 データ製品の使用条件情報は、この表に格納されます。 DataProductId、TermOfUsedId、DataAssetId
データ製品の種類 データ製品の種類 (マスター、参照、運用など) に関する情報は、次の表に格納されます。 DataProductTypeId
データ製品の更新頻度 このデータ製品のデータが更新される頻度に関する情報は、この表に格納されます。 UpdateFrequencyId
データ品質資産ルールの実行 この表に格納されているデータ品質スキャンの結果 RuleId (FK)、DataAssetId (FK)、JobExecutionId (FK)
データ品質ジョブの実行 データ品質ジョブの実行状態は、このテーブルに格納されます。 JobExecutionId (UniqueId)
データ品質ルール データ品質ルールに関する情報は、この表に格納されます。 RuleId (UniqueId)、RuleTypeId (FK)、BusinessDomainId (FK)、DataProductId (FK)、DataAssetId (FK)、JobTypeDisplayName (FK)、RuleOriginDisplayName (FK)、RuleTargetObjectType (FK)、CreatedByUserId (FK)、LastUpdatedByUserId (FK)
データ品質ルール列の実行 データ品質ルールの合格と失敗数、列レベルのデータ品質スコア、およびデータ品質ジョブの実行の詳細に関する情報は、この表に格納されます。 RuleId (FK)、DataAssetId (FK)、ColumnId (FK)、JobExecutionId (FK)
データ品質規則の種類 このテーブルには、データ品質ルールの種類と関連するディメンションが格納されます。 RuleTypeId (UniqueId)、DimensionDisplayName (FK)
データ サブスクリプション要求 データ サブスクライバー、適用されたポリシー、サブスクリプション要求の状態、およびこのテーブルに格納されているその他の関連情報に関する情報。 SubscriberRequestId (UniqueId)、SubscriberIdentityTypeDisplayName (FK)、RequestorIdentityTypeDisplayName (FK)、RequestorStatusDisplayName (FK)
用語集の用語 用語集の用語、説明、用語集用語の全体的な状態に関する情報は、この表に格納されます。 GlossaryTermId (UniqueId)、ParentGlossaryTermId (FK)、CreatedByUserId (FK)、LastModifiedByUserId (FK)
用語集用語ビジネス ドメインの割り当て 用語集の用語ガバナンス ドメインの割り当てと状態に関する情報は、この表に格納されます。 GlossaryTermId (FK)、BusinessDomainId (FK)、AssignedByUserId (FK)、GlossaryTermStatusId (FK)、CreatedByUserId (FK)、LastUpdatedByUserId (FK)
用語集用語データ製品の割り当て 用語集の用語データ製品の割り当てに関する情報は、この表に格納されます。 GlossaryTermId (FK)、DataProductId (FK)、AssignedByUserId (FK)、GlossaryTermStatusId (FK)、CreatedByUserId (FK)、LastUpdatedByUserId (FK)
ポリシー セット承認者 ポリシー セットと承認者の情報は、このテーブルに格納されます。 SubscriberRequestId (FK)、AccessPolicySetId (FK)、ApproverUserId (FK)
リレーションシップ ソースの種類とターゲット情報に関する情報は、この表に格納されます。 AccountId、SourceId、TargetId

Microsoft Purview カタログ メタデータを Fabric OneLake にサブスクライブする

分析のために Microsoft Purview のデータ ガバナンス メタデータをサブスクライブし、次の手順に従って分析情報を導き出すことができます。

  1. 左側のウィンドウで [設定] を選択し、[統合カタログ] を選択し、[ソリューション統合] を選択します。

    サブスクリプション ページを移動する方法を示すスクリーンショット。

  2. [編集] を選択します。

  3. ストレージの種類を追加し、セットアップを有効にします

  4. 場所 URL の追加 (例: https://onelake.dfs.fabric.microsoft.com/workspace name/lakehouse name/Files/purviewmetadata)

    • [ プロパティ] を選択して URL をコピーします。

ファブリック URL 1 を構成する方法を示すスクリーンショット。

  • [プロパティ] ページから URL をコピーします。

ファブリック URL 2 を構成する方法を示すスクリーンショット。

  1. URL の末尾にフォルダー名を追加する - 例: /DEH (スクリーンショットを参照)

  2. Microsoft Purview Manage Service Identity (MSI) への共同作成者アクセスをファブリック ワークスペースに付与します。

  3. 接続をテストします。

    サブスクリプション接続を構成する方法を示すスクリーンショット。

  4. [ 保存] を 選択して構成を保存し、Purview メタデータを OneLake ワークスペースに発行します。

OneLake でセマンティック モデルを作成する

データと分析のコンテキストにおけるセマンティック モデルは、特定のドメイン内の意味、リレーションシップ、ルールを定義するデータの構造化表現を指します。 これは、特にビジネス インテリジェンス (BI) と分析プラットフォームのコンテキストで、複雑なデータをより直感的でアクセスしやすくすることで、ユーザーが複雑なデータを理解して操作するのに役立つ抽象化レイヤーを提供します。 セマンティック モデルは、レポートを構築する前に常に必要です。 ウェアハウス内では、ユーザーはウェアハウス オブジェクト (テーブルまたはビュー) を既定の Power BI セマンティック モデルに追加できます。 また、階層や説明など、他のセマンティック モデリング プロパティを追加することもできます。 これらのプロパティは、Power BI セマンティック モデルのテーブルを作成するために使用されます。 ユーザーは、既定の Power BI セマンティック モデルからオブジェクトを削除することもできます。

Microsoft Purview データ ガバナンス メタデータ ドメイン モデルからセマンティック モデルを作成するには:

  1. Fabric ワークスペースで Lakehouse を開きます。

  2. ドメイン モデル ファイルをデルタ テーブルに発行する

    1. 省略記号ボタン (...) を選択します。
    2. **[テーブルに読み込む] > [新しいテーブル] を選択します
    3. 事前設定された新しいテーブル名
    4. [ファイルの種類] parquet を選択する

    Parquet から差分テーブルに手動で発行する方法を示すスクリーンショット。

  3. ショートカットを使用して、OneLake と OneLake 内のドメイン モデルをショートカットすることもできます。

    1. [テーブル] の省略記号ボタン (...) を選択します
    2. [ 新しいショートカット ] を選択し、[新しいショートカット ソース] ページから [Microsoft OneLake ] を選択します。
    3. ショートカットするドメイン モデル テーブルを選択する

    ショートカットを使用して差分テーブルに発行する方法を示すスクリーンショット。

すべてのファイルを手動またはショートカットを使用してデルタ テーブルに発行した後、デルタ テーブルをセマンティック モデルに追加できます。

  1. [Lakehouse] ページから [SQL 分析エンドポイント] ページに切り替えます。
  2. [SQL 分析エンドポイント] ページの左上隅から [レポート] を選択します。
  3. [ 既定のセマンティック モデルの管理] を選択します。
  4. レポート用のセマンティック モデルに追加する dbo > テーブルからテーブルを選択します。

セマンティック モデルにテーブルを手動で追加する方法を示すスクリーンショット。

テーブルやビューなどのオブジェクトを既定の Power BI セマンティック モデルに追加するには、[ セマンティック モデルを自動的に更新する] を選択します。

セルフサービス分析セマンティック モデルを示すスクリーンショット。

注:

リレーションシップ キーを使用して、セマンティック モデルリレーションシップを手動で描画する必要があります。

Microsoft Purview Catalog メタデータを AdlsG2 ストレージにサブスクライブする

Microsoft Purview のデータ ガバナンス メタデータをサブスクライブして、分析のために AdlsG2 ストレージに発行および格納し、次の手順に従って分析情報を導き出すことができます。

  1. 左側のウィンドウで [設定] を選択し、[統合カタログ] を選択し、[ソリューション統合] を選択します。

    adlsg2 のサブスクリプション ページを移動する方法を示すスクリーンショット。

  2. [編集] を選択します。

  3. [ ストレージの種類] を選択します。 をクリックし、セットアップを 有効に しました。

  4. 場所 URL を追加します。これは AdlsG2 パス + "/(コンテナー名)" である必要があります

    1. portal.azure.com に移動
    2. adlsg2 ストレージの選択 (ホーム > adlsg2)
    3. [設定>Endpoints] に移動し、データ レイク ストレージの [プライマリ エンドポイント] を選択します。
  5. Microsoft Purview Manage Service Identity (MSI) への ストレージ BLOB データ共同作成者 のアクセスを AdlsG2 コンテナーに付与する

  6. 接続をテストします。

    モデルを参照する

  7. [ 保存 ] タブを選択して構成を保存し、ドメイン モデルを adlsg2 ストレージに発行します。

公開されたモデルとデータを確認する

  1. portal.azure.com を開く

  2. adlsg2 ストレージを選択する

  3. purview で adlsg2 エンドポイントと共に追加したコンテナーを選択する

  4. コンテナーに発行されたデルタ Parquet ファイルの一覧を参照します。

  5. 公開されたモデルとメタデータを参照します (下の画像を参照してください)。

    adlsg2 コンテナーでサブスクリプション接続を構成する方法を示すスクリーンショット。

    モデル ファイルを参照する

Power BI レポートを作成する

Power BI は、Fabric エクスペリエンス全体にネイティブに統合されています。 このネイティブ統合には、最もパフォーマンスの高いクエリとレポート エクスペリエンスを提供するために、Lakehouse からデータにアクセスするための DirectLake と呼ばれる一意のモードが含まれています。 DirectLake は、Power BI で非常に大規模なセマンティック モデルを分析できる画期的な新機能です。 DirectLake を使用すると、データ ウェアハウスまたは Lakehouse エンドポイントにクエリを実行することなく、Power BI セマンティック モデルにデータをインポートまたは複製する必要なく、Parquet 形式のファイルをデータ レイクから直接読み込むことができます。 DirectLake は、データ レイクから直接 Power BI エンジンにデータを読み込むための高速パスであり、分析の準備ができています。

従来の DirectQuery モードでは、Power BI エンジンはクエリ実行ごとにソースからデータを直接クエリし、クエリのパフォーマンスはデータ取得速度に依存します。 DirectQuery を使用すると、データをコピーする必要がなくなり、ソース内の変更がクエリ結果にすぐに反映されます。

詳細については、 Microsoft Fabric で Power BI レポートを作成する方法に関するガイドラインに従ってください

重要

  • 既定の更新サイクルは 24 時間ごとです。
  • ファブリックワークパッケージに公開するために Microsoft Purview メタデータをサブスクライブしている場合、Purview MSI には Fabric ワークスペースへの共同作成者アクセスが必要です。
  • purview MSI では、adlsg2 コンテナーに発行するために purview メタデータをサブストレージしている場合は、Azure Data Lake Storage Gen2へのストレージ BLOB データ共同作成者アクセス権が必要です。

注:

  • データ更新ジョブのスケジュール設定はまだサポートされていません。
  • vNet はまだサポートされていません。