マスター データ管理 (MDM) 用の Microsoft Purview と Profisee の統合
エンタープライズ システムには、マスター データの複数のソース (システム間で共有される共通データ) を含めることができます。 この事実は、データ ソースをカタログ化するときに明らかになる可能性があります。 マスター データの例としては、顧客、製品、場所、資産、仕入先データなどがあります。 Profisee を使用してマスター データをマージ、検証、修正すると、そのデータを有効にすることができます。 具体的には、これを使用して、分析と運用の改善のための共通の信頼できるプラットフォームを構築できます。 Microsoft Purview で詳しく説明されているガバナンスの定義、分析情報、専門知識を使用することで、プラットフォームを効果的に構築できます。
この参照アーキテクチャは、Microsoft Purview と Profisee マスター データ管理 (MDM) プラットフォームを備えたガバナンスとデータ管理ソリューションを示します。 これらのサービスは連携して、Azure のデータのビジネス価値を最大化する高品質で信頼できるデータの基盤を提供します。 このソリューションに関する短いビデオについては、「 Azure での完全に統合されたマスター データ管理の機能」を参照してください。
アーキテクチャ
次の図は、マスター データ ソリューションを開発して運用するときに実行する手順を示しています。 これらの手順は非常に反復的であると考えてください。 ソリューションが進化するにつれて、これらの手順とフェーズを繰り返し、場合によっては自動的に、場合によっては手動で繰り返します。 自動ステップと手動ステップのどちらを使用するかは、マスター データ ソリューション、メタデータ、およびデータが行う変更によって異なります。
データフロー
メタデータとデータ フローには、前の図に示す次の手順が含まれます。
事前構築済みの Microsoft Purview コネクタは、ソース ビジネス アプリケーションから統合カタログを構築するために使用されます。 コネクタはデータ ソースをスキャンし、統合カタログを設定します。
マスター データ モデルは Microsoft Purview に発行されます。 Profisee MDM で作成されたマスター データ エンティティは、Microsoft Purview にシームレスに発行されます。 この手順では、さらに統合カタログを設定し、Microsoft Purview にこの重要なデータ ソースのレコードがあることを確認します。
データ スチュワードシップのガバナンス標準とポリシーは、マスター データ エンティティ定義を強化するために使用されます。 データは、データ ディクショナリと用語集の情報、所有権データ、機密データ分類を使用して Microsoft Purview でエンリッチされます。 Microsoft Purview で使用できる定義とメタデータは、MDM データ スチュワードのガイダンスとして Profisee でリアルタイムで表示されます。
ソース システムのマスター データが Profisee MDM に読み込まれます。 Azure Data Factoryなどのデータ統合ツールセットは、100 を超える事前構築済みコネクタまたは REST ゲートウェイのいずれかを使用してソース システムからデータを抽出します。 マスター データの複数のストリームが Profisee MDM に読み込まれます。
マスター データは、ガバナンス ルールに従って標準化、照合、マージ、エンリッチ、検証されます。 Microsoft Purview などの他のシステムでは、データ品質とガバナンスルールが定義されている場合があります。 ただし、Profisee MDM は、これらのルールを適用するシステムです。 ソース レコードは、可能な限り最も完全で正しいレコードを作成するために、ソース システム内およびソース システム間で照合およびマージされます。 データ品質規則チェック、ビジネス要件と技術要件に準拠するための各レコードが含まれます。 検証に失敗したレコード、または低い確率スコアを返すレコードは、修復の対象となります。 失敗した検証を修復するために、ワークフロー プロセスは、レビューを必要とするレコードを、ビジネス データ ドメインの専門家であるデータ スチュワードに割り当てます。 レコードが検証または修正されると、 ゴールデン レコード マスターとして使用する準備が整います。
トランザクション データは、ダウンストリーム分析ソリューションに読み込まれます。 Data Factory のようなデータ統合ツールセットは、100 を超える事前構築済みコネクタまたは REST ゲートウェイのいずれかを使用して、ソース システムからトランザクション データを抽出します。 ツールセットは、Azure Synapse Analytics などの分析データ プラットフォームにデータを直接読み込みます。 適切なマスター ゴールデン データを含まないこの生の情報に関する分析は、データの重複、不一致、競合がまだ解決されていないため、不正確な可能性があります。
Power BI コネクタを使用すると、キュレーションされたマスター データに直接アクセスできます。 Power BI ユーザーは、マスター データをレポートで直接使用できます。 専用の Power BI コネクタは、ロールベースのセキュリティを認識して適用します。 また、さまざまなシステム フィールドを非表示にして、使用を簡略化します。
高品質でキュレーションされたマスター データは、ダウンストリーム分析ソリューションに発行されます。 マスター データ レコードが 1 つのゴールデン レコードにマージされている場合は、元のレコードへの親子リンクが保持されます。
分析プラットフォームには、完全で一貫性があり、正確であるという意味で認定された一連のデータがあります。 そのデータには、適切にキュレーションされたマスター データと関連するトランザクション データが含まれます。 この組み合わせは、さらなる分析に利用できる信頼できるデータの強固な基盤を形成します。
高品質のマスター データが視覚化および分析され、機械学習モデルが適用されます。 このシステムは、ビジネスを推進するための健全な洞察を提供します。
コンポーネント
Microsoft Purview は、オンプレミスとクラウドのデータ資産を幅広く可視化するデータ ガバナンス ソリューションです。 Microsoft Purview には、データの検出と分類、系列、メタデータの検索と検出、使用状況の分析情報の組み合わせが用意されています。 これらの機能はすべて、エンタープライズ データランドスケープ全体のデータを管理および理解するのに役立ちます。
Profisee MDM は、Microsoft テクノロジと Azure データ管理エコシステムとシームレスに統合される、高速で直感的な MDM プラットフォームです。
Data Factory はハイブリッド データ統合サービスです。 Data Factory を使用すると、抽出、変換、読み込み (ETL) ワークフローの作成、スケジュール設定、調整、および抽出、読み込み、変換 (ELT) ワークフローを作成、スケジュール設定、調整できます。 Data Factory には、100 を超える事前構築済みコネクタと、ソース システムからデータを抽出するために使用できる REST ゲートウェイも用意されています。
Azure Synapse Analytics は、大規模な並列処理アーキテクチャを使用する、高速で柔軟で信頼できるクラウド データ ウェアハウスです。 Azure Synapse Analytics を使用して、データのスケーリング、コンピューティング、格納を柔軟かつ独立して行うことができます。
Power BI は、organization全体で分析情報を提供する一連のビジネス分析ツールです。 Power BI を使用して何百ものデータ ソースに接続し、データの準備を簡素化し、即興分析を推進できます。 また、美しいレポートを作成し、Web やモバイル デバイスで使用するorganization用に発行することもできます。
選択肢
専用の MDM アプリケーションがない場合は、Azure で MDM ソリューションを構築するために必要な技術的な機能の一部を確認できます。
- データ品質。 分析プラットフォームにデータを読み込むと、データ品質を統合プロセスに組み込むことができます。 たとえば、ハードコーディングされたスクリプトを使用して、 Data Factory パイプラインにデータ品質変換を適用できます。
- データの標準化とエンリッチメント。 Azure Mapsは、アドレス データのデータ検証と標準化を提供できます。 標準化されたデータは、Azure Functionsおよび Data Factory で使用できます。 他のデータを標準化するには、ハードコーディングされたスクリプトを開発することが必要になる場合があります。
- 重複データ管理。 完全一致に対して十分な識別子を使用できる場合は、Data Factory を使用して 行を重複 除去できます。 適切なデータサバイバーシップ手法を適用しながら、一致した行をマージするために必要なロジックを実装するには、カスタムハードコーディングされたスクリプトが必要な場合があります。
- データ スチュワードシップ。 Power Apps を使用すると、Azure でデータを管理するための基本的なデータ スチュワードシップ ソリューションをすばやく開発できます。 レビュー、ワークフロー、アラート、検証に適したユーザー インターフェイスを開発することもできます。
Microsoft 中心の環境では、Azure Synapse Analytics が分析サービスとして推奨されます。 ただし、任意の分析データベースを使用できます。 Snowflake と Databricks は一般的な選択肢です。
シナリオの詳細
Azure に読み込むデータの量が増えるにつれて、すべてのデータ ソースにわたってそのデータを適切に管理して管理する必要が増え、データ コンシューマーが増加します。 ソース システムで適切と思われるデータは、多くの場合、共有時に不足していることが判明します。 情報が見つからないか不完全であるか、重複と競合が発生している可能性があります。 その全体的な品質は悪いかもしれません。 必要なのは、完全で一貫性があり、正確なデータです。
Azure データ資産に高品質のデータがない場合、Azure のビジネス価値は損なわれます。おそらく重要です。 ソリューションは、高品質で信頼できるデータの真のソースを生成して提供できるデータ ガバナンスと管理の基盤を構築することです。 Microsoft Purview と Profisee MDM は連携して、このエンタープライズ プラットフォームを形成します。
Microsoft Purview は、すべてのデータ ソースをカタログ化し、機密情報と系列を識別します。 データ アーキテクトは、すべてのデータに適用する適切なデータ標準を検討する場所を提供します。 Microsoft Purview では、ポリシーと標準を見つけ、分類し、定義するためのガバナンスに重点を置いています。 ポリシーと標準の適用、データ ソースのカタログ化、データ不足の修復のタスクは、MDM システムなどのテクノロジに該当します。
Profisee MDM は、任意のソースからマスター データを受け入れるように設計されています。 次に、PROFISEE MDM は、システム間でデータの照合、マージ、標準化、検証、修正、同期を行います。 このプロセスにより、データを適切に統合し、ビジネス インテリジェンス (BI) や機械学習アプリケーションなどのダウンストリーム システムのニーズを満たすことができます。 統合された Profisee プラットフォームは、複数のデータ サイロにわたってガバナンス標準を適用します。
相乗効果:
Microsoft Purview と Profisee MDM は連携が向上します。 統合されると、データ管理タスクが合理化され、すべてのシステムが同じ標準を適用するようにします。 Profisee MDM は、ガバナンスに参加できるマスター データ モデルを Microsoft Purview に公開します。 その後、Microsoft Purview は、統合カタログや用語集の情報など、ガバナンスの出力を共有します。 Profisee は、出力を確認し、標準を適用できます。 Microsoft Purview と Profisee は、共同で作業することで、各独立したオファリングよりも深く、より自然で優れた相乗効果を生み出します。
たとえば、エンタープライズ データ ソースをカタログ化した後、マスター データが複数のシステムに存在すると判断できます。 マスター データは、ドメイン エンティティを定義するデータです。 マスター データの例としては、顧客、製品、資産、場所、ベンダー、患者、家庭、メニュー項目、成分データなどがあります。 異なる定義を解決し、このデータをシステム間で照合してマージすることは、このデータを有意義な方法で使用する能力にとって重要です。 効果的にするには、Microsoft Purview で詳しく説明されているガバナンス定義、分析情報、専門知識を使用して、Profisee MDM のマスター データをマージ、検証、修正する必要があります。 このように、Microsoft Purview と Profisee MDM は、ガバナンスとデータ管理の基盤を形成し、Azure のデータのビジネス価値を最大化します。
代わりに、取得できる情報を使用することもできます。 ただし、このアプローチを実行すると、誤解を招くような結果が生じ、ビジネスに損害を与える可能性があります。 代わりに高品質のマスター データを使用すると、一般的なデータ品質の問題を排除できます。 その後、分析、機械学習、視覚化に使用するツールに関係なく、システムはビジネスを推進するために使用できる健全な分析情報を提供します。 適切にキュレーションされたマスター データは、強固で信頼性の高いデータ基盤を構築するための重要な側面です。
Microsoft Purview で Profisee MDM を使用すると、次の利点が得られます。
- 一般的な技術的基盤。 Profisee は Microsoft テクノロジに由来します。 Profisee と Microsoft では、一般的なツール、データベース、インフラストラクチャを使用しているため、Profisee ソリューションは Microsoft テクノロジを使用するすべてのユーザーに馴染み深くなります。 実際、Profisee MDM は長年にわたって Microsoft マスター データ サービス上に構築されています。 マスター データ サービスはライフサイクルの終わりに近づき、Profiseeは最高のアップグレードと交換ソリューションです。
- 開発者コラボレーションと共同開発。 Profisee と Microsoft Purview の開発者は、それぞれのソリューション間に適切で補完的な適合を確保するために、広範に共同作業を行います。 このコラボレーションは、顧客のニーズを満たすシームレスな統合を実現します。
- 共同販売と展開。 Profisee には、Azure 上の MDM デプロイが他のどの MDM ベンダーよりも多く、Microsoft Purview と共同でデプロイされています。 Profisee はAzure Marketplaceから購入できます。 2023 年度、Profisee は、サービスとしてのインフラストラクチャ (IaaS)、サービスとしてのコンテナー (CaaS)、またはサービスとしてのソフトウェア (SaaS) オファリングを持つ最上位の Microsoft パートナー認定資格を持つ唯一の MDM ベンダー Azure Marketplace。
- 迅速で信頼性の高いデプロイ。 すべてのエンタープライズ ソフトウェアの重要な機能は、迅速で信頼性の高い展開です。 Gartner Peer Insights プラットフォームによると、Profisee には、他のどの MDM ベンダーよりも完了するまでに 90 日未満かかる実装が増えています。
- 複数のドメイン。 Profisee は、本質的に複数のドメインを使用する MDM へのアプローチを提供します。 作成できるマスター データ ドメインの数に制限はありません。 この設計は、データ資産の最新化を計画しているお客様によく合っています。 顧客は限られた数のドメインから始まるかもしれませんが、最終的にはデータ資産全体でドメイン カバレッジを最大化することでメリットを得られます。 このドメイン カバレッジは、データ ガバナンス カバレッジと一致します。
- Azure 用に設計されたエンジニアリング。 Profisee は、SaaS と Azure 上のマネージド IaaS または CaaS デプロイのオプションを使用して、クラウドネイティブに設計されています。
潜在的なユース ケース
このソリューションの MDM ユース ケースの詳細な一覧については、この記事の「 MDM ユース ケース 」を参照してください。 主要な MDM ユース ケースには、次の小売と製造の例が含まれます。
- 分析のために顧客データを統合する。
- 製品の名前、説明、特性など、一貫性のあるアクセシビリティの高い形式で製品データを 360 度表示します。
- マスター データの説明を一貫して拡張するための参照データの確立。 たとえば、参照データには、国/地域、通貨、色、サイズ、測定単位のリストが含まれます。
これらの MDM ソリューションは、タイムリーなレポートなど、重要なアクティビティにデータに大きく依存する金融機関にも役立ちます。
MDM と Microsoft Purview の統合
次の図は、Microsoft Purview での Profisee MDM の統合を詳細に示しています。 この統合をサポートするために、Profisee ガバナンス サブシステムは、2 つの異なるフローで構成される Microsoft Purview との双方向統合を提供します。
- ソリューション メタデータの公開は、データ モデラーがマスター データ モデル、照合戦略、および関連するサブアーティファクトに変更を加えたときに発生します。 これらの変更は、発生した時点で Microsoft Purview にシームレスに発行されます。 これらの変更を発行すると、マスター データ モデルとソリューションに関連するメタデータが同期されます。 その結果、統合カタログがさらに設定され、Microsoft Purview にはこの重要なデータ ソースのレコードが含まれます。
- ガバナンスの詳細が返され、データ スチュワードとビジネス ユーザーに提供されます。 これらの詳細は、Profisee FastApp ポータルを使用して、ユーザーがデータの表示、データの強化、データ品質の問題の修復を行う場合に使用できます。
Microsoft Purview 統合機能
Microsoft Purview カタログと用語集は、統合を最大化するのに役立ちます。
マスター データ モデルの設計
MDM ソリューションを準備する際の課題の 1 つは、マスター データを構成するものと、マスター データ モデルを設定するときに使用するデータ ソースを決定することです。 Microsoft Purview を使用して、この作業を支援できます。 重要なデータ ソースをスキャンする機能を利用でき、データ スチュワードと主題の専門家 (SME) を関与させることができます。 これにより、スチュワードがアクセスできる情報で統合カタログを強化し、マスター データ モデルを基幹業務システムとより適切に整合させることができます。 競合する用語を調整できます。 このプロセスにより、ビジネス用に標準化する用語と定義を最適に反映するマスター データ モデルが生成されます。 また、古い、誤解を招くような詳細を回避します。
より広範な図からの次の抜粋は、この統合ユース ケースを示しています。 まず、Microsoft Purview システム スキャン関数を使用して、基幹業務システムからメタデータを取り込みます。 次に、データ スチュワードと SME がソリッド カタログと連絡先を準備します。 その後、Profisee MDM モデリング サービスを使用するデータ モデラーは、マスター データ モデルを準備して進化させることができます。 この作業は、Microsoft Purview で定義した標準に合わせて調整されます。
データ スチュワードがモデルを進化させるにつれて、Profisee MDM プラットフォーム内のモデリング サービスは、Profisee MDM ガバナンス サービスが受け取る変更を公開します。 さらに、Profisee MDM は、更新された統合カタログに含めるために、これらの変更を Microsoft Purview に準備して転送します。 これらのカタログへの追加により、マスター データ定義がより広範なデータ資産に含まれ、基幹業務システムのメタデータと同じ方法で管理および制御できるようになります。 この情報を一緒にカタログ化することで、マスター データと基幹業務システム データの関係を管理する方が適切な立場にあります。
データ スチュワードシップ
それに対応して複雑で広大なデータ資産を持つ大企業は、問題が発生した場合の管理と修復を担当するデータ スチュワードに課題を提示できます。 重要なデータ ドメインは複雑な場合があり、多くの不明瞭な属性があり、重要な制度上の知識を持つ従業員だけが理解しています。 Profisee MDM と Microsoft Purview の統合により、この教育機関の知識を Microsoft Purview 内でキャプチャし、Profisee MDM 内で使用できるようにします。 その結果、重要な情報と時間の機密性の高い情報を管理するときに、企業データの知識に対する大きなニーズが軽減されます。
次の図は、Microsoft Purview から Profisee FastApp ポータルで作業するデータ スチュワードへの情報のフローを示しています。 ガバナンス データ サービスは、Microsoft Purview とMicrosoft Entra IDと統合されます。 このサービスは、ルックアップ機能を提供します。 FastApp ポータル ユーザーは、この機能を使用して、操作するエンティティと属性に関する強化されたガバナンス データを取得できます。
また、ガバナンス サービスは、Microsoft Purview から受信した連絡先を、Microsoft Entra IDで利用できる完全なプロファイルの詳細に解決します。 完全なプロファイルの詳細を使用すると、スチュワードは、マスター データの品質を向上させるために作業するデータ所有者や専門家と効果的に共同作業を行うことができます。
Profisee MDM Governance ダイアログは、データ スチュワードとユーザーがガバナンス レベルの詳細と対話するインターフェイスです。 この UI は、Microsoft Purview から取得した情報をユーザーにレンダリングします。 この情報を使用すると、ユーザーはダイアログが起動されたデータの背後にある詳細を確認できます。 [ガバナンス] ダイアログで提供される情報が不十分な場合、ユーザーは Microsoft Purview ユーザー エクスペリエンスに直接移動できます。
データ スチュワードとビジネス ユーザーは、FastApp ポータルから 3 種類の Profisee MDM データ資産にアクセスできます。
- Profisee Instance:ユーザーが表示している Profisee MDM プラットフォームの特定のインスタンスのインフラストラクチャ プロパティを提供します
- Profisee Entity:スチュワードまたはユーザーが現在表示しているマスター データ エンティティ (テーブル) のプロパティを提供します
- Profisee 属性。ユーザーが関心を持つ属性 (フィールドや列など) のプロパティを提供します。
次の図は、FastApp ポータルで作業しているユーザーが、これらの各資産の種類のガバナンスの詳細を表示できる場所を示しています。 インスタンスレベルの詳細は、[ ヘルプ ] メニューにあります。 エンティティの詳細には、エンティティ グリッドを含むページ ゾーン ヘッダーからアクセスできます。 属性の詳細については、エンティティ グリッドに関連付けられているフォームに移動します。 属性に関連付けられているラベルから詳細にアクセスします。
概要情報を表示するには、Microsoft Purview などのガバナンス アイコンにカーソルを合わせます。 アイコンを選択すると、完全なガバナンス ダイアログが表示されます。
完全な Microsoft Purview ユーザー エクスペリエンスに移動するには、ダイアログ ヘッダーでガバナンス アイコンを選択します。 アイコンを選択すると、現在表示している資産のコンテキストで Microsoft Purview に移動します。 その後、検出のニーズに基づいて Microsoft Purview を簡単に移動できます。
MDM 処理
MDM ソリューションの機能は詳細にあります。
データ モデリング
MDM ソリューションの中心は、基になるデータ モデルです。 これは、社内の マスタデータ の定義を表します。 マスター データ モデルの開発には、次のタスクが含まれます。
- 会社の運用にとって重要であり、パフォーマンスの分析の中心となる、システム全体のランドスケープからのソース データの要素を特定します。
- 他のサードパーティのソースから取得した要素を使用してモデルを強化し、データをより便利で正確で信頼できるものにします。
- データ モデルの要素に関連する明確な所有権とアクセス許可を確立します。 このプラクティスは、可視性と変更管理をモデルの設計に確実に考慮するのに役立ちます。
データ ガバナンスは、サポートの重要な基盤を提供します。
- ガバナンス統合カタログ、辞書、用語集、およびサポート リソースは、ガバナンス データ スチュワードにとって非常に貴重な情報源です。 これらのリソースは、スチュワードがマスター データ モデルに含める内容を決定するのに役立ちます。 また、Microsoft Purview での所有権と機密データ分類の決定にも役立ちます。 モデルで用語を強化できます。 このプラクティスを通じて、ビジネスの公式辞書を確立できます。 用語を統合することで、マスター データ モデルは、さまざまなソース システムで使用されている任意の難解な用語を、ビジネスの承認済み言語に翻訳することもできます。
- 多くの場合、サードパーティ システムは、基幹業務システムとは別のマスター データのソースです。 これらのシステムがデータに追加する情報をキャプチャし、これらの情報ソースを統合カタログに反映するために、モデルに要素を追加することが重要です。
- ガバナンス カタログで識別されている所有権とデータ アクセスを使用して、MDM ソリューション内でアクセスと変更管理のアクセス許可を適用できます。 その結果、会社のポリシーとニーズを、マスター データの管理と管理に使用するツールに合わせて調整します。
ソース データの読み込み
理想的には、異なる基幹業務システムは、変更や変換がほとんどまたはまったくない状態でマスター データ モデルにデータを読み込みます。 目標は、ソース システムに存在するデータの一元化されたバージョンを作成することです。 ソース システムとマスター データ リポジトリの間では、可能な限り忠実度が低下することが少ないはずです。 読み込みプロセスの複雑さを制限することで、系列をより簡単にします。 また、Data Factory パイプラインなどのテクノロジを使用する場合、ガバナンス ソリューションはフローを検査できます。 その後、ソリューションは、ソース システムとマスター データ モデルの間の関係を識別できます。 具体的には、ソリューションは、100 を超える事前構築済みコネクタと REST ゲートウェイを使用して、ソース システムからデータを抽出できます。
データエンリッチメントと標準化
ソース データをモデルに読み込んだ後は、サード パーティ製データの豊富なソースを利用して拡張できます。 これらのシステムを使用して、基幹業務システムから取得するデータを改善できます。 また、これらのシステムを使用して、他のダウンストリーム コンシューマーの使用を強化する情報でソース データを拡張することもできます。 以下に例を示します。
- Bingなどのアドレス検証サービスを使用して、ソース システムのアドレスを修正および改善できます。 これらのサービスは、位置情報とメール配信に不可欠な不足している情報を標準化して追加できます。
- Dun & Bradstreet などのサード パーティの情報サービスは、汎用または業界固有のデータを提供できます。 このデータを使用して、ゴールデン マスター レコードの値を拡張できます。 具体的には、利用できなかった情報や、異なる基幹業務システムで競合している情報を追加する場合があります。
Profisee の発行/サブスクライブ インフラストラクチャを使用すると、必要に応じて独自のサード パーティのソースをソリューションに簡単に統合できます。
このデータの背後にあるソースと意味を理解する能力は、社内の基幹業務システムと同様に、サードパーティのデータにとって非常に重要です。 マスター データ モデルをガバナンス 統合カタログに統合することで、ガバナンスの詳細を使用してモデルを強化しながら、データソースの内部と外部の関係を管理できます。
データ品質の検証とスチュワードシップ
データを読み込んで強化した後は、品質のためにデータをチェックし、ガバナンス プロセスを通じて確立した標準に準拠することが重要です。 Microsoft Purview は、標準情報の豊富なソースとして再び使用できます。 Microsoft Purview を使用して、MDM ソリューションで適用されるデータ品質ルールを推進できます。 Profisee MDM では、データ品質ルールを資産としてガバナンス カタログに公開することもできます。 ルールはレビューと承認の対象となる場合があります。これは、マスター データに関連付けられている品質基準のトップダウン監視を提供するのに役立ちます。 ルールはマスター データ エンティティと属性に関連付けられており、これらの属性はソース システムにトレースバックできます。 これらの理由から、基幹業務システムから発生する低品質のデータ品質の根本原因を確立できます。
データ スチュワードは、ガバナンス ドメインの専門家です。 スチュワードは、マスター データ ソリューションで明らかにされる問題に対処するため、Microsoft Purview データ ガバナンス カタログを使用できます。 カタログは、スチュワードが発生した品質の問題を理解し、解決するのに役立ちます。 スチュワードは、データ所有者と専門家のサポートに支えられ、データ品質の問題に迅速かつ正確に対処できるように準備されています。
マッチングとサバイバーシップ
エンリッチされた高品質のソース データを使用すると、さまざまな基幹業務システム全体で最も正確な情報を表すゴールデン レコード マスターを生成できます。 次の図は、すべてのステップが、ビジネス分析に使用できる高品質なデータで最高潮に立つ方法を示しています。 このデータは、いつでもデータ資産間で同期できます。
Profisee MDM マッチング エンジンは、サバイバーシップ プロセスの一環としてゴールデン レコード マスターを生成します。 サバイバーシップ ルールは、ゴールデン レコードに、すべてのソース システムで選択した情報を選択的に設定します。
Profisee MDM の履歴と監査追跡サブシステムは、ユーザーが行った変更を追跡します。 このサブシステムは、サバイバーシップなどのシステム プロセスが行う変更も追跡します。 照合とサバイバーシップにより、ソース レコードからマスターへの情報フローをトレースできます。 Profisee MDM には、特定のソース レコードを担当するソース システムのレコードがあります。 また、異なるソース レコードによってゴールデン レコードがどのように設定されるかもわかります。 その結果、分析からレポートが参照するソース データに戻ってデータ系列を実現できます。
MDM ユース ケース
MDM のユース ケースは多数ありますが、ほとんどの実際の MDM 実装に対応するユース ケースがいくつかあります。 これらのユース ケースは 1 つのドメインに焦点を当てていますが、そのドメインからのみ構築される可能性は低いです。 これらの重点的なユース ケースでも、多くの場合、複数のドメインが含まれます。 各ユース ケースでは、MDM は、重要なデータ型の 360 度 (統合) ビューを提供するという目標を満たしています。
顧客データ
BI 分析のための顧客データの統合と標準化は、最も一般的な MDM ユース ケースです。 組織は、ますます多くのシステムとアプリケーションにわたって顧客データをキャプチャします。 顧客データ レコードの重複の結果。 これらの重複はアプリケーション間で配置され、不整合と不一致が含まれます。 顧客データの品質が低いと、最新の分析ソリューションの価値が制限されます。 症状には、次の課題が含まれます。
- 「トップのお客様は誰ですか」や「新しい顧客の数」などの基本的なビジネス上の質問に答えるのは困難です。これらの質問に回答するには、手作業が必要です。
- 顧客情報が見つからないため、データのロールアップやドリルダウンが困難になります。
- 組織とシステムの境界を越えて顧客を一意に識別または検証することはできません。 その結果、システムまたは部署間で顧客データを分析することはできません。
- 低品質の入力データが原因で、AI と機械学習から低品質の分析情報が得られます。
製品データ
多くの場合、製品データは、エンタープライズ リソース プランニング (ERP)、製品ライフサイクル管理 (PLM)、e コマース アプリケーションなど、複数のエンタープライズ アプリケーションに分散されます。 その結果、製品名、説明、特性など、プロパティの定義に一貫性のない製品のカタログ全体を理解するのは困難です。 参照データの定義が異なると、この状況が複雑になります。 症状には、次の課題が含まれます。
- 製品分析の別の階層型ロールアップ パスとドリルダウン パスをサポートすることはできません。
- 完成品または資材在庫では、製品在庫と確立された仕入先の評価が困難になります。 また、重複する製品があり、過剰な在庫につながります。
- 定義が競合しているため、製品を合理化するのは困難です。 この状況により、分析の情報が見つからない、または不正確になります。
参照データ
分析のコンテキストでは、参照データは多数のデータ リストとして存在します。 これらの一覧は、多くの場合、他のマスタデータセットをさらに記述するために使用されます。 たとえば、参照データには、国/地域、通貨、色、サイズ、測定単位のリストが含まれます。 一貫性のない参照データにより、ダウンストリーム分析で明らかなエラーが発生します。 症状は次のとおりです。
- 同じ値の複数の表現。 たとえば、ジョージア州は GA と ジョージアと表示されるため、データを一貫して集計してドリルダウンすることが困難になります。
- システム間でデータ値を クロスウォークまたはマップできないため、システム間でデータを合理化するのが困難です。 たとえば、赤の色は ERP システムでは R 、PLM システムでは 赤 で表されます。
- データ分類に使用される確立された参照データ値の違いにより、組織間で数値を結合するのが困難です。
財務データ
財務組織は、月次、四半期、年次レポートなどの重要なアクティビティのデータに大きく依存しています。 複数の財務および会計システムを持つ組織には、財務レポートを生成するために統合する必要がある複数の総勘定元帳にわたって財務データが含まれることがよくあります。 MDM は、アカウント、コスト センター、ビジネス エンティティ、およびその他の財務データセットをマップおよび管理するための一元化されたハブを提供できます。 MDM は、一元化されたハブを通じて、これらのデータセットの統合ビューを提供します。 症状には、次の課題が含まれます。
- 複数のシステムにまたがる財務データを統合ビューに集計する難しさ
- 金融システムに新しいデータ要素を追加およびマッピングするためのプロセスの欠如
- 期間終了の財務レポートの作成の遅延
考慮事項
これらの考慮事項では、Azure Well-Architected Framework の柱を実装します。これは、ワークロードの品質を向上させるために使用できる一連のガイドの原則です。 詳細については、「 Microsoft Azure Well-Architected Framework」を参照してください。
organizationのデータ管理ソリューションを選択する場合は、これらの要因を考慮してください。
信頼性
信頼性により、アプリケーションは顧客に対するコミットメントを確実に満たすことができます。 詳細については、「 信頼性の柱の概要」を参照してください。
Profisee は、Azure Kubernetes Service (AKS) と Azure SQL Database でネイティブに実行されます。 どちらのサービスも、高可用性をサポートするためのすぐに使用できる機能を提供します。
セキュリティ
セキュリティは、意図的な攻撃や貴重なデータとシステムの悪用に対する保証を提供します。 詳細については、「 セキュリティの柱の概要」を参照してください。
Profisee は、OAuth 2.0 認証フローを実装する OpenID Connect を使用してユーザーを認証します。 ほとんどの組織は、Microsoft Entra IDに対してユーザーを認証するように Profisee MDM を構成します。これにより、認証にエンタープライズ ポリシーを適用して適用できます。
コストの最適化
コストの最適化は、不要な経費を削減し、運用効率を向上させる方法を検討する方法について説明します。 詳細については、「 コスト最適化の柱の概要」を参照してください。
実行コストは、ソフトウェア ライセンスと Azure の使用量で構成されます。 詳細については、 Profisee にお問い合わせください。
パフォーマンス効率
パフォーマンス効率は、ワークロードをスケーリングして、ユーザーが効率的に要求を満たす能力です。 詳細については、「 パフォーマンス効率の柱の概要」を参照してください。
Profisee MDM は、AKS とSQL Databaseでネイティブに実行されます。 ビジネス機能全体で Profisee MDM をスケールアップ、ダウン、スケールするように AKS を構成できます。 パフォーマンス、スケーラビリティ、コストのバランスを取るために、多数の構成にSQL Databaseをデプロイできます。
動的スケーリングは、マイクロサービスとコンテナーを使用する Profisee のクラウドネイティブ アーキテクチャに固有です。 Kubernetes を使用してクラウド テナントで Profisee を実行すると、負荷に基づいて動的にスケールアップおよびスケールアウトできます。 AKS で実行される Profisee SaaS サービス を使用すると、ポッドの大規模なノード プールを構成できます。 これらのプールは、マルチテナント インフラストラクチャ全体のシステムの負荷に基づいて動的にスケーリングされます。
AKS に Profisee と Microsoft Purview を展開する方法の詳細については、「 Microsoft Purview - Profisee MDM 統合」を参照してください。
このシナリオをデプロイする
Profisee MDM は、パッケージ化された Kubernetes サービスです。 Profisee MDM は、Azure テナント、他のクラウド テナント、またはオンプレミスに PaaS としてデプロイできます。 Profisee MDM は、 Profisee がホストおよび管理する SaaS としてデプロイすることもできます。
profisee からライセンス ファイルを取得するには、 https://support.profisee.com/でサポート チケットを発行します。 この手順の前提条件は、Profisee が Azure で設定した DNS 解決 URL を事前に決定する必要がある場合のみです。 つまり、デプロイで使用されるロード バランサーの DNS ホスト名を保持します。 "[profisee_name]のようなものになります。[region].cloudapp.azure.com。 たとえば、DNSHOSTNAME="purviewprofisee.southcentralus.cloudapp.azure.com" です。 この DNSHOSTNAME は、サポート チケットを発行するときに Profisee サポートに指定し、Profisee はライセンス ファイルで元に戻します。 このファイルは、次の構成手順の間に指定する必要があります。
Azure でユーザー割り当てマネージド ID を作成します。 デプロイを実行するには、マネージド ID が作成されている必要があります。 デプロイが完了すると、マネージド ID を削除できます。 ARM テンプレートの選択肢に基づいて、マネージド ID に割り当てられている次のロールとアクセス許可の一部またはすべてを必要とします。
- AKS がデプロイされるリソース グループへの共同作成者ロール。 リソース グループに直接割り当てる か、サブスクリプション レベルとダウンレベルで割り当てることができます。
- エントリが作成される特定の DNS ゾーンに対する DNS ゾーン共同作成者ロール または DNS ゾーン リソース グループへの共同作成者ロール。 この DNS ロールは、Azure でホストされている DNS を更新する場合にのみ必要です。
- アプリケーションの登録に必要なアクセス許可を割り当てることができるように、Microsoft Entra IDのアプリケーション管理者ロール。
- サブスクリプション レベルのマネージド ID 共同作成者とユーザー アクセス管理者。 ARM テンプレートマネージド ID が、profisee がKey Vaultに格納されている値をプルするために使用されるKey Vault固有のマネージド ID を作成できるようにするために必要です。
Profisee がインストールされると、ログイン ID として機能するアプリケーション登録を作成します。 Profisee へのサインインに使用されるMicrosoft Entra IDの一部である必要があります。 後で使用するために アプリケーション (クライアント) ID を 保存します。
- 次の設定に一致するように認証を設定します。
- サポート ID トークン (暗黙的およびハイブリッド フローに使用)
- リダイレクト URL を https://<our-deployment-url>/profisee/auth/signin-microsoft に設定します。
- デプロイ URL は、手順 1 で Profisee に指定した URL です
- 次の設定に一致するように認証を設定します。
この Profisee デプロイ中に Microsoft Purview が自身に対して何らかのアクションを実行するために使用するサービス プリンシパルを作成します。 サービス プリンシパルを作成するには、前の手順で行ったようにアプリケーションを作成し、 アプリケーション シークレットを作成します。 アプリケーションの オブジェクト ID と、後で使用するために作成したシークレットの 値 を保存します。
- Microsoft Purview アカウントのルート コレクションに対して、このサービス プリンシパル (名前またはオブジェクト ID を使用して検索) データ キュレーター のアクセス許可を付与します。
https://github.com/Profisee/kubernetesに移動し、[Microsoft Purview Azure ARM] を選択します。
- ARM テンプレートは、イングレス コントローラーを使用して負荷分散された AKS (Azure Kubernetes Service) インフラストラクチャに Profisee をデプロイします。
- readme にはトラブルシューティング手順が含まれています。
- すべての手順とトラブルシューティング Wiki ページをよくお読みください。
[Azure にデプロイ] を選択します
- 構成ウィザードでは、「ARM テンプレートを使用した AKS クラスターのデプロイ」の説明に従って入力が求められます
- 手順 1 でマネージド ID に対するアクセス許可を付与したのとまったく同じ RG (リソース グループ) をデプロイに付与してください。
デプロイが完了したら、Microsoft Purview [リソース グループに移動] を選択し、Profisee AKS クラスターを開きます。
一般的な Microsoft Purview のステージ - Profisee デプロイの実行
[基本] ページ で、前に作成したユーザー割り当てマネージド ID を 選択してリソースをデプロイします。
Profisee 構成の場合は、情報をKey Vaultに格納するか、デプロイ中に詳細を指定できます。
- Profisee バージョンを選択し、管理者ユーザー アカウントとライセンスを指定します。
- Microsoft Purview を使用して構成する場合に選択します。
- [アプリケーション登録クライアント ID] に、前に作成したアプリケーション登録のアプリケーション(クライアント) ID を指定します。
- Microsoft Purview アカウントを選択します。
- 前に作成したサービス プリンシパルのオブジェクト ID を追加します。
- そのサービス プリンシパル用に作成したシークレットの値を追加します。
- Web アプリケーションに名前を付けます。
[Kubernetes] ページでは、必要に応じて古いバージョンの Kubernetes を選択できますが、最新バージョンをデプロイするにはフィールドを空白のままにします。
ヒント
ほとんどの場合、古いバージョンの Kubernetes AKS を使用してデプロイする必要がある理由がない限り、バージョン フィールドを空白のままにするだけで十分です。
[SQL 構成] ページで、新しいAzure SQL サーバーをデプロイするか、既存のAzure SQL サーバーを使用するか選択できます。 このデプロイに使用するログインの詳細とデータベース名を指定します。
[ストレージ構成] ページで、新しいストレージ アカウントを作成するか、既存のストレージ アカウントを使用するか選択できます。 既存のアカウントを選択する場合は、アクセス キーと既存のファイル共有の名前を指定する必要があります。
[ネットワーク構成] ページで、既定の Azure DNS を使用するか、独自の DNS ホスト名を指定するかを選択します。
ヒント
はい。既定の Azure DNS を使用 することをお勧めします。 [はい] を選択すると、デプロイ担当者は HTTP/TLS 用の Let's Encrypt 証明書を自動的に作成します。 [いいえ] を選択した場合は、さまざまなネットワーク構成パラメーターと独自の HTTPS/TLS 証明書を指定する必要があります。
警告
既定の Azure DNS URL (URL="https://purviewprofisee.southcentralus.cloudapp.azure.com/profisee") など) は、Profisee によって提供されたライセンス ファイルから、thr ARM テンプレートデプロイ ウィザードによって取得されます。 変更を加え、既定の Azure DNS を使用しない場合は、Profisee DNS の完全な DNS と完全修飾 URL を Profisee サポート チームに伝えて、更新されたライセンス ファイルを再作成して提供できるようにします。 これを行わないと、Profisee の誤動作が発生します。
[確認と作成] ページで、詳細を確認して、ウィザードで構成が検証されていることを確認します。 検証に合格したら、[ 作成] を選択します。
Profisee のインストールを完了するには、デプロイが完了するまでに約 45 分から 50 分かかります。 デプロイ中に、進行中の側面が表示され、ページを更新して進行状況を確認できます。 すべてが完了すると、デプロイは完了として表示されます。 "InstallProfiseePlatform" ステージの完了は、デプロイが完了したことを示します。
デプロイが完了したら、統合をデプロイしたリソース グループを開きます。
[出力] で、最終的なデプロイ URL をフェッチします。 最後の WEBURL は、ブラウザーのアドレス バーに貼り付けて、Profisee-Purview 統合を楽しむ必要があるものです。 この URL は、ライセンス ファイルの取得中に Profisee サポートに提供した URL と同じです。 URL 形式を変更しない限り、"https://[profisee_name] のようになります。[region].cloudapp.azure.com/profisee/
FastApp をインストールして、新しくインストールした Profisee 環境にデータを入力してハイドレートします。 Profisee デプロイ URL に移動し、 /Profisee/api/client を選択します。 "https://[profisee_name] のようになります。[region].cloudapp.azure.com/profisee/api/client"。 [Profisee FastApp Studio] ユーティリティの [ダウンロード] と [Profisee Platform Tools] を選択します。 これらの両方のツールをローカル クライアント コンピューターにインストールします。
FastApp Studio にログインし、Profisee の MDM 管理と構成管理の残りの部分を実行します。 セットアップ中に指定した管理者のメール アドレスを使用してログインした後。Profisee FastApp Studio の左側のウィンドウに管理メニューが表示されます。 これらのメニューに移動し、FastApp ツールを使用して MDM 体験の残りの部分を実行します。 次の図に示すように管理メニューを表示できることで、Azure Platform での Profisee の正常なインストールが確認されます。
インストールを確実に成功させ、Profisee が Microsoft Purview インスタンスに正常に接続されているかどうかを確認するための最後の検証手順として、 /Profisee/api/governance/health に移動します。"https://[profisee_name] のようになります。[region].cloudapp.azure.com//Profisee/api/governance/health"。 出力応答は、すべての Microsoft Purview サブシステムの "Status": "Healthy" という単語を示します。
{
"OverallStatus": "Healthy",
"TotalCheckDuration": "0:XXXXXXX",
"DependencyHealthChecks": {
"purview_service_health_check": {
"Status": "Healthy",
"Duration": "00:00:NNNN",
"Description": "Successfully connected to Purview."
},
"governance_service_health_check": {
"Status": "Healthy",
"Duration": "00:00:NNNN",
"Description": "Purview cache loaded successfully.
Total assets: NNN; Instances: 1; Entities: NNN; Attributes: NNN; Relationships: NNN; Hierarchies: NNN"
},
"messaging_db_health_check": {
"Status": "Healthy",
"Duration": "00:00:NNNN",
"Description": null
},
"logging_db_health_check": {
"Status": "Healthy",
"Duration": "00:00:NNNN",
"Description": null
}
}
}
上記のような出力応答は、正常なインストールを確認し、すべてのデプロイ手順を完了します。は、Profisee が Microsoft Purview に正常に接続されているかどうかを検証し、2 つのシステムが適切に通信できることを示します。
次の手順
- Data Factory の REST コピー コネクタ の機能について説明します。
- Azure でネイティブに実行されている Profisee の詳細については、こちらをご覧ください。
- Azure Resource Manager テンプレート (ARM テンプレート) を使用して Profisee を Azure にデプロイする方法について説明します。
- Profisee Data Factory テンプレートを表示します。