次の方法で共有


Azure Cosmos DB データの分析とビジネス インテリジェンス (BI)

Azure Cosmos DB には、運用データに関する大規模な分析と BI レポートを可能にするさまざまなオプションが用意されています。

Azure Cosmos DB データに関する有意義な分析情報を得るには、複数のパーティション、コレクション、またはデータベースに対してクエリを実行することが必要になる場合があります。 場合によっては、このデータを組織内の他のデータ ソース (Azure SQL Database、Azure Data Lake Storage Gen2 など) と組み合わせることがあります。合計、カウントなどの集計関数を使用してクエリを実行することもできます。このようなクエリには大量の計算をこなせる処理能力が必要で、より多くの要求ユニット (RU) を消費する傾向があるため、これらのクエリはミッション クリティカルなワークロードのパフォーマンスに影響を与える可能性があります。

複雑な分析クエリのパフォーマンスへの影響からトランザクション ワークロードを分離するために、データベースのデータは、複雑な抽出、変換、読み込み (ETL) パイプラインを使用して一元的な場所に夜間に取り込まれます。 このような ETL ベースの分析は複雑であり、ビジネス データに関する分析情報を取得するのに時間とコストがかかります。

Azure Cosmos DB では、コスト効率の高いゼロ ETL 分析オファリングを提供することで、これらの課題に対処します。

Azure Cosmos DB のゼロ ETL 準リアルタイム分析

Azure Cosmos DB では、トランザクション ワークロードや要求ユニット (RU) のパフォーマンスに影響を与えないで、ほぼリアルタイムでゼロ ETL のデータ分析を提供できます。 これらのオファリングにより、複雑な ETL パイプラインが不要になり、Azure Cosmos DB データを分析エンジンでシームレスに利用できるようになります。 分析情報の待機時間を短縮することで、カスタマー エクスペリエンスを向上させ、市場の状況やビジネス環境の変化に迅速に対応できます。 データの分析情報を迅速に取得できる、いくつかのサンプル シナリオを次に示します。

次のオプションを使用して、Azure Cosmos DB でゼロ ETL 分析と BI レポートを行えます。

  • データを Microsoft Fabric にミラーリングする
  • Azure Synapse Link を有効にして Azure Synapse Analytics からデータにアクセスする

オプション 1: Azure Cosmos DB データを Microsoft Fabric にミラーリングする

ミラーリングを使用すると、Azure Cosmos DB データベース データを Microsoft Fabric にシームレスに取り込むことができます。 ゼロ ETL の場合、Fabric に組み込まれている分析、BI、AI の機能を使用して、Azure Cosmos DB データに関する高度なビジネス分析情報をすばやく取得できます。

Cosmos DB の運用データは、準リアルタイムで Fabric OneLake に増分的にレプリケートされます。 OneLake のデータは、オープンソースの Delta Parquet 形式で格納され、Fabric のすべての分析エンジンで使用できます。 オープン アクセスでは、Azure Databricks、Azure HDInsight などのさまざまな Azure サービスで使用できます。 OneLake は、分析ニーズに合わせてデータ資産を統合するのにも役立ちます。 ミラーリングされたデータは、Lakehouses、Warehouses、ショートカットなど、OneLake 内の他のデータと結合できます。 また、Azure SQL Database、Snowflake などの他のミラーリングされたデータベース ソースと Azure Cosmos DB データを結合することもできます。 OneLake にミラーリングされた Azure Cosmos DB コレクションやデータベース間でクエリを実行できます。

Fabric のミラーリングを使用すると、複数のベンダーの異なるサービスをまとめる必要はありません。 代わりに、分析のニーズを簡素化するように設計された、高度に統合された、エンドツーエンドで使いやすい製品をお楽しみいただけます。 T-SQL を使用して、複雑な集計クエリと Spark を実行してデータ探索を行うことができます。 ノートブック内のデータにシームレスにアクセスし、データ サイエンスを使用して機械学習モデルを構築し、高度な Copilot 統合を利用した Direct Lake で Power BI レポートを構築できます。

Microsoft Fabric での Azure Cosmos DB のミラーリングを表す図。

Azure Cosmos DB の運用データに関する分析を探しているならば、ミラーリングでは次のような特徴があります。

  • 要求ユニット (RU) の使用量に影響を与えることなく、Azure Cosmos DB データに対するコスト効率に優れた準リアルタイムのゼロ ETL 分析
  • Fabric OneLake にさまざまなソースからデータを取り込むのが容易。
  • V オーダーの最適化により、デルタ テーブルを処理する SQL エンジンのクエリ パフォーマンスが向上
  • ML/ノートブックとの緊密な統合により Spark エンジンのコールド スタート時間が向上
  • Power BI と Direct Lake および Copilot のワンクリック統合
  • GraphQL を使用してクエリとビューにアクセスするための高度なアプリ統合
  • Azure Databricks などの他のサービスとの間でアクセスを開く

ミラーリングを使い始めるには、ミラーリングのチュートリアルの概要を扱うページを参照してください。

Azure Synapse Link for Azure Cosmos DB は、Azure Cosmos DB と Azure Synapse Analytics の間の緊密でシームレスな統合が実現され、運用データでの準リアルタイムのゼロ ETL 分析が可能になります。 トランザクション データは分析ストアとシームレスに同期され、分析用に最適化された列形式でデータが格納されます。

Azure Synapse Analytics は、Azure Synapse Link を使用して、さらに移動することなく分析ストア内のこのデータにアクセスできます。 ビジネス アナリスト、データ エンジニア、データ サイエンティストは、ビジネス インテリジェンス、分析、機械学習のパイプラインをほぼリアルタイムで実行するために、Synapse Spark または Synapse SQL のどちらでも同じように使用できるようになりました。

次の図では、Azure Synapse Link と Azure Cosmos DB および Azure Synapse Analytics との統合を示します。

Azure Cosmos DB の Synapse Link の図。

重要

NoSql API のプレビューで Microsoft Fabric のミラーリングが利用できるようになりました。 この機能により、Azure Synapse Link のすべての機能に優れた分析パフォーマンスが提供され、データ資産を Fabric OneLake と統合し、Delta Parquet 形式の OneLake でデータへのアクセスを開く機能が提供されます。 Azure Synapse Link を検討している場合は、ミラーリングを試して、組織への全体的な適合性を評価することをお勧めします。 ミラーリングを開始するには、ここをクリックします。

Azure Synapse Link の使用を開始するには、「Azure Synapse Link の使用を開始する」を参照してください。

Azure Cosmos DB のリアルタイム分析と BI: その他のオプション

Azure Cosmos DB データでリアルタイム分析を行えるオプションが、他にもいくつかあります。

これらのオプションはあらゆるケースを網羅するために含まれており、リアルタイムでの単一パーティション クエリで適切に動作しますが、これらのメソッドには分析クエリに関して次の課題があります。

  • ワークロードにおけるパフォーマンスの影響:

    分析クエリは複雑になり、大量のコンピューティング容量を消費する傾向があります。 これらのクエリを Azure Cosmos DB データに対して直接実行すると、トランザクション クエリのパフォーマンスが低下する可能性があります。

  • コストの影響:

    分析クエリをデータベースまたはコレクションに対して直接実行すると、分析クエリが複雑になり、より多くの計算能力が必要になる傾向があるため、より多くの要求ユニットを割り当てる必要が生じます。 集計クエリを実行する場合、RU の使用量が増加すると、時間の経過とともにコストに大きな影響を与える可能性があります。

これらのオプションの代わりに、Microsoft Fabric または Azure Synapse Link でミラーリングを使用することをお勧めします。これにより、トランザクション ワークロードのパフォーマンスや要求ユニットに影響を与えずに、ゼロ ETL 分析を行えます。