はじめに
数多くの組織が膨大な量のデータを扱います。 多くの場合、このビッグ データは生の状態で整理されておらず、リレーショナル、非リレーショナル、その他のストレージ システムなど、さまざまな場所に格納されています。 これらの組織の大きな課題は、このビッグ データに秩序をもたらし、それを実用的なビジネスの分析情報に精製することです。
Microsoft Azure Data Factory は、未整理のデータから実用的なビジネス分析情報を作成するために使用できるマネージド クラウド サービスです。 複雑でハイブリッドの抽出、変換、読み込み (ETL)、抽出、読み込み、変換、データ統合プロジェクトを管理するのに役立ちます。
シナリオ例
あなたはゲーム会社で働いていて、ゲームのセッション中に生成されるデータ ログを収集するとします。 このログ データを分析することができれば、顧客の好み、ターゲット層、利用行動に関する分析情報を得ることができます。 営業チームのメンバーは、アップセルとクロスセルの商機に関心を示しており、これらのデータ ログに有用な情報が含まれているのではないかと考えています。 開発および技術チームは、ゲーム エクスペリエンスに関する潜在的な問題と、それらの問題の解決に新しい機能がどのように役立つのかについて学習することに関心があります。
問題は、ログ内のデータを正常に分析するには、オンプレミスの場所に格納されているデータも参照する必要があることです。 このデータには、顧客情報、ゲーム情報、マーケティング キャンペーン情報が含まれています。 あなたの会社では、ゲーム ログ データをクラウド データ ストアに格納していますが、オンプレミス データについてもすべて使用したいと考えています。
データ分析を進めるための重要なステップは、オンプレミスのデータをゲーム ログからの他のデータに結合することです。 計画では、この結合データを Azure Analysis Services を使用して処理します。 次に、変換されたデータをクラウド データ ウェアハウスに公開し、Power BI などのツールを使用して視覚化します。 Azure Data Factory は、この目標を達成するのに役立ちます。
ここでの内容
このモジュールでは、Azure Data Factory を使用してビッグ データを調整する方法について説明します。 Azure Data Factory がデータ ソースの統合に役立つかどうかを評価します。 また、Azure Data Factory を使って、オンプレミス、マルチクラウド、およびサービスとしてのソフトウェア (SaaS) のデータ ソースからデータを取り込む方法についても学びます。
主な目標
このモジュールを終了すると、さまざまなデータ ストアからデータを取り込むデータ ドリブン ワークフローを作成およびスケジュールするために Azure Data Factory を役立てる方法についての知識が深まります。 Azure Data Factory が、複雑な ETL プロセスを構築して、このデータをコンピューティング サービスやデータ フローを使って視覚的に変換するのに役立つかどうかを評価します。