データのコピー アクティビティを使用する

完了

データのコピー アクティビティは、データ パイプラインの最も一般的な用途の 1 つです。 多くのパイプラインは、外部ソースからレイクハウス ファイルまたはテーブルにデータを取り込むのに使用される単一のデータのコピー アクティビティで構成されています。

データのコピー アクティビティを他のアクティビティと組み合わせて、反復可能なデータ インジェスト プロセスを作成することもできます。たとえば、データの削除アクティビティを使用して既存のデータを削除し、データのコピー アクティビティを使用して削除されたデータを外部ソースのデータを含むファイルに置き換え、ノートブック アクティビティを使用してファイル内のデータを変換し、テーブルに読み込む Spark コードを実行します。

データ コピー ツール

Microsoft Fabric のデータのコピー ツールのスクリーンショット。

パイプラインにデータのコピー アクティビティを追加すると、グラフィカル ツールによって、コピー操作用にデータのソースとターゲットを構成するために必要な手順が示されます。 さまざまなソース接続がサポートされているため、最も一般的なソースからデータを取り込むことができます。 OneLake では、レイクハウス、ウェアハウス、SQL Database などのサポートが含まれます。

Microsoft Fabric における SQL Database のサポートを示すデータ コピー ツールのスクリーンショット。

データのコピー アクティビティの設定

パイプラインにデータのコピー アクティビティを追加した後、それをパイプライン キャンバスで選択し、その設定を下のペインで編集できます。

Microsoft Fabric のデータのコピー アクティビティのスクリーンショット。

データのコピー アクティビティを使用するタイミング

変換を適用せずにサポートされているソースとターゲットの間でデータを直接コピーする必要がある場合、または生データをインポートして後のパイプライン アクティビティで変換を適用する場合は、データのコピー アクティビティを使用します。

取り込まれたデータに変換を適用する必要がある場合、または複数のソースからデータをマージする必要がある場合は、データ フロー アクティビティを使用してデータフロー (Gen2) を実行することを検討してください。 Power Query ユーザー インターフェイスを使用して、複数の変換ステップを含むデータフロー (Gen2) を定義し、それをパイプラインに含めることができます。

ヒント

データを取り込むための Microsoft Fabric のデータフロー (Gen2) についてさらに学ぶために、「Microsoft Fabric でデータフロー Gen2 を使用してデータを取り込む」モジュールを完了することを検討してください。