データのコピー アクティビティを使用する
データのコピー アクティビティは、データ パイプラインの最も一般的な用途の 1 つです。 多くのパイプラインは、外部ソースからレイクハウス ファイルまたはテーブルにデータを取り込むのに使用される単一のデータのコピー アクティビティで構成されています。
データのコピー アクティビティを他のアクティビティと組み合わせて、反復可能なデータ インジェスト プロセスを作成することもできます。たとえば、データの削除アクティビティを使用して既存のデータを削除し、データのコピー アクティビティを使用して削除されたデータを外部ソースのデータを含むファイルに置き換え、ノートブック アクティビティを使用してファイル内のデータを変換し、テーブルに読み込む Spark コードを実行します。
データ コピー ツール
パイプラインにデータのコピー アクティビティを追加すると、グラフィカル ツールによって、コピー操作用にデータのソースとターゲットを構成するために必要な手順が示されます。 さまざまなソース接続がサポートされているため、最も一般的なソースからデータを取り込むことができます。 OneLake では、レイクハウス、ウェアハウス、SQL Database などのサポートが含まれます。
データのコピー アクティビティの設定
パイプラインにデータのコピー アクティビティを追加した後、それをパイプライン キャンバスで選択し、その設定を下のペインで編集できます。
データのコピー アクティビティを使用するタイミング
変換を適用せずにサポートされているソースとターゲットの間でデータを直接コピーする必要がある場合、または生データをインポートして後のパイプライン アクティビティで変換を適用する場合は、データのコピー アクティビティを使用します。
取り込まれたデータに変換を適用する必要がある場合、または複数のソースからデータをマージする必要がある場合は、データ フロー アクティビティを使用してデータフロー (Gen2) を実行することを検討してください。 Power Query ユーザー インターフェイスを使用して、複数の変換ステップを含むデータフロー (Gen2) を定義し、それをパイプラインに含めることができます。
ヒント
データを取り込むための Microsoft Fabric のデータフロー (Gen2) についてさらに学ぶために、「Microsoft Fabric でデータフロー Gen2 を使用してデータを取り込む」モジュールを完了することを検討してください。