Copy アクティビティで Azure AI Search を構成する
この記事では、データ パイプラインの Copy アクティビティを使用して Azure AI Search にデータをコピーする方法について説明します。
サポートされている構成
Copy アクティビティの下の各タブの構成については、それぞれ次のセクションを参照してください。
全般
[全般設定] タブを構成するには、全般設定のガイダンスを参照してください。
宛先
コピー アクティビティの [コピー先] タブの Azure AI Search の、次のプロパティがサポートされています。
次のプロパティは必須です。
- 接続: 接続リストから Azure AI Search データベース接続を選択します。 接続が存在しない場合は、[新規] を選択して新しい Azure AI Search 接続を作成します。
- インデックス名: 検索インデックス名を選択します。 サービスでは、インデックスは作成されません。 Azure AI Search にこのインデックスが存在する必要があります。
[詳細設定] では、次のフィールドを指定できます。
インデックス アクション: ドキュメントがそのインデックスに既に存在する場合に、マージするか置換するかを指定します。 [マージ] または [アップロード] を選択することができます。
マージ: 新しいドキュメントのすべての列を既存の列と結合します。 既存のドキュメントがない場合は、新しいドキュメントは、新しいドキュメントとしてインデックスにアップロードされます。
アップロード: 既存のドキュメントが新しいドキュメントで置き換えられます。 既存のドキュメントがない場合は、新しいドキュメントは、新しいドキュメントとしてインデックスにアップロードされます。
書き込みバッチ サイズ: バッファー サイズが指定された書き込みバッチ サイズに達すると、データが検索インデックスにアップロードされます。 使用できる値は、1 から 1,000 までの整数で、既定値は 1000 です。
Azure AI Search サービスでは、バッチとしてのドキュメントの書き込みをサポートしています。 バッチには、1 ~ 1,000 のアクションを含めることができます。 1 つのアクションで、1 つのドキュメントのアップロード/マージ操作の実行を処理します。最大コンカレント接続数: アクティビティの実行中にデータ ストアに対して確立できるコンカレント接続数の上限を指定します。 コンカレント接続を制限する場合にのみ、値を指定します。
マッピング
[マッピング] タブの構成については、「[マッピング] タブでマッピングを構成する」をご覧ください。
設定
[設定] タブの構成については、「[設定] タブで他の設定を構成する」を参照してください。
表の概要
次の表に、Azure AI Search のコピー アクティビティの詳細を示します。
コピー先の情報
名前 | Description | Value | 必須 | JSON スクリプト プロパティ |
---|---|---|---|---|
接続 | コピー先データ ストアへの接続。 | <Azure AI Search 接続> | はい | connection |
[インデックス名] | 検索インデックスの名前。 サービスでは、インデックスは作成されません。 Azure AI Search にこのインデックスが存在する必要があります。 | < お使いの検索インデックス名 > | はい | indexName |
インデックス アクション | ドキュメントがそのインデックスに既に存在する場合に、マージするか置換するかを指定します。 使用可能な値: マージ (既定値) および アップロード。 |
• マージ • アップロード |
いいえ | indexAction: • マージ • アップロード |
[Write batch size](書き込みバッチ サイズ) | バッファー サイズが指定された書き込みバッチサイズに達すると、検索インデックスにデータがアップロードされます。 | 整数 1 から 1,000 既定値は 1000 です。 |
いいえ | writeBatchSize |
最大コンカレント接続数 | アクティビティの実行中にデータ ストアに対して確立されたコンカレント接続数の上限。 | <コンカレント接続数の上限> (整数) |
いいえ | maxConcurrentConnections |