Condividi tramite


Configurare Azure Cosmos DB for MongoDB in un'attività di copia

Questo articolo descrive come utilizzare l'attività di copia nelle pipeline di dati per copiare dati da e verso Azure Cosmos DB for MongoDB.

Configurazione supportata

Per la configurazione di ogni scheda nell'attività di copia, consultare rispettivamente le sezioni seguenti.

Generali

Consultare la guida sulle Impostazioni generali per configurare la scheda Impostazioni generali.

Origine

Passare alla scheda Origine per configurare l'origine dell'attività di copia. Per la configurazione dettagliata, vedere il contenuto seguente.

Screenshot che mostra la scheda origine e l'elenco delle proprietà.

Sono richieste le seguenti proprietà:

  • Connessione: selezionare una connessione di Azure Cosmos DB per MongoDB dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione di Azure Cosmos DB for MongoDB selezionando Altro nella parte inferiore dell'elenco di connessioni.
  • Database: selezionare il database dall'elenco a discesa.
  • Nome della raccolta: specificare il nome della raccolta di Azure Cosmos DB. Selezionare una raccolta dall'elenco a discesa.

In Avanzato è possibile specificare i seguenti campi:

  • Filtro: specificare il filtro di selezione utilizzando operatori di query. Per restituire tutti i documenti in una raccolta, omettere questo parametro o passare un documento vuoto ({}).
  • Metodi di cursore: selezionare + Nuovo per specificare la modalità di esecuzione della query sottostante. I modi per eseguire la query sono:
    • progetto: specificare i campi da restituire nei documenti per la proiezione. Per restituire tutti i campi nei documenti corrispondenti, omettere questo parametro.
    • ordina: specificare l'ordine in cui la query restituisce i documenti corrispondenti. Per ulteriori informazioni, vedere cursor.sort().
    • limita: specificare il numero massimo di documenti restituiti dal server. Per ulteriori informazioni, vedere cursor.limit().
    • salta: specificare il numero di documenti da ignorare e la posizione da cui MongoDB inizia a restituire i risultati. Per altre informazioni, vedere cursor.skip().
  • Dimensione batch: specificare il numero di documenti da restituire in ogni batch di risposta dall'istanza di MongoDB. Nella maggior parte dei casi, la modifica della dimensione del batch non influisce sull'utente o sull'applicazione. Il limite massimo di Azure Cosmos DB per ogni batch è di 40 MB, che corrisponde alla somma delle dimensioni del numero di documenti definiti in Dimensione batch. Diminuire questo valore se si hanno documenti di grandi dimensioni. Il valore predefinito è 100.
  • Colonne aggiuntive: aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. Per quest'ultimo è supportata l'espressione.

Destinazione

Passare alla scheda Destinazione per configurare la destinazione dell'attività di copia. Per la configurazione dettagliata, vedere il contenuto seguente.

Screenshot che mostra la scheda di destinazione e l'elenco delle proprietà.

Sono richieste le seguenti proprietà:

  • Connessione: selezionare una connessione di Azure Cosmos DB per MongoDB dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione di Azure Cosmos DB for MongoDB selezionando Altro nella parte inferiore dell'elenco di connessioni.
  • Database: selezionare il database dall'elenco a discesa.
  • Nome della raccolta: specificare il nome della raccolta di Azure Cosmos DB. Selezionare una raccolta dall'elenco a discesa.

In Avanzato è possibile specificare i seguenti campi:

  • Comportamento di scrittura: descrivere come scrivere dati in Azure Cosmos DB for MongoDB. Valori consentiti: Insert e Upsert.

    Il comportamento di Upsert il comportamento di upsert è quello di sostituire il documento se esiste già un documento con lo stesso _id; in caso contrario, inserisce il documento.

    Nota

    Il servizio genera automaticamente un _id per un documento se non è specificato un _id nel documento originale o tramite il mapping di colonna. È quindi necessario assicurarsi che il documento contenga un ID in modo che upsert funzioni come previsto.

  • Timeout batch di scrittura: specificare il tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. Il valore consentito è l'intervallo di tempo e il valore predefinito è 00:30:00 (30 minuti).

  • Dimensione batch di scrittura: questa proprietà controlla la dimensione dei documenti da scrivere in ogni batch. È possibile provare ad aumentare il valore per migliorare le prestazioni e a ridurre il valore se le dimensioni dei documenti sono troppo grandi. Il valore predefinito è 10.000.

Mapping

Per la configurazione della scheda Mapping, vedere Configurare i mapping nella scheda Mapping. Il mapping non è supportato quando sia l'origine che la destinazione sono dati gerarchici.

Impostazione

Per la configurazione della scheda Impostazioni, vedere Configurare le altre impostazioni nella scheda Impostazioni.

Riepilogo della tabella

La tabella seguente contiene altre informazioni sull'attività di copia in Azure Cosmos DB for MongoDB.

Informazioni sull'origine

Nome Descrizione valore Richiesto Proprietà dello script JSON
Connessione Connessione all'archivio dati di origine. < connessione di Azure Cosmos DB for MongoDB > connection
Database Il database usato come origine. < database > database
Nome raccolta Nome della raccolta di Azure Cosmos DB. < raccolta > collection
Filtra Il filtro di selezione che utilizza gli operatori di query. Per restituire tutti i documenti in una raccolta, omettere questo parametro o passare un documento vuoto ({}). < filtro di selezione > No filter
Metodi di cursore Modalità di esecuzione della query sottostante. progetto
ordina
limita
ignora
No cursorMethods:
• progetto
• ordina
• limita
• ignora
Dimensioni del batch Il numero di documenti da restituire in ogni batch di risposta dall'istanza di MongoDB. Nella maggior parte dei casi, la modifica della dimensione del batch non influisce sull'utente o sull'applicazione. Il limite massimo di Azure Cosmos DB per ogni batch è di 40 MB, che corrisponde alla somma delle dimensioni del numero di documenti definiti in Dimensione batch. Diminuire questo valore se si hanno documenti di grandi dimensioni. < dimensioni batch di scrittura >
(il valore predefinito è 100)
No batchSize
Colonne aggiuntive Aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. Per quest'ultimo è supportata l'espressione. • Name
• Valore
No additionalColumns:
• nome
• valore

Informazioni sulla destinazione

Nome Descrizione valore Richiesto Proprietà dello script JSON
Connessione Connessione all'archivio dati di destinazione. < connessione di Azure Cosmos DB for MongoDB > connection
Database Database usato come destinazione. < database > database
Nome raccolta Nome della raccolta di Azure Cosmos DB. < raccolta > collection
Comportamento di scrittura Descrive come scrivere i dati in Azure Cosmos DB for MongoDB. Valori consentiti: Insert e Upsert.

Il comportamento di Upsert il comportamento di upsert è quello di sostituire il documento se esiste già un documento con lo stesso _id; in caso contrario, inserisce il documento.

Nota: il servizio genera automaticamente un _id per un documento se non è specificato un _id nel documento originale o tramite il mapping di colonna. È quindi necessario assicurarsi che il documento contenga un ID in modo che upsert funzioni come previsto.
Inserit (impostazione predefinita)
Upsert
No writeBehavior:
• insert
• upsert
Timeout del batch di scrittura Tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. timespan
(il valore predefinito è 00:30:00 - 30 minuti)
No writeBatchTimeout
Dimensione del batch di scrittura Controlla le dimensioni dei documenti da scrivere in ogni batch. È possibile provare ad aumentare questo valore per migliorare le prestazioni e a ridurre il valore se le dimensioni dei documenti sono troppo grandi. < dimensioni batch di scrittura >
(il valore predefinito è 10.000)
No writeBatchSize