Condividi tramite


Configurare Azure Cosmos DB for NoSQL in un'attività di copia

Questo articolo descrive come utilizzare l'attività di copia in una pipeline di dati per copiare dati da e verso Azure Cosmos DB for NoSQL.

Configurazione supportata

Per la configurazione di ogni scheda nell'attività di copia, consultare rispettivamente le sezioni seguenti.

Generali

Consultare la guida sulle Impostazioni generali per configurare la scheda Impostazioni generali.

Origine

Le proprietà seguenti sono supportate per Azure Cosmos DB for NoSQL nella scheda Origine di un'attività di copia.

Screenshot che mostra la scheda origine.

Le seguenti tre proprietà sono obbligatorie:

  • Tipo di archivio dati: selezionare Esterno.
  • Connessione: selezionare una connessione Azure Cosmos DB for NoSQL dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione di Azure Cosmos DB for NoSQL selezionando Nuovo.
  • Contenitore: selezionare il contenitore da usare. Selezionare Modifica per immettere manualmente il nome del contenitore.

In Avanzato è possibile specificare i seguenti campi:

  • Usa la query: è possibile scegliere Tabella o Query come query da utilizzare. L'elenco seguente descrive la configurazione di ogni impostazione.

    • Tabella: leggere i dati dalla tabella specificata in Tabella.

    • Query: specificare la query Azure Cosmos DB per leggere i dati.

      Screenshot che mostra la query.

  • Dimensioni pagina: numero di documenti per pagina del risultato della query. Il valore predefinito è "-1" che indica l'uso delle dimensioni di pagina dinamiche sul lato servizio fino a 1000.

  • Rileva datetime: indica se rilevare datetime dai valori stringa nei documenti. I valori consentiti sono: true (predefinito), false.

  • Aree preferite: elenco preferito di aree a cui connettersi durante il recupero dei dati da Azure Cosmos DB. Selezionare un'area preferita dall'elenco a discesa dopo aver selezionato Nuovo.

    Screenshot che mostra le aree preferite.

  • Colonne aggiuntive: aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. Per quest'ultimo è supportata l'espressione. Per altre informazioni, vedere Aggiungere altre colonne durante la copia.

    Screenshot che mostra colonne aggiuntive.

Destinazione

Le proprietà seguenti sono supportate per Azure Cosmos DB for NoSQL nella scheda Destinazione di un'attività di copia.

Screenshot che mostra la scheda Destinazione.

Le seguenti tre proprietà sono obbligatorie:

  • Tipo di archivio dati: selezionare Esterno.
  • Connessione: selezionare una connessione Azure Cosmos DB for NoSQL dall'elenco delle connessioni.
  • Contenitore: selezionare Sfoglia per scegliere il file da copiare o compilare manualmente il percorso.

In Avanzato è possibile specificare i seguenti campi:

  • Comportamento scrittura: definisce il comportamento di scrittura quando la destinazione è costituita da file di un archivio dati basato su file. È possibile scegliere Aggiungi contenuto dinamico, Insert o Upsert dall'elenco a discesa.

    • Aggiungi contenuto dinamico: aprire il riquadro Aggiungi contenuto dinamico. Questo apre il Generatore di espressioni in cui è possibile generare espressioni dalle variabili di sistema supportate, dall'output delle attività, dalle funzioni e da variabili o parametri specificati dall'utente. Per informazioni sul linguaggio delle espressioni, vedere Espressioni e funzioni.

    • Insert: scegliere questa opzione se i dati di origine hanno inserimenti.

    • Upsert: il comportamento di upsert è quello di sostituire il documento se esiste già un documento con lo stesso ID; in caso contrario, inserisce il documento.

      Screenshot che mostra il comportamento di scrittura.

  • Timeout batch di scrittura: tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. I valori consentiti sono Timespan. Ad esempio "00:30:00" (30 minuti).

  • Dimensione batch di scrittura: specificare il numero di righe da inserire nella tabella SQL per batch. Il valore consentito è un numero intero (numero di righe). Per impostazione predefinita, il servizio determina in modo dinamico le dimensioni appropriate del batch in base alle dimensioni della riga.

  • Numero massimo di connessioni simultanee: limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.

  • Disattiva l'analisi delle metriche delle prestazioni: questa impostazione controlla la raccolta di metriche, ad esempio DTU, DWU, UR e così via, al fine di ottimizzare le prestazioni di copia e i relativi consigli. Se questo comportamento suscita preoccupazione, disattivare questa funzionalità.

Mapping

Per la configurazione della scheda Mapping, vedere Configurare i mapping nella scheda Mapping.

Impostazione

Per la configurazione della scheda Impostazioni, vedere Configurare le altre impostazioni nella scheda Impostazioni.

Riepilogo della tabella

Le tabelle seguenti contengono altre informazioni sull'attività di copia in Azure Cosmos DB for NoSQL.

Tabella di origine

Nome Descrizione valore Richiesto Proprietà dello script JSON
Tipo di archivio dati Tipo di archivio dati. Esterno /
Connessione Connessione all'archivio dati di origine. <connessione personale> connection
Contenitore Il contenitore dei dati di origine. <contenitore dell'origine> contenitore
fileName
Usa query È possibile scegliere Tabella o Query come query da utilizzare. Tabella
Query
No type
Dimensioni della pagina Numero di documenti per pagina del risultato della query. Il valore predefinito è "-1" che indica l'uso delle dimensioni di pagina dinamiche sul lato servizio fino a 1000. <dimensioni della pagina> No pageSize
Eliminare datetime I file nell'archivio dati di origine verranno eliminati subito dopo essere stati spostati nell'archivio di destinazione. L'eliminazione dei file avviene per file, quindi quando l'attività di copia fallisce, si vedranno alcuni file già copiati nella destinazione ed eliminati dall'origine, mentre altri rimangono ancora nell'archivio di origine. Selezionare o deselezionare No detectDatetime
Aree preferite Elenco preferito di aree a cui connettersi durante il recupero dei dati da Azure Cosmos DB. Selezionare un'area preferita dall'elenco a discesa dopo aver selezionato Nuovo. <aree preferite> No preferredRegions
Colonne aggiuntive Aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. Per quest'ultimo è supportata l'espressione. Per altre informazioni, vedere Aggiungere altre colonne durante la copia. <numero massimo di connessioni simultanee> No additionalColumns

Tabella di destinazione

Nome Descrizione valore Richiesto Proprietà dello script JSON
Tipo di archivio dati Tipo di archivio dati. Esterno /
Connessione Connessione all'archivio dati di destinazione. <connessione personale> connection
Contenitore Il contenitore dei dati di destinazione. <contenitore dell'origine> contenitore
fileName
Comportamento di scrittura Descrive come scrivere i dati in Azure Cosmos DB. Valori consentiti: insert e upsert. Il comportamento di upsert consiste nella sostituzione del documento se esiste già un documento con lo stesso ID. In caso contrario, il documento viene inserito. Aggiungi contenuto dinamico
Insert
Upsert
No writeBehavior
Timeout del batch di scrittura Tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. I valori consentiti sono intervalli di tempo. Ad esempio "00:30:00" (30 minuti). timespan No writeBatchTimeout
Dimensione del batch di scrittura Numero di righe da inserire nella tabella SQL per batch. Il valore consentito è integer (numero di righe). Per impostazione predefinita, il servizio determina in modo dinamico le dimensioni appropriate del batch in base alle dimensioni della riga. <numero di righe >
(intero)
No writeBatchSize
Numero massimo di connessioni simultanee Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. <numero massimo di connessioni simultanee> No maxConcurrentConnections
Disattiva l'analisi delle metriche delle prestazioni Questa impostazione controlla la raccolta di metriche, ad esempio DTU, DWU, UR e così via, per ottimizzare le prestazioni di copia e i relativi consigli. Se questo comportamento suscita preoccupazione, disattivare questa funzionalità. Selezionare o deselezionare No disableMetricsCollection