Configurare Azure Cosmos DB for NoSQL in un'attività di copia
Questo articolo descrive come utilizzare l'attività di copia in una pipeline di dati per copiare dati da e verso Azure Cosmos DB for NoSQL.
Configurazione supportata
Per la configurazione di ogni scheda nell'attività di copia, consultare rispettivamente le sezioni seguenti.
Generali
Consultare la guida sulle Impostazioni generali per configurare la scheda Impostazioni generali.
Origine
Le proprietà seguenti sono supportate per Azure Cosmos DB for NoSQL nella scheda Origine di un'attività di copia.
Le seguenti tre proprietà sono obbligatorie:
- Tipo di archivio dati: selezionare Esterno.
- Connessione: selezionare una connessione Azure Cosmos DB for NoSQL dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione di Azure Cosmos DB for NoSQL selezionando Nuovo.
- Contenitore: selezionare il contenitore da usare. Selezionare Modifica per immettere manualmente il nome del contenitore.
In Avanzato è possibile specificare i seguenti campi:
Usa la query: è possibile scegliere Tabella o Query come query da utilizzare. L'elenco seguente descrive la configurazione di ogni impostazione.
Tabella: leggere i dati dalla tabella specificata in Tabella.
Query: specificare la query Azure Cosmos DB per leggere i dati.
Dimensioni pagina: numero di documenti per pagina del risultato della query. Il valore predefinito è "-1" che indica l'uso delle dimensioni di pagina dinamiche sul lato servizio fino a 1000.
Rileva datetime: indica se rilevare datetime dai valori stringa nei documenti. I valori consentiti sono: true (predefinito), false.
Aree preferite: elenco preferito di aree a cui connettersi durante il recupero dei dati da Azure Cosmos DB. Selezionare un'area preferita dall'elenco a discesa dopo aver selezionato Nuovo.
Colonne aggiuntive: aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. Per quest'ultimo è supportata l'espressione. Per altre informazioni, vedere Aggiungere altre colonne durante la copia.
Destinazione
Le proprietà seguenti sono supportate per Azure Cosmos DB for NoSQL nella scheda Destinazione di un'attività di copia.
Le seguenti tre proprietà sono obbligatorie:
- Tipo di archivio dati: selezionare Esterno.
- Connessione: selezionare una connessione Azure Cosmos DB for NoSQL dall'elenco delle connessioni.
- Contenitore: selezionare Sfoglia per scegliere il file da copiare o compilare manualmente il percorso.
In Avanzato è possibile specificare i seguenti campi:
Comportamento scrittura: definisce il comportamento di scrittura quando la destinazione è costituita da file di un archivio dati basato su file. È possibile scegliere Aggiungi contenuto dinamico, Insert o Upsert dall'elenco a discesa.
Aggiungi contenuto dinamico: aprire il riquadro Aggiungi contenuto dinamico. Questo apre il Generatore di espressioni in cui è possibile generare espressioni dalle variabili di sistema supportate, dall'output delle attività, dalle funzioni e da variabili o parametri specificati dall'utente. Per informazioni sul linguaggio delle espressioni, vedere Espressioni e funzioni.
Insert: scegliere questa opzione se i dati di origine hanno inserimenti.
Upsert: il comportamento di upsert è quello di sostituire il documento se esiste già un documento con lo stesso ID; in caso contrario, inserisce il documento.
Timeout batch di scrittura: tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. I valori consentiti sono
Timespan
. Ad esempio "00:30:00" (30 minuti).Dimensione batch di scrittura: specificare il numero di righe da inserire nella tabella SQL per batch. Il valore consentito è un numero intero (numero di righe). Per impostazione predefinita, il servizio determina in modo dinamico le dimensioni appropriate del batch in base alle dimensioni della riga.
Numero massimo di connessioni simultanee: limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.
Disattiva l'analisi delle metriche delle prestazioni: questa impostazione controlla la raccolta di metriche, ad esempio DTU, DWU, UR e così via, al fine di ottimizzare le prestazioni di copia e i relativi consigli. Se questo comportamento suscita preoccupazione, disattivare questa funzionalità.
Mapping
Per la configurazione della scheda Mapping, vedere Configurare i mapping nella scheda Mapping.
Impostazione
Per la configurazione della scheda Impostazioni, vedere Configurare le altre impostazioni nella scheda Impostazioni.
Riepilogo della tabella
Le tabelle seguenti contengono altre informazioni sull'attività di copia in Azure Cosmos DB for NoSQL.
Tabella di origine
Nome | Descrizione | valore | Richiesto | Proprietà dello script JSON |
---|---|---|---|---|
Tipo di archivio dati | Tipo di archivio dati. | Esterno | Sì | / |
Connessione | Connessione all'archivio dati di origine. | <connessione personale> | Sì | connection |
Contenitore | Il contenitore dei dati di origine. | <contenitore dell'origine> | Sì | contenitore fileName |
Usa query | È possibile scegliere Tabella o Query come query da utilizzare. | • Tabella • Query |
No | type |
Dimensioni della pagina | Numero di documenti per pagina del risultato della query. Il valore predefinito è "-1" che indica l'uso delle dimensioni di pagina dinamiche sul lato servizio fino a 1000. | <dimensioni della pagina> | No | pageSize |
Eliminare datetime | I file nell'archivio dati di origine verranno eliminati subito dopo essere stati spostati nell'archivio di destinazione. L'eliminazione dei file avviene per file, quindi quando l'attività di copia fallisce, si vedranno alcuni file già copiati nella destinazione ed eliminati dall'origine, mentre altri rimangono ancora nell'archivio di origine. | Selezionare o deselezionare | No | detectDatetime |
Aree preferite | Elenco preferito di aree a cui connettersi durante il recupero dei dati da Azure Cosmos DB. Selezionare un'area preferita dall'elenco a discesa dopo aver selezionato Nuovo. | <aree preferite> | No | preferredRegions |
Colonne aggiuntive | Aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. Per quest'ultimo è supportata l'espressione. Per altre informazioni, vedere Aggiungere altre colonne durante la copia. | <numero massimo di connessioni simultanee> | No | additionalColumns |
Tabella di destinazione
Nome | Descrizione | valore | Richiesto | Proprietà dello script JSON |
---|---|---|---|---|
Tipo di archivio dati | Tipo di archivio dati. | Esterno | Sì | / |
Connessione | Connessione all'archivio dati di destinazione. | <connessione personale> | Sì | connection |
Contenitore | Il contenitore dei dati di destinazione. | <contenitore dell'origine> | Sì | contenitore fileName |
Comportamento di scrittura | Descrive come scrivere i dati in Azure Cosmos DB. Valori consentiti: insert e upsert. Il comportamento di upsert consiste nella sostituzione del documento se esiste già un documento con lo stesso ID. In caso contrario, il documento viene inserito. | • Aggiungi contenuto dinamico • Insert • Upsert |
No | writeBehavior |
Timeout del batch di scrittura | Tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. I valori consentiti sono intervalli di tempo. Ad esempio "00:30:00" (30 minuti). | timespan | No | writeBatchTimeout |
Dimensione del batch di scrittura | Numero di righe da inserire nella tabella SQL per batch. Il valore consentito è integer (numero di righe). Per impostazione predefinita, il servizio determina in modo dinamico le dimensioni appropriate del batch in base alle dimensioni della riga. | <numero di righe > (intero) |
No | writeBatchSize |
Numero massimo di connessioni simultanee | Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. | <numero massimo di connessioni simultanee> | No | maxConcurrentConnections |
Disattiva l'analisi delle metriche delle prestazioni | Questa impostazione controlla la raccolta di metriche, ad esempio DTU, DWU, UR e così via, per ottimizzare le prestazioni di copia e i relativi consigli. Se questo comportamento suscita preoccupazione, disattivare questa funzionalità. | Selezionare o deselezionare | No | disableMetricsCollection |