Configurer Azure Cosmos DB for NoSQL dans une activité de copie
Cet article explique comment utiliser l'activité de copie dans un pipeline de données pour copier des données depuis et vers Azure Cosmos DB for NoSQL.
Configuration prise en charge
Pour la configuration de chaque onglet sous l’activité de copie, accédez respectivement aux sections suivantes.
Général
Reportez-vous aux instructions relatives aux paramètres Général pour configurer l’onglet Paramètres Général .
Source
Les propriétés suivantes sont prises en charge pour Azure Cosmos DB for NoSQL sous l’onglet Source d’une activité de copie.
Les trois propriétés suivantes sont requises :
- Type de magasin de données : sélectionnez Externe.
- Connexion : sélectionnez une connexion Azure Cosmos DB for NoSQL dans la liste des connexions. Si aucune connexion n’existe, créez une connexion Azure Cosmos DB for NoSQL en sélectionnant Nouveau.
- Conteneur : sélectionnez le conteneur que vous souhaitez utiliser. Sélectionnez Modifier pour entrer le nom du conteneur manuellement.
Sous Avancé, vous pouvez spécifier les champs suivants :
Utiliser une requête : vous pouvez choisir Table ou Requête comme requête d’utilisation. La liste suivante décrit la configuration de chaque paramètre :
Table : lit les données de la table que vous avez spécifiée dans Table.
Requête : Spécifiez la requête Azure Cosmos DB pour lire les données.
Taille de la page : nombre de documents par page du résultat de la requête. La valeur par défaut est « -1 », qui utilise la page dynamique côté service jusqu’à 1 000.
Détecter la DateHeure : Indique s'il faut détecter la date/heure à partir des valeurs de chaîne dans les documents. Valeurs autorisées : true (par défaut) et false.
Régions préférées : Liste des régions préférées auxquelles se connecter lors de la récupération des données d’Azure Cosmos DB. Sélectionnez une région par défaut dans la liste déroulante après avoir sélectionné Nouveau.
Colonnes supplémentaires : ajoutez des colonnes de données supplémentaires au chemin d’accès relatif ou à la valeur statique des fichiers sources du magasin. L’expression est prise en charge pour ce dernier. Pour plus d’informations, accédez à Ajouter des colonnes supplémentaires pendant la copie.
Destination
Les propriétés suivantes sont prises en charge pour Azure Cosmos DB for NoSQL sous l’onglet Destination d’une activité de copie.
Les trois propriétés suivantes sont requises :
- Type de magasin de données : sélectionnez Externe.
- Connexion : sélectionnez une connexion Azure Cosmos DB for NoSQL dans la liste des connexions.
- Conteneur : sélectionnez Parcourir pour choisir le fichier que vous souhaitez copier, ou renseignez-le manuellement.
Sous Avancé, vous pouvez spécifier les champs suivants :
Comportement d’écriture :Définit le comportement d’écriture lorsque la destination est constituée de fichiers d’une banque de données basée sur un fichier. Vous pouvez choisir Ajouter du contenu dynamique, Insérer ou Upsert dans la liste déroulante.
Ajouter du contenu dynamique : ouvrez le volet Ajouter du contenu dynamique. Vous ouvrez ainsi le générateur d’expressions, où vous pouvez générer des expressions à partir des variables système prises en charge, de la sortie de l’activité, des fonctions et des variables ou paramètres spécifiés par l’utilisateur. Pour plus d’informations sur le langage d’expression, accédez à Expressions et fonctions.
Insérer : choisissez cette option si vos données sources ont des insertions.
Upsert : Le comportement de la valeur upsert consiste à remplacer le document si un document portant le même identificateur existe déjà ; sinon, le document est inséré.
Écrire le délai d’expiration du lot : Le temps d’attente pour que l’opération d’insertion par lot se termine avant qu’elle ne soit interrompue Les valeur autorisées sont
Timespan
. Exemple : 00:30:00 (30 minutes).Taille de lot d’écriture : spécifiez le nombre de lignes à insérer dans la table SQL par lot. La valeur autorisée est un intègre (nombre de lignes). Par défaut, le service détermine de façon dynamique la taille de lot appropriée selon la taille de ligne.
Nombre maximal de connexions simultanées : la limite supérieure de connexions simultanées établies au magasin de données pendant l’exécution de l’activité. Spécifiez une valeur uniquement lorsque vous souhaitez limiter les connexions simultanées.
Désactiver l’analytique des métriques de performances : ce paramètre contrôle la collection des métriques, telles que DTU, DWU, RU, etc., pour l’optimisation des performances de copie et les recommandations. Si ce comportement vous intéresse, désactivez cette fonctionnalité.
Mappage
Pour la configuration de l’onglet Mappage, accédez à Configurer vos mappages sous l’onglet Mappage.
Paramètres
Pour la configuration de l’onglet Paramètres, accédez à Configurer vos autres paramètres sous l’onglet Paramètres.
Résumé de la table
Les tableaux suivants contiennent plus d’informations sur l’activité de copie dans Azure Cosmos DB for NoSQL.
Table source
Nom | Description | Valeur | Obligatoire | Propriété de script JSON |
---|---|---|---|---|
Type de banque de données | Votre type de magasin de données. | Externe | Oui | / |
Connection | Votre connexion au magasin de données source. | <votre connexion> | Oui | connection |
Conteneur | Conteneur de vos données sources. | <conteneur de vos données sources> | Oui | conteneur fileName |
Utiliser la requête | Vous pouvez choisir Table ou Requête comme requête d’utilisation. | Table • Requête |
Non | type |
Taille de page | nombre de documents par page du résultat de la requête. La valeur par défaut est « -1 », qui utilise la page dynamique côté service jusqu’à 1 000. | <taille de votre page> | Non | pageSize |
Supprimer la dateHeure | Les fichiers du magasin de données source seront supprimés juste après avoir été déplacés vers le magasin de destination. La suppression des fichiers se fait par fichier, de sorte que lorsque la copie échoue, vous constaterez que certains fichiers ont déjà été copiés vers la destination et supprimés de la source, tandis que d'autres se trouvent encore sur le magasin source. | Sélectionné ou désélection | Non | detectDatetime |
Régions préférées | Liste des régions préférées auxquelles se connecter lors de la récupération des données d’Azure Cosmos DB. Sélectionnez une région par défaut dans la liste déroulante après avoir sélectionné Nouveau. | <vos régions préférées> | Non | preferredRegions |
Colonnes supplémentaires | Ajouter les colonnes de données supplémentaires pour stocker le chemin d’accès relatif ou la valeur statique des fichiers sources. L’expression est prise en charge pour ce dernier. Pour plus d’informations, accédez à Ajouter des colonnes supplémentaires pendant la copie. | <connexions simultanées maximales> | Non | additionalColumns |
Table de destination
Nom | Description | Valeur | Obligatoire | Propriété de script JSON |
---|---|---|---|---|
Type de banque de données | Votre type de magasin de données. | Externe | Oui | / |
Connection | Votre connexion au magasin de données de destination. | <votre connexion> | Oui | connection |
Conteneur | Conteneur de vos données de destination. | <conteneur de la source> | Oui | conteneur fileName |
Comportement d’écriture | Décrit comment écrire des données dans Azure Cosmos DB. Les valeurs autorisées sont insert et upsert. Le comportement de la valeur upsert consiste à remplacer le document si un document portant le même identificateur existe déjà ; sinon, le document est inséré. | Ajouter du contenu dynamique • Insérer • Upsert |
Non | writeBehavior |
Délai d’expiration du lot d’écriture | Temps d’attente pour que l’opération d’insertion par lot se termine avant qu’elle ne soit interrompue.Les valeurs autorisées sont la plage horaire. Exemple : 00:30:00 (30 minutes). | intervalle de temps | Non | writeBatchTimeout |
Taille de lot d’écriture | Nombre de lignes à insérer dans la table SQL par lot. La valeur autorisée est integer (nombre de lignes). Par défaut, le service détermine de façon dynamique la taille de lot appropriée selon la taille de ligne. | <nombre de lignes > (entier) |
Non | writeBatchSize |
Connexions simultanées maximales | La limite supérieure de connexions simultanées établies au magasin de données pendant l’exécution de l’activité. Spécifiez une valeur uniquement lorsque vous souhaitez limiter les connexions simultanées. | <connexions simultanées maximales> | Non | maxConcurrentConnections |
Désactiver l’analytique des métriques de performances | Ce paramètre contrôle la collecte de mesures telles que DTU, DWU, RU, etc. pour l'optimisation des performances de copie et les recommandations. Si ce comportement vous intéresse, désactivez cette fonctionnalité. | Sélectionné ou désélection | Non | disableMetricsCollection |