Partager via


Configurer Azure Cosmos DB for NoSQL dans une activité de copie

Cet article explique comment utiliser l'activité de copie dans un pipeline de données pour copier des données depuis et vers Azure Cosmos DB for NoSQL.

Configuration prise en charge

Pour la configuration de chaque onglet sous l’activité de copie, accédez respectivement aux sections suivantes.

Général

Reportez-vous aux instructions relatives aux paramètres Général pour configurer l’onglet Paramètres Général .

Source

Les propriétés suivantes sont prises en charge pour Azure Cosmos DB for NoSQL sous l’onglet Source d’une activité de copie.

Screenshot showing source tab.

Les trois propriétés suivantes sont requises :

  • Type de magasin de données : sélectionnez Externe.
  • Connexion : sélectionnez une connexion Azure Cosmos DB for NoSQL dans la liste des connexions. Si aucune connexion n’existe, créez une connexion Azure Cosmos DB for NoSQL en sélectionnant Nouveau.
  • Conteneur : sélectionnez le conteneur que vous souhaitez utiliser. Sélectionnez Modifier pour entrer le nom du conteneur manuellement.

Sous Avancé, vous pouvez spécifier les champs suivants :

  • Utiliser une requête : vous pouvez choisir Table ou Requête comme requête d’utilisation. La liste suivante décrit la configuration de chaque paramètre :

    • Table : lit les données de la table que vous avez spécifiée dans Table.

    • Requête : Spécifiez la requête Azure Cosmos DB pour lire les données.

      Screenshot showing query.

  • Taille de la page : nombre de documents par page du résultat de la requête. La valeur par défaut est « -1 », qui utilise la page dynamique côté service jusqu’à 1 000.

  • Détecter la DateHeure : Indique s'il faut détecter la date/heure à partir des valeurs de chaîne dans les documents. Valeurs autorisées : true (par défaut) et false.

  • Régions préférées : Liste des régions préférées auxquelles se connecter lors de la récupération des données d’Azure Cosmos DB. Sélectionnez une région par défaut dans la liste déroulante après avoir sélectionné Nouveau.

    Screenshot showing preferred regions.

  • Colonnes supplémentaires : ajoutez des colonnes de données supplémentaires au chemin d’accès relatif ou à la valeur statique des fichiers sources du magasin. L’expression est prise en charge pour ce dernier. Pour plus d’informations, accédez à Ajouter des colonnes supplémentaires pendant la copie.

    Screenshot showing additional columns.

Destination

Les propriétés suivantes sont prises en charge pour Azure Cosmos DB for NoSQL sous l’onglet Destination d’une activité de copie.

Screenshot showing destination tab.

Les trois propriétés suivantes sont requises :

  • Type de magasin de données : sélectionnez Externe.
  • Connexion : sélectionnez une connexion Azure Cosmos DB for NoSQL dans la liste des connexions.
  • Conteneur : sélectionnez Parcourir pour choisir le fichier que vous souhaitez copier, ou renseignez-le manuellement.

Sous Avancé, vous pouvez spécifier les champs suivants :

  • Comportement d’écriture :Définit le comportement d’écriture lorsque la destination est constituée de fichiers d’une banque de données basée sur un fichier. Vous pouvez choisir Ajouter du contenu dynamique, Insérer ou Upsert dans la liste déroulante.

    • Ajouter du contenu dynamique : ouvrez le volet Ajouter du contenu dynamique. Vous ouvrez ainsi le générateur d’expressions, où vous pouvez générer des expressions à partir des variables système prises en charge, de la sortie de l’activité, des fonctions et des variables ou paramètres spécifiés par l’utilisateur. Pour plus d’informations sur le langage d’expression, accédez à Expressions et fonctions.

    • Insérer : choisissez cette option si vos données sources ont des insertions.

    • Upsert : Le comportement de la valeur upsert consiste à remplacer le document si un document portant le même identificateur existe déjà ; sinon, le document est inséré.

      Screenshot showing write behavior.

  • Écrire le délai d’expiration du lot : Le temps d’attente pour que l’opération d’insertion par lot se termine avant qu’elle ne soit interrompue Les valeur autorisées sont Timespan. Exemple : 00:30:00 (30 minutes).

  • Taille de lot d’écriture : spécifiez le nombre de lignes à insérer dans la table SQL par lot. La valeur autorisée est un intègre (nombre de lignes). Par défaut, le service détermine de façon dynamique la taille de lot appropriée selon la taille de ligne.

  • Nombre maximal de connexions simultanées : la limite supérieure de connexions simultanées établies au magasin de données pendant l’exécution de l’activité. Spécifiez une valeur uniquement lorsque vous souhaitez limiter les connexions simultanées.

  • Désactiver l’analytique des métriques de performances : ce paramètre contrôle la collection des métriques, telles que DTU, DWU, RU, etc., pour l’optimisation des performances de copie et les recommandations. Si ce comportement vous intéresse, désactivez cette fonctionnalité.

Mappage

Pour la configuration de l’onglet Mappage, accédez à Configurer vos mappages sous l’onglet Mappage.

Paramètres

Pour la configuration de l’onglet Paramètres, accédez à Configurer vos autres paramètres sous l’onglet Paramètres.

Résumé de la table

Les tableaux suivants contiennent plus d’informations sur l’activité de copie dans Azure Cosmos DB for NoSQL.

Table source

Nom Description Valeur Obligatoire Propriété de script JSON
Type de banque de données Votre type de magasin de données. Externe Oui /
Connection Votre connexion au magasin de données source. <votre connexion> Oui connection
Conteneur Conteneur de vos données sources. <conteneur de vos données sources> Oui conteneur
fileName
Utiliser la requête Vous pouvez choisir Table ou Requête comme requête d’utilisation. Table
Requête
Non type
Taille de page nombre de documents par page du résultat de la requête. La valeur par défaut est « -1 », qui utilise la page dynamique côté service jusqu’à 1 000. <taille de votre page> Non pageSize
Supprimer la dateHeure Les fichiers du magasin de données source seront supprimés juste après avoir été déplacés vers le magasin de destination. La suppression des fichiers se fait par fichier, de sorte que lorsque la copie échoue, vous constaterez que certains fichiers ont déjà été copiés vers la destination et supprimés de la source, tandis que d'autres se trouvent encore sur le magasin source. Sélectionné ou désélection Non detectDatetime
Régions préférées Liste des régions préférées auxquelles se connecter lors de la récupération des données d’Azure Cosmos DB. Sélectionnez une région par défaut dans la liste déroulante après avoir sélectionné Nouveau. <vos régions préférées> Non preferredRegions
Colonnes supplémentaires Ajouter les colonnes de données supplémentaires pour stocker le chemin d’accès relatif ou la valeur statique des fichiers sources. L’expression est prise en charge pour ce dernier. Pour plus d’informations, accédez à Ajouter des colonnes supplémentaires pendant la copie. <connexions simultanées maximales> Non additionalColumns

Table de destination

Nom Description Valeur Obligatoire Propriété de script JSON
Type de banque de données Votre type de magasin de données. Externe Oui /
Connection Votre connexion au magasin de données de destination. <votre connexion> Oui connection
Conteneur Conteneur de vos données de destination. <conteneur de la source> Oui conteneur
fileName
Comportement d’écriture Décrit comment écrire des données dans Azure Cosmos DB. Les valeurs autorisées sont insert et upsert. Le comportement de la valeur upsert consiste à remplacer le document si un document portant le même identificateur existe déjà ; sinon, le document est inséré. Ajouter du contenu dynamique
Insérer
Upsert
Non writeBehavior
Délai d’expiration du lot d’écriture Temps d’attente pour que l’opération d’insertion par lot se termine avant qu’elle ne soit interrompue.Les valeurs autorisées sont la plage horaire. Exemple : 00:30:00 (30 minutes). intervalle de temps Non writeBatchTimeout
Taille de lot d’écriture Nombre de lignes à insérer dans la table SQL par lot. La valeur autorisée est integer (nombre de lignes). Par défaut, le service détermine de façon dynamique la taille de lot appropriée selon la taille de ligne. <nombre de lignes >
(entier)
Non writeBatchSize
Connexions simultanées maximales La limite supérieure de connexions simultanées établies au magasin de données pendant l’exécution de l’activité. Spécifiez une valeur uniquement lorsque vous souhaitez limiter les connexions simultanées. <connexions simultanées maximales> Non maxConcurrentConnections
Désactiver l’analytique des métriques de performances Ce paramètre contrôle la collecte de mesures telles que DTU, DWU, RU, etc. pour l'optimisation des performances de copie et les recommandations. Si ce comportement vous intéresse, désactivez cette fonctionnalité. Sélectionné ou désélection Non disableMetricsCollection