Partager via


Groupes de commandes sync

Remarque

Ces informations s’appliquent à Databricks CLI versions 0.205 et ultérieures. L’interface CLI Databricks est en préversion publique.

L’utilisation de l’interface CLI Databricks est soumise à la licence Databricks et à la notification de confidentialité Databricks, y compris les dispositions relatives aux données d’utilisation.

Le groupe de commandes sync au sein de Databricks CLI permet d’effectuer la synchronisation unidirectionnelle des modifications de fichier d’un bundle dans un répertoire de système de fichiers local, vers un répertoire au sein d’un espace de travail Azure Databricks distant.

Remarque

  • sync Les commandes ne peuvent pas synchroniser les modifications de fichier à partir d’un répertoire au sein d’un espace de travail Azure Databricks distant vers un répertoire au sein d’un système de fichiers local.
  • sync Les commandes peuvent synchroniser les modifications de fichier d’un ordinateur de développement local uniquement aux fichiers utilisateur d’espace de travail dans/Users votre espace de travail Azure Databricks. Il ne peut pas se synchroniser avec des fichiers DBFS (dbfs:/). Pour synchroniser les modifications de fichiers d’une machine de développement locale vers DBFS (dbfs:/) dans votre espace de travail Azure Databricks, utilisez l’utilitaire de synchronisation dbx .

Vous exécutez les commandes sync en les ajoutant à databricks sync. Pour afficher l’aide sur la commande sync, exécutez databricks sync -h.

Synchroniser de manière incrémentielle les modifications de fichiers locaux dans un répertoire distant

Pour effectuer une simple synchronisation unidirectionnelle incrémentielle des modifications de fichier d’un bundle dans un répertoire de système de fichiers local, vers un répertoire au sein d’un espace de travail Azure Databricks distant, exécutez la commande sync comme suit :

databricks sync <local-directory-path> <remote-directory-path>

Par exemple, pour effectuer une synchronisation incrémentielle unique, unidirectionnelle et incrémentielle de toutes les modifications de fichier dans le dossier nommé my-folder dans le répertoire de travail actuel local, vers un chemin d’accès spécifique dans l’espace de travail distant, exécutez la commande suivante :

databricks sync ./my-folder/ /Users/someone@example.com/

Dans cet exemple, seules les modifications de fichier depuis la dernière exécution de la sync commande sont synchronisées avec /Users/someone@example.com/. Par défaut, l’URL de l’espace de travail dans le profil de l’appelant DEFAULT est utilisée pour déterminer l’espace de travail distant avec lequel effectuer la synchronisation.

Synchroniser de manière complète les modifications de fichiers locaux dans un répertoire distant

Pour effectuer une synchronisation unique, complète et unidirectionnelle des modifications de fichiers dans un répertoire de système de fichiers local vers un répertoire au sein d’un espace de travail Azure Databricks distant, quelle que soit la date d’exécution de la dernière sync commande, utilisez l’option --full , par exemple :

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Synchroniser de manière continue les modifications de fichiers locaux dans un répertoire distant

Pour effectuer la --watch synchronisation unidirectionnelle, continue des modifications de fichier dans un répertoire de système de fichiers local, vers un répertoire au sein d’un espace de travail Azure Databricks distant, utilisez l’option, par exemple :

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

La synchronisation unidirectionnelle se poursuit jusqu’à ce que la commande soit arrêtée à partir du terminal, généralement en appuyant sur Ctrl + c ou Ctrl + z.

L’interrogation des événements de synchronisation possibles se produit une fois par seconde par défaut. Pour modifier cet intervalle, utilisez l’option --interval ainsi que le nombre de secondes à interroger suivi du caractère s, par exemple pendant cinq secondes :

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Modifier le format de sortie de la progression de la synchronisation

Les informations de progression de la synchronisation sont générées par défaut dans le terminal au format texte. Pour spécifier le format de sortie de la progression de synchronisation, utilisez l’option --output , en spécifiant text (par défaut, si --output n’est pas spécifié autrement) ou json, par exemple :

databricks sync ./my-folder/ /Users/someone@example.com/ --output json