Groupes de commandes sync
Remarque
Ces informations s’appliquent à Databricks CLI versions 0.205 et ultérieures. L’interface CLI Databricks est en préversion publique.
L’utilisation de l’interface CLI Databricks est soumise à la licence Databricks et à la notification de confidentialité Databricks, y compris les dispositions relatives aux données d’utilisation.
Le groupe de commandes sync
au sein de Databricks CLI permet d’effectuer la synchronisation unidirectionnelle des modifications de fichier d’un bundle dans un répertoire de système de fichiers local, vers un répertoire au sein d’un espace de travail Azure Databricks distant.
Remarque
sync
Les commandes ne peuvent pas synchroniser les modifications de fichier à partir d’un répertoire au sein d’un espace de travail Azure Databricks distant vers un répertoire au sein d’un système de fichiers local.sync
Les commandes peuvent synchroniser les modifications de fichier d’un ordinateur de développement local uniquement aux fichiers utilisateur d’espace de travail dans/Users
votre espace de travail Azure Databricks. Il ne peut pas se synchroniser avec des fichiers DBFS (dbfs:/
). Pour synchroniser les modifications de fichiers d’une machine de développement locale vers DBFS (dbfs:/
) dans votre espace de travail Azure Databricks, utilisez l’utilitaire de synchronisation dbx .
Vous exécutez les commandes sync
en les ajoutant à databricks sync
. Pour afficher l’aide sur la commande sync
, exécutez databricks sync -h
.
Synchroniser de manière incrémentielle les modifications de fichiers locaux dans un répertoire distant
Pour effectuer une simple synchronisation unidirectionnelle incrémentielle des modifications de fichier d’un bundle dans un répertoire de système de fichiers local, vers un répertoire au sein d’un espace de travail Azure Databricks distant, exécutez la commande sync
comme suit :
databricks sync <local-directory-path> <remote-directory-path>
Par exemple, pour effectuer une synchronisation incrémentielle unique, unidirectionnelle et incrémentielle de toutes les modifications de fichier dans le dossier nommé my-folder
dans le répertoire de travail actuel local, vers un chemin d’accès spécifique dans l’espace de travail distant, exécutez la commande suivante :
databricks sync ./my-folder/ /Users/someone@example.com/
Dans cet exemple, seules les modifications de fichier depuis la dernière exécution de la sync
commande sont synchronisées avec /Users/someone@example.com/
. Par défaut, l’URL de l’espace de travail dans le profil de l’appelant DEFAULT
est utilisée pour déterminer l’espace de travail distant avec lequel effectuer la synchronisation.
Synchroniser de manière complète les modifications de fichiers locaux dans un répertoire distant
Pour effectuer une synchronisation unique, complète et unidirectionnelle des modifications de fichiers dans un répertoire de système de fichiers local vers un répertoire au sein d’un espace de travail Azure Databricks distant, quelle que soit la date d’exécution de la dernière sync
commande, utilisez l’option --full
, par exemple :
databricks sync ./my-folder/ /Users/someone@example.com/ --full
Synchroniser de manière continue les modifications de fichiers locaux dans un répertoire distant
Pour effectuer la --watch
synchronisation unidirectionnelle, continue des modifications de fichier dans un répertoire de système de fichiers local, vers un répertoire au sein d’un espace de travail Azure Databricks distant, utilisez l’option, par exemple :
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
La synchronisation unidirectionnelle se poursuit jusqu’à ce que la commande soit arrêtée à partir du terminal, généralement en appuyant sur Ctrl + c
ou Ctrl + z
.
L’interrogation des événements de synchronisation possibles se produit une fois par seconde par défaut. Pour modifier cet intervalle, utilisez l’option --interval
ainsi que le nombre de secondes à interroger suivi du caractère s
, par exemple pendant cinq secondes :
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
Modifier le format de sortie de la progression de la synchronisation
Les informations de progression de la synchronisation sont générées par défaut dans le terminal au format texte. Pour spécifier le format de sortie de la progression de synchronisation, utilisez l’option --output
, en spécifiant text
(par défaut, si --output
n’est pas spécifié autrement) ou json
, par exemple :
databricks sync ./my-folder/ /Users/someone@example.com/ --output json