Partilhar via


fs grupo de comando

Nota

Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Visualização Pública.

O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer disposições de Dados de Uso.

O fs grupo de comandos dentro da CLI do Databricks permite automatizar volumes no Unity Catalog e automatizar objetos do Sistema de Arquivos Databricks (DBFS).

Execute fs comandos anexando-os ao databricks fs. Para exibir a ajuda para o fs comando, execute databricks fs -h.

fs comandos exigem caminhos de volume para começar e dbfs:/Volumes exigem caminhos de diretório e arquivo no DBFS para começar com dbfs:/.

Listar o conteúdo de um diretório

Para listar o conteúdo de um diretório em um volume ou no DBFS, use o ls comando. Especifique o caminho para o diretório. Os exemplos a seguir listam os nomes dos objetos encontrados na raiz do volume especificado ou na raiz DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/

Para exibir informações completas, incluindo tipos de objetos, tamanhos, tempos de modificação desde a Época em milissegundos, bem como os nomes dos objetos, use a --long opção ou -l . Os exemplos a seguir listam as informações completas dos objetos encontrados na raiz do volume especificado ou em um tmp diretório dentro da raiz DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l

Para exibir caminhos de objeto completos, use a --absolute opção. Os exemplos a seguir listam as informações completas dos objetos e os caminhos completos dos objetos, encontrados na raiz do volume especificado ou em um tmp diretório dentro da raiz DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute

Saída do conteúdo de um arquivo

Para gerar o conteúdo de um arquivo, use o cat comando. Especifique o caminho para o arquivo no DBFS. Os exemplos a seguir geram o conteúdo do arquivo nomeado babynames.csv encontrado na raiz do volume especificado ou em um tmp diretório dentro da raiz DBFS:

databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv

Os exemplos a seguir retornam erros, pois tentam gerar o conteúdo de um diretório em vez de um arquivo:

databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp

Criar um diretório

Para criar um diretório, use o mkdir comando. Especifique o caminho para o diretório a ser criado em um volume ou no DBFS. Se o diretório já existe, nada acontece. Os exemplos a seguir criam um diretório nomeado squirrel-data dentro da raiz do volume especificado ou em um diretório nomeado tmp dentro da raiz DBFS:

databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data

Copiar um diretório ou um arquivo

Para copiar um diretório ou um arquivo, use o cp comando. Especifique os caminhos para o diretório ou arquivo de origem a ser copiado e seu destino. Você pode copiar diretórios e arquivos entre o sistema de arquivos local e o DBFS, e pode copiar diretórios e arquivos entre caminhos DBFS. Para substituir arquivos existentes, use a --overwrite opção. Para copiar arquivos recursivamente dentro de um diretório, use a --recursive opção ou -r .

O cp comando assume file:/, se file:/ for omitido.

Os exemplos a seguir copiam um diretório nomeado squirrel-data e seu conteúdo, de um caminho de sistema de arquivos local para um squirrels diretório dentro da raiz do volume especificado ou da raiz DBFS.

databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r

O exemplo a seguir copia um arquivo nomeado squirrels.csv de um caminho de sistema de arquivos local para um diretório nomeado squirrel-data dentro da raiz do volume especificado ou da raiz DBFS. Se o arquivo já existir no destino, ele será substituído.

databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite

Remover um diretório

Para remover um diretório, use o rm comando. Especifique o caminho para o diretório existente no DBFS. Os exemplos a seguir removem um diretório nomeado squirrel-data da raiz do volume especificado ou de um tmp diretório na raiz DBFS:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data

Se o diretório não existir, nada acontece e nenhum erro é retornado.

Se o diretório existir, mas não estiver vazio, um erro será retornado. Para remover um diretório não vazio e todo o seu conteúdo, use a --recursive opção ou -r . Os exemplos a seguir removem um diretório não vazio nomeado squirrel-data da raiz do volume especificado ou de um tmp diretório na raiz DBFS:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r