Partilhar via


Carregar na tabela Delta Lake

O Lakehouse no Microsoft Fabric fornece um recurso para carregar com eficiência tipos de arquivos comuns em uma tabela Delta otimizada pronta para análise. O recurso Carregar para tabela permite que os usuários carreguem um único arquivo ou uma pasta de arquivos em uma tabela. Esse recurso aumenta a produtividade dos engenheiros de dados, permitindo que eles usem rapidamente uma ação de clique com o botão direito do mouse para habilitar o carregamento de tabelas em arquivos e pastas. Carregar para a tabela também é uma experiência sem código, o que reduz a barra de entrada para todas as personas.

Visão geral dos recursos do Load to Table

Aqui está uma lista de recursos que habilitamos na experiência de carga à mesa integrada para fornecer flexibilidade aos nossos usuários e, ao mesmo tempo, aumentar sua produtividade:

  • Tipos de ficheiro suportados: Atualmente, esta funcionalidade suporta apenas o carregamento de tipos de ficheiros PARQUET ou CSV. Caso de extensão de arquivo não importa.

  • Carregamento de arquivo único: Os usuários podem carregar um único arquivo de sua escolha em um dos formatos suportados, selecionando "Carregar para tabela delta" na ação do menu de contexto do arquivo.

  • Carga no nível da pasta: Você pode carregar todos os arquivos em uma pasta e suas subpastas de uma só vez, selecionando "Load to Delta Table" depois de clicar em uma pasta. Esse recurso percorre automaticamente todos os arquivos e os carrega em uma tabela delta. É importante notar que apenas arquivos do mesmo tipo podem ser carregados ao mesmo tempo em uma tabela.

  • Carregar para uma tabela nova e existente: o usuário pode optar por carregar seus arquivos e pastas em uma nova tabela ou em uma tabela existente de sua escolha. Se eles decidirem carregar para uma tabela existente, eles poderão acrescentar ou substituir seus dados na tabela.

  • Opção de arquivo de origem CSV: Para arquivos CSV, permitimos que o usuário especifique se o arquivo de origem inclui cabeçalhos que gostaria de usar como nomes de coluna. Os usuários também podem especificar um separador de sua escolha para substituir o separador de vírgula padrão no lugar.

  • Carregadas como tabelas delta: as tabelas são sempre carregadas usando o formato de tabela Delta Lake com otimização V-Order habilitada.

    Gif da pasta de carga geral para a experiência da tabela.

Nota

Atualmente, não é possível especificar o esquema de tabela por meio da interface do usuário do Lakehouse; Você deve usar um caderno para esse fim.

Diretrizes e regras de validação

O seguinte padrão aplica-se à experiência Carregar para tabela:

  • Os nomes das tabelas só podem conter caracteres alfanuméricos e sublinhados. Também permite qualquer letra inglesa, maiúscula ou minúscula, e sublinhado (_), com um comprimento máximo de 256 caracteres. Não são permitidos traços (-) ou caracteres de espaço.

  • Os arquivos de texto sem cabeçalhos de coluna são substituídos por notação padrão col# como os nomes das colunas da tabela.

  • Os nomes das colunas permitem qualquer letra em inglês, maiúsculas ou minúsculas, sublinhado (_) e caracteres em outros idiomas, como chinês em UTF, com comprimento de até 128 caracteres. Os nomes das colunas são validados durante a ação de carregamento. O algoritmo Load to Delta substitui valores proibidos por underbar (_). Se nenhum nome de coluna adequado for obtido durante a validação, a ação de carregamento falhará.

  • Para arquivos CSV, o separador não pode estar vazio, não pode ter mais de 8 caracteres ou usar qualquer um dos seguintes caracteres: (, ), [, ],{, }aspas simples ('), aspas duplas (") e espaço em branco.