Carregar na tabela Delta Lake
O Lakehouse no Microsoft Fabric fornece um recurso para carregar com eficiência tipos de arquivos comuns em uma tabela Delta otimizada pronta para análise. O recurso Carregar para tabela permite que os usuários carreguem um único arquivo ou uma pasta de arquivos em uma tabela. Esse recurso aumenta a produtividade dos engenheiros de dados, permitindo que eles usem rapidamente uma ação de clique com o botão direito do mouse para habilitar o carregamento de tabelas em arquivos e pastas. Carregar para a tabela também é uma experiência sem código, o que reduz a barra de entrada para todas as personas.
Visão geral dos recursos do Load to Table
Aqui está uma lista de recursos que habilitamos na experiência de carga à mesa integrada para fornecer flexibilidade aos nossos usuários e, ao mesmo tempo, aumentar sua produtividade:
Tipos de ficheiro suportados: Atualmente, esta funcionalidade suporta apenas o carregamento de tipos de ficheiros PARQUET ou CSV. Caso de extensão de arquivo não importa.
Carregamento de arquivo único: Os usuários podem carregar um único arquivo de sua escolha em um dos formatos suportados, selecionando "Carregar para tabela delta" na ação do menu de contexto do arquivo.
Carga no nível da pasta: Você pode carregar todos os arquivos em uma pasta e suas subpastas de uma só vez, selecionando "Load to Delta Table" depois de clicar em uma pasta. Esse recurso percorre automaticamente todos os arquivos e os carrega em uma tabela delta. É importante notar que apenas arquivos do mesmo tipo podem ser carregados ao mesmo tempo em uma tabela.
Carregar para uma tabela nova e existente: o usuário pode optar por carregar seus arquivos e pastas em uma nova tabela ou em uma tabela existente de sua escolha. Se eles decidirem carregar para uma tabela existente, eles poderão acrescentar ou substituir seus dados na tabela.
Opção de arquivo de origem CSV: Para arquivos CSV, permitimos que o usuário especifique se o arquivo de origem inclui cabeçalhos que gostaria de usar como nomes de coluna. Os usuários também podem especificar um separador de sua escolha para substituir o separador de vírgula padrão no lugar.
Carregadas como tabelas delta: as tabelas são sempre carregadas usando o formato de tabela Delta Lake com otimização V-Order habilitada.
Nota
Atualmente, não é possível especificar o esquema de tabela por meio da interface do usuário do Lakehouse; Você deve usar um caderno para esse fim.
Diretrizes e regras de validação
O seguinte padrão aplica-se à experiência Carregar para tabela:
Os nomes das tabelas só podem conter caracteres alfanuméricos e sublinhados. Também permite qualquer letra inglesa, maiúscula ou minúscula, e sublinhado (
_
), com um comprimento máximo de 256 caracteres. Não são permitidos traços (-
) ou caracteres de espaço.Os arquivos de texto sem cabeçalhos de coluna são substituídos por notação padrão
col#
como os nomes das colunas da tabela.Os nomes das colunas permitem qualquer letra em inglês, maiúsculas ou minúsculas, sublinhado (
_
) e caracteres em outros idiomas, como chinês em UTF, com comprimento de até 128 caracteres. Os nomes das colunas são validados durante a ação de carregamento. O algoritmo Load to Delta substitui valores proibidos por underbar (_
). Se nenhum nome de coluna adequado for obtido durante a validação, a ação de carregamento falhará.Para arquivos CSV, o separador não pode estar vazio, não pode ter mais de 8 caracteres ou usar qualquer um dos seguintes caracteres:
(
,)
,[
,]
,{
,}
aspas simples ('
), aspas duplas ("
) e espaço em branco.