Carica in tabella Delta Lake
Lakehouse in Microsoft Fabric offre una funzionalità per caricare in modo efficiente i tipi di file comuni in una tabella Delta ottimizzata pronta per l'analisi. La funzionalità Carica in tabella consente agli utenti di caricare un singolo file o una cartella di file in una tabella. Questa funzionalità aumenta la produttività per i data engineer, consentendo loro di usare rapidamente un'azione di clic con il pulsante destro del mouse per abilitare il caricamento di tabelle su file e cartelle. Il caricamento nella tabella è anche un'esperienza senza codice che riduce gli ostacoli all’ingresso per tutti gli utenti.
Panoramica delle funzionalità Carica in tabella
Di seguito è riportato un elenco delle funzionalità abilitate nell'esperienza Carica in tabella integrata per offrire flessibilità agli utenti aumentando al tempo stesso la loro produttività:
Tipi di file supportati: questa funzionalità attualmente supporta solo il caricamento di tipi di file PARQUET o CSV. Le maiuscole/minuscole dell'estensione file non sono importanti.
Caricamento file singolo: gli utenti possono caricare un singolo file scelto in uno dei formati supportati selezionando "Carica in tabella Delta" nell'azione del menu contestuale del file.
Caricamento a livello di cartella: è possibile caricare tutti i file in una cartella e relative sottocartelle contemporaneamente selezionando "Carica in tabella Delta" dopo aver fatto clic su una cartella. Questa funzionalità riguarda automaticamente tutti i file e li carica in una tabella Delta. È importante tenere presente che solo i file dello stesso tipo possono essere caricati contemporaneamente in una tabella.
Carica in una tabella nuova ed esistente: l'utente può scegliere di caricare i file e le cartelle in una nuova tabella o in una tabella esistente a scelta. Se decide il caricamento in una tabella esistente, può accodare o sovrascrivere i dati nella tabella.
Opzione file di origine CSV: per i file CSV, l'utente può specificare se il file di origine include intestazioni che vuole usare come nomi colonna. Gli utenti possono anche specificare un separatore a scelta per sostituire il separatore virgola predefinito.
Caricato come tabelle Delta: le tabelle vengono sempre caricate usando il formato di tabella Delta Lake con l'ottimizzazione V-Order abilitata.
Nota
Attualmente non è possibile specificare lo schema della tabella tramite l'interfaccia utente di Lakehouse, ma per tale scopo è necessario usare un notebook.
Regole e linee guida di convalida
Lo standard seguente si applica all'esperienza Carica in tabella:
I nomi delle tabelle possono contenere solo caratteri alfanumerici e caratteri di sottolineatura. Consente anche qualsiasi lettera inglese, maiuscola o minuscola, e il carattere di sottolineatura (
_
), con una lunghezza massima di 256 caratteri. Non sono consentiti trattini (-
) o caratteri speciali.I file di testo senza intestazioni di colonna vengono sostituiti con la notazione
col#
standard come nomi colonna della tabella.I nomi di colonna consentono qualsiasi lettera inglese, maiuscola o minuscola, carattere di sottolineatura (
_
) e caratteri in altre lingue, ad esempio il cinese in UTF, lunghezza fino a 128 caratteri. I nomi colonna vengono convalidati durante l'azione di caricamento. L'algoritmo Carica in Delta sostituisce i valori non consentiti con una barra inferiore (_
). Se non viene ottenuto alcun nome colonna appropriato durante la convalida, l'azione di caricamento non riesce.Per i file CSV, il separatore non può essere vuoto, non può contenere più di 8 caratteri o usare uno dei caratteri seguenti:
(
,)
,[
,]
,{
,}
, virgolette singole ('
), virgolette doppie ("
) e spazi.