Condividi tramite


Ottenere dati da OneLake

Questo articolo mostra come ottenere dati da OneLake in una tabella nuova o esistente.

Prerequisiti

Copiare il percorso del file da Lakehouse

  1. Nel commutatore dell'esperienza scegliere Ingegneria dei dati.

  2. Selezionare l'ambiente Lakehouse contenente l'origine dati da usare.

  3. Posizionare il cursore sul file desiderato e selezionare il menu Altro, quindi selezionare Proprietà.

    Importante

    • I percorsi delle cartelle non sono supportati.
    • I caratteri jolly (*) non sono supportati.

    Screenshot del menu a discesa di un file Lakehouse. L'opzione Proprietà è evidenziata.

  4. In URL selezionare l'icona Copia negli Appunti e salvarla da qualche parte per recuperarla in un passaggio successivo.

    Screenshot del riquadro Proprietà di un file Lakehouse. L'icona copia a destra dell'URL del file è evidenziata.

  5. Tornare all'area di lavoro e selezionare un database KQL.

Origine

  1. Nella barra multifunzione inferiore del database KQL selezionare Ottenere dati.

    Nella finestra Ottieni dati è selezionata la scheda Origine.

  2. Selezionare l'origine dati dall'elenco disponibile. In questo esempio si inseriscono dati da OneLake.

    Screenshot della finestra Ottieni dati con la scheda origine selezionata.

Configurare

  1. Selezionare una tabella di destinazione. Se si desidera inserire dati in una nuova tabella, selezionare +Nuova tabella e immettere un nome tabella.

    Nota

    I nomi delle tabelle possono avere un massimo di 1.024 caratteri, inclusi spazi, caratteri alfanumerici, trattini e trattini bassi. I caratteri speciali non sono supportati.

  2. Nel file OneLake incollare il percorso del file di Lakehouse copiato in Copia percorso file da Lakehouse.

    Nota

    È possibile aggiungere fino a 10 elementi non compressi di dimensioni fino a 1 GB ciascuno.

    Screenshot della scheda configurazione con la nuova tabella immessa e l'aggiunta di un percorso di file OneLake.

  3. Selezionare Avanti.

Controllare

La scheda Ispezione si apre con un'anteprima dei dati.

Selezionare Fine per completare il processo di inserimento.

Screenshot della scheda Ispeziona.

Facoltativo:

Modifica colonne

Nota

  • Per i formati tabulari (CSV, TSV, PSV), non è possibile eseguire il mapping di una colonna due volte. Per eseguire il mapping a una colonna esistente, eliminare prima quella nuova.
  • Non è possibile modificare un tipo di colonna esistente. Se si tenta di eseguire il mapping su una colonna con un formato diverso, è possibile che appaiano colonne vuote.

Le modifiche che è possibile apportare in una tabella dipendono dai parametri seguenti:

  • Il tipo di tabella è nuovo o esistente
  • Il tipo di mapping è nuovo o esistente
Tipo di tabella Tipo di mapping Modifiche disponibili
Nuova tabella Nuovo mapping Rinominare la colonna, modificare il tipo di dati, modificare l'origine dati, eseguire la Trasformazione del mapping, aggiungere una colonna, eliminare una colonna
Tabella esistente Nuovo mapping Aggiungi colonna (per cui è poi possibile cambiare il tipo di dati, rinominare e aggiornare)
Tabella esistente Mapping esistente Nessuno

Screenshot delle colonne aperte per la modifica.

Trasformazioni del mapping

Alcuni mapping del formato dati (Parquet, JSON e Avro) supportano semplici trasformazioni in fase di inserimento. Per applicare le trasformazioni del mapping, creare o aggiornare una colonna nella finestra Modifica colonne.

Le trasformazioni del mapping possono essere eseguite su una colonna di tipo string o date/time, con l'origine che ha un tipo di dati int o long. Le trasformazioni del mapping supportate sono:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Opzioni avanzate in base al tipo di dati

Tabulare (CSV, TSV, PSV):

  • Se si inseriscono formati tabulari in una tabella esistente, è possibile selezionare Avanzate>Mantieni lo schema di tabella. I dati tabulari non comprendono necessariamente i nomi di colonna usati per eseguire il mapping dei dati di origine sulle colonne esistenti. Quando questa opzione è selezionata, il mapping viene eseguito in base all'ordine e lo schema della tabella rimane invariato. Se questa opzione è deselezionata, vengono create nuove colonne per i dati in ingresso, indipendentemente dalla struttura dei dati.

  • Per usare la prima riga come nomi di colonna, selezionare Avanzate>Prima riga è intestazione di colonna.

    Screenshot delle opzioni CSV avanzate.

JSON:

  • Per determinare la divisione delle colonne dei dati JSON, selezionare Avanzate>Livelli annidati, da 1 a 100.

  • Se si seleziona Avanzate>Ignora le righe JSON con errori, i dati vengono inseriti in formato JSON. Se si lascia deselezionata questa casella di controllo, i dati vengono inseriti in formato multijson.

    Screenshot delle opzioni JSON avanzate.

Riepilogo

Nella finestra Preparazione dei dati, tutti e tre i passaggi sono contrassegnati con segni di spunta verdi quando l'inserimento dati si conclude con successo. È possibile selezionare una scheda per eseguire query, eliminare i dati inseriti o visualizzare una dashboard con il riepilogo dell'inserimento.

Screenshot della pagina di riepilogo con completamento dell'inserimento riuscito.