Del via


Hent data fra OneLake

I denne artikkelen lærer du hvordan du henter data fra OneLake inn i en ny eller eksisterende tabell.

Forutsetning

Kopier filbane fra Lakehouse

  1. Velg Dataingeniør i opplevelsesbryteren.

  2. Velg Lakehouse-miljøet som inneholder datakilden du vil bruke.

  3. Plasser markøren over den ønskede filen, og velg Mer-menyen , og velg deretter Egenskaper.

    Viktig

    • Mappebaner støttes ikke.
    • Jokertegn (*) støttes ikke.

    Skjermbilde av rullegardinmenyen til en Lakehouse-fil. Alternativet Egenskaper er uthevet.

  4. Velg ikonet Kopier til utklippstavle under URL-adresse, og lagre det et sted for å hente det i et senere trinn.

    Skjermbilde av egenskaperruten til en Lakehouse-fil. Kopier-ikonet til høyre for filens NETTADRESSE er uthevet.

  5. Gå tilbake til arbeidsområdet, og velg en KQL-database.

Kilde

  1. Velg Hent data på det nedre båndet i KQL-databasen.

    Kilde-fanen er valgt i Hent data-vinduet.

  2. Velg datakilden fra den tilgjengelige listen. I dette eksemplet inntar du data fra OneLake.

    Skjermbilde av hent datavinduet med kildefanen valgt.

Konfigurer

  1. Velg en måltabell. Hvis du vil innta data i en ny tabell, velger du +Ny tabell og skriver inn et tabellnavn.

    Merk

    Tabellnavn kan være opptil 1024 tegn, inkludert mellomrom, alfanumeriske tegn, bindestreker og understrekingstegn. Spesialtegn støttes ikke.

  2. Lim inn filbanen til Lakehouse du kopierte i Kopier filbane fra Lakehouse i OneLake-filen.

    Merk

    Du kan legge til opptil 10 elementer med opptil 1 GB ukomprimert størrelse hver.

    Skjermbilde av konfigurer fanen med den nye tabellen angitt, og en OneLake-filbane lagt til.

  3. Velg Neste.

Kontroller

Undersøk-fanen åpnes med en forhåndsvisning av dataene.

Hvis du vil fullføre inntaksprosessen, velger du Fullfør.

Skjermbilde av undersøk-fanen.

Eventuelt:

Rediger kolonner

Merk

  • For tabellformater (CSV, TSV, PSV) kan du ikke tilordne en kolonne to ganger. Hvis du vil tilordne til en eksisterende kolonne, må du først slette den nye kolonnen.
  • Du kan ikke endre en eksisterende kolonnetype. Hvis du prøver å tilordne til en kolonne med et annet format, kan du ende opp med tomme kolonner.

Endringene du kan gjøre i en tabell, avhenger av følgende parametere:

  • Tabelltype er ny eller eksisterende
  • Tilordningstype er ny eller eksisterende
Tabelltype Tilordningstype Tilgjengelige justeringer
New table Ny tilordning Gi nytt navn til kolonne, endre datatype, endre datakilde, tilordningstransformasjon, legge til kolonne, slette kolonne
Eksisterende tabell Ny tilordning Legg til kolonne (der du deretter kan endre datatype, gi nytt navn til og oppdatere)
Eksisterende tabell Eksisterende tilordning ingen

Skjermbilde av kolonner som er åpne for redigering.

Tilordningstransformasjoner

Noen dataformattilordninger (Parquet, JSON og Avro) støtter enkle inntakstidstransformasjoner. Hvis du vil bruke tilordningstransformasjoner, oppretter eller oppdaterer du en kolonne i vinduet Rediger kolonner.

Tilordningstransformasjoner kan utføres på en kolonne av typen streng eller datetime, der kilden har datatypeint eller lang. Støttede tilordningstransformasjoner er:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Avanserte alternativer basert på datatype

Tabell (CSV, TSV, PSV):

  • Hvis du inntar tabellformater i en eksisterende tabell, kan du velge Avansert>behold tabellskjema. Tabelldata inneholder ikke nødvendigvis kolonnenavnene som brukes til å tilordne kildedata til de eksisterende kolonnene. Når dette alternativet er merket av, utføres tilordningen etter rekkefølge, og tabellskjemaet forblir det samme. Hvis dette alternativet ikke er avmerket, opprettes nye kolonner for innkommende data, uavhengig av datastruktur.

  • Hvis du vil bruke den første raden som kolonnenavn, velger du Avansert>første rad er kolonneoverskrift.

    Skjermbilde av avanserte CSV-alternativer.

JSON:

  • Hvis du vil bestemme kolonnedeling av JSON-data, velger du Avanserte>nestede nivåer, fra 1 til 100.

  • Hvis du velger Avanserte>Hopp over JSON-linjer med feil, blir dataene inntatt i JSON-format. Hvis du lar denne avmerkingsboksen være umerket, blir dataene inntatt i flerjsonformat.

    Skjermbilde av avanserte JSON-alternativer.

Sammendrag

I vinduet for klargjøring av data merkes alle tre trinnene med grønne haker når datainntaket er fullført. Du kan velge et kort som skal spørres, slippe de inntatte dataene eller se et instrumentbord i inntakssammendraget.

Skjermbilde av sammendragssiden med vellykket inntak fullført.