Del via


Opplæring i Lakehouse: Innta data i lakehouse

I denne opplæringen inntar du mer dimensjonale tabeller og faktatabeller fra Wide World Importers (WWI) til lakehouse.

Forutsetning

Hent inn data

I denne delen bruker du kopier dataaktiviteten til Data Factory-datasamlebåndet til å innta eksempeldata fra en Azure-lagringskonto til Filer-delen av lakehouse du opprettet tidligere.

  1. Velg Arbeidsområder i venstre navigasjonsrute, og velg deretter det nye arbeidsområdet fra Arbeidsområder-menyen . Elementer-visningen av arbeidsområdet vises.

  2. Velg Datasamlebånd fra menyelementet +Ny på båndet i arbeidsområdet.

    Skjermbilde som viser hvordan du oppretter et nytt datasamlebånd.

  3. Angi navnet som IngestDataFromSourceToLakehouse i dialogboksen Ny datasamlebånd, og velg Opprett. Et nytt datafabrikkforløp opprettes og åpnes.

  4. Deretter konfigurerer du en HTTP-tilkobling for å importere data fra hele verden til Lakehouse. Velg Vis mer fra listen over nye kilder, søk etter Http og velg det.

    Skjermbilde som viser hvor du velger HTTP-kilden.

  5. Skriv inn detaljene fra tabellen nedenfor i vinduet Koble til datakilde, og velg Neste.

    Egenskap Verdi
    Nettadresse https://assetsprod.microsoft.com/en-us/wwi-sample-dataset.zip
    Connection Opprett en ny tilkobling
    Tilkoblingsnavn wwisampledata
    Datagateway Ingen
    Godkjenningstype Anonym

    Skjermbilde som viser parameterne for å konfigurere Http-tilkoblingen.

  6. Aktiver binærkopien i neste trinn, og velg ZipDeflate (.zip) som komprimeringstype siden kilden er en .zip fil. Behold de andre feltene på standardverdiene, og klikk Neste.

    Skjermbilde som viser hvordan du velger en komprimeringstype.

  7. Angi rotmappen som Filer i vinduet Koble til datamål, og klikk Neste. Dette vil skrive dataene til Filer-delen av lakehouse.

    Skjermbilde som viser innstillingene for måltilkobling for lakehouse.

  8. Velg filformatet som binært for målet. Klikk Neste og deretter Lagre+Kjør. Du kan planlegge at datasamlebånd skal oppdateres regelmessig. I denne opplæringen kjører vi bare datasamlebåndet én gang. Datakopieringsprosessen tar omtrent 10–15 minutter å fullføre.

    Skjermbilde som viser målfilformatet.

  9. Du kan overvåke kjøringen av datasamlebåndet og aktiviteten i Utdata-fanen . Du kan også vise detaljert informasjon om dataoverføring ved å velge briller-ikonet ved siden av navnet på datasamlebåndet, som vises når du holder pekeren over navnet.

    Skjermbilde som viser statusen for kopiforløpsaktiviteten.

  10. Etter vellykket kjøring av datasamlebåndet går du til lakehouse (wwilakehouse) og åpner utforskeren for å se de importerte dataene.

    Skjermbilde som viser hvordan du navigerer til lakehouse.

  11. Kontroller at mappen WideWorldImportersDW finnes i Explorer-visningen og inneholder data for alle tabeller.

    Skjermbilde som viser kildedataene kopieres til Lakehouse Explorer.

  12. Dataene opprettes under Filer-delen av lakehouse explorer. En ny mappe med GUID inneholder alle nødvendige data. Gi GUID-en nytt navn til wwi-raw-data

Hvis du vil laste inn trinnvise data i et lakehouse, kan du se Trinnvis innlasting av data fra et datalager til et lakehouse.

Neste trinn