Hva er et lakehouse i Microsoft Fabric?
Microsoft Fabric Lakehouse er en dataarkitekturplattform for lagring, administrasjon og analyse av strukturerte og ustrukturerte data på ett sted. Det er en fleksibel og skalerbar løsning som gjør det mulig for organisasjoner å håndtere store mengder data ved hjelp av ulike verktøy og rammeverk for å behandle og analysere disse dataene. Den integreres med andre verktøy for databehandling og analyse for å gi en omfattende løsning for datateknikk og analyse.
Endepunkt for SQL-analyse i Lakehouse
Lakehouse oppretter et serveringslag ved automatisk å generere et SQL Analytics-endepunkt og en standard semantisk modell under oppretting. Denne nye gjennomsiktige funksjonaliteten gjør det mulig for brukeren å arbeide direkte oppå Delta-tabellene i innsjøen for å gi en friksjonsfri og performant opplevelse hele veien fra datainntak til rapportering.
Det er viktig å være oppmerksom på at SQL Analytics-endepunktet er en skrivebeskyttet opplevelse og ikke støtter hele T-SQL-overflateområdet til et transaksjonsdatalager.
Merk
Bare tabellene i Delta-format er tilgjengelige i SQL Analytics-endepunktet. Parquet, CSV og andre formater kan ikke spørres ved hjelp av SQL Analytics-endepunktet. Hvis du ikke ser tabellen, må du konvertere den til Delta-format.
Automatisk tabelloppdagelse og -registrering
Den automatiske tabelloppdagelsen og registreringen er en funksjon i Lakehouse som gir en fullstendig administrert fil til tabellopplevelse for dataingeniører og dataforskere. Du kan slippe en fil inn i det administrerte området i Lakehouse, og systemet validerer den automatisk for strukturerte formater som støttes, og registrerer den i metalageret med de nødvendige metadataene, for eksempel kolonnenavn, formater, komprimering og mer. (For øyeblikket er det eneste støttede formatet Delta-tabell.) Deretter kan du referere til filen som en tabell og bruke SparkSQL-syntaks til å samhandle med dataene.
Samhandle med Lakehouse-elementet
En dataingeniør kan samhandle med lakehouse og dataene i lakehouse på flere måter:
Lakehouse explorer: Utforskeren er den viktigste Lakehouse interaksjonssiden. Du kan laste inn data i Lakehouse, utforske data i Lakehouse ved hjelp av objektutforskeren, angi MIP-etiketter og forskjellige andre ting. Mer informasjon om utforskeropplevelsen: Naviger fabric lakehouse explorer.
Notatblokker: Datateknikere kan bruke notatblokken til å skrive kode for å lese, transformere og skrive direkte til Lakehouse som tabeller og/eller mapper. Du kan lære mer om hvordan du bruker notatblokker for Lakehouse: Utforsk dataene i lakehouse med en notatblokk og Hvordan du bruker en notatblokk til å laste inn data i lakehouse.
Rørledninger: Datateknikere kan bruke dataintegreringsverktøy, for eksempel kopieringsverktøy for datasamlebånd til å hente data fra andre kilder og lande i Lakehouse. Finn mer informasjon om hvordan du bruker kopieringsaktiviteten: Slik kopierer du data ved hjelp av kopieringsaktivitet.
Apache Spark-jobbdefinisjoner: Dataingeniører kan utvikle robuste programmer og organisere utførelsen av kompilerte Spark-jobber i Java, Scala og Python. Mer informasjon om Spark-jobber: Hva er en Apache Spark-jobbdefinisjon?
Dataflyter Gen 2: Datateknikere kan bruke Dataflyter Gen 2 til å innta og klargjøre dataene sine. Finn mer informasjon om innlasting av data ved hjelp av dataflyter: Opprett din første dataflyt for å hente og transformere data.
Mer informasjon om de ulike måtene å laste inn data på i lakehouse: Alternativer for å hente data inn i Fabric Lakehouse.
Fleroppgavekjøring med lakehouse
Multitasking-opplevelsen gir en nettleserfaneutforming som lar deg åpne og bytte mellom flere elementer sømløst, slik at du kan administrere data lakehouse mer effektivt enn noensinne. Ikke mer sjonglering mellom forskjellige vinduer eller å miste oversikten over oppgavene dine. Lakehouse gir en forbedret fleroppgavekjøringsopplevelse for å gjøre databehandlingsreisen så effektiv og brukervennlig som mulig med følgende funksjoner:
Behold operasjoner som kjører: Du kan laste opp eller kjøre datainnlastingsoperasjon i én fane og kontrollere en annen oppgave i en annen fane. Med forbedret fleroppgaver avbrytes ikke operasjoner som kjører, når du navigerer mellom faner. Du kan fokusere på arbeidet uten avbrudd.
Behold konteksten: Merkede objekter, datatabeller eller filer forblir åpne og lett tilgjengelige når du bytter mellom faner. Konteksten til data lakehouse er alltid lett tilgjengelig.
Ikke-blokkerende listelasting: En ikke-blokkerende innlastingsmekanisme for filer og tabeller. Du kan fortsette å arbeide mens listen oppdateres i bakgrunnen. Det sikrer at du har de nyeste dataene samtidig som du får en jevn og uavbrutt opplevelse.
Tydelig definerte varsler: Varslingene angir hvilket lakehouse de kommer fra, noe som gjør det enklere å spore endringer og oppdateringer i miljøet med flere oppgaver.
Tilgjengelig lakehouse design
Tilgjengelighet har alltid vært en topp prioritet for å sikre at Lakehouse er inkluderende og brukervennlig for alle. Her er de viktigste initiativene vi har implementert så langt for å støtte tilgjengelighet:
Skjermleserkompatibilitet: Du kan arbeide sømløst med populære skjermlesere, slik at synshemmede brukere kan navigere og samhandle effektivt med plattformen vår.
Responsiv utforming for tekstflyt som tilpasser seg ulike skjermstørrelser og retninger. Tekst- og innholdsflyt dynamisk, noe som gjør det enklere for brukere å vise og samhandle med programmet vårt på en rekke enheter.
Tastaturnavigasjon: Forbedret tastaturnavigasjon slik at brukerne kan bevege seg gjennom lakehouse uten å stole på en mus, noe som forbedrer opplevelsen for de med motoriske funksjonshemninger.
Alternativ tekst for bilder: Alle bilder inneholder nå en beskrivende alternativ tekst, noe som gjør det mulig for skjermlesere å formidle meningsfull informasjon.
Skjemafelt og etiketter: Alle skjemafelt har tilknyttede etiketter, noe som forenkler datainndata for alle, inkludert de som bruker skjermlesere.
Relatert innhold
I denne oversikten får du en grunnleggende forståelse av et lakehouse. Gå videre til neste artikkel for å lære hvordan du oppretter og bruker ditt eget lakehouse:
- Hvis du vil begynne å bruke lakehouses, kan du se Opprette et lakehouse i Microsoft Fabric.