Dimensionsmodellering i Microsoft Fabric Warehouse
Gäller för:✅ SQL-analysslutpunkt och lager i Microsoft Fabric
Den här artikeln är den första i en serie om dimensionsmodellering i ett lager. Det ger praktisk vägledning för Warehouse i Microsoft Fabric, vilket är en upplevelse som stöder många T-SQL-funktioner, till exempel att skapa tabeller och hantera data i tabeller. Därför har du fullständig kontroll över att skapa dina dimensionsmodelltabeller och läsa in dem med data.
Kommentar
I den här artikeln refererar termen informationslager till ett informationslager för företag, som ger omfattande integrering av kritiska data i hela organisationen. Det fristående termlagret refererar däremot till ett infrastrukturlager, som är en saaS-relationsdatabas (programvara som en tjänst) som du kan använda för att implementera ett informationslager. För tydlighetens skull nämns den senare i den här artikeln som Infrastrukturlager.
Dricks
Om du är oerfaren med dimensionsmodellering bör du tänka på att den här artikelserien är ditt första steg. Det är inte avsett att ge en fullständig diskussion om dimensionsmodelleringsdesign. Mer information finns direkt i allmänt antaget publicerat innehåll, till exempel The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3rd edition, 2013) av Ralph Kimball och andra.
Designa star-schema
Star-schemat är en designteknik för dimensionsmodellering som används av relationsdatalager. Det är en rekommenderad designmetod att använda när du skapar ett infrastrukturlager. Ett stjärnschema består av faktatabeller och dimensionstabeller.
- Dimensionstabeller beskriver de entiteter som är relevanta för din organisation och dina analyskrav. I stort sett representerar de de saker som du modellerar. Saker kan vara produkter, personer, platser eller något annat koncept, inklusive datum och tid. Mer information och metodtips för design finns i Dimensionstabeller i den här serien.
- Faktatabeller lagrar mått som är associerade med observationer eller händelser. De kan lagra försäljningsorder, lagersaldon, växelkurser, temperaturavläsningar med mera. Faktatabeller innehåller dimensionsnycklar tillsammans med detaljerade värden som kan aggregeras. Mer information och metodtips för design finns i Faktatabeller i den här serien.
En star-schemadesign är optimerad för analysfrågasarbetsbelastningar. Därför anses det vara en förutsättning för företagets Power BI-semantiska modeller. Analysfrågor handlar om filtrering, gruppering, sortering och sammanfattning av data. Faktadata sammanfattas i kontexten för filter och gruppering av de relaterade dimensionstabellerna.
Anledningen till att det kallas ett stjärnschema är att en faktatabell utgör mitten av en stjärna medan de relaterade dimensionstabellerna utgör stjärnans punkter.
Ett stjärnschema innehåller ofta flera faktatabeller och därför flera stjärnor.
Ett väldesignade star-schema levererar frågor med höga prestanda (relationsfrågor) på grund av färre tabellkopplingar och den högre sannolikheten för användbara index. Dessutom kräver ett star-schema ofta lågt underhåll i takt med att informationslagrets design utvecklas. Att till exempel lägga till en ny kolumn i en dimensionstabell för att stödja analys av ett nytt attribut är en relativt enkel uppgift att utföra. Liksom att lägga till nya fakta och dimensioner när datalagrets omfång utvecklas.
Tabellerna i en dimensionsmodell uppdateras och läses in med jämna mellanrum, kanske dagligen, av en ETL-process (Extract, Transform, and Load). Den här processen synkroniserar sina data med källsystemen, som lagrar driftdata. Mer information finns i Läsa in tabeller i den här serien.
Dimensionsmodellering för Power BI
För företagslösningar är en dimensionsmodell i ett infrastrukturlager en rekommenderad förutsättning för att skapa en Power BI-semantisk modell. Dimensionsmodellen stöder inte bara den semantiska modellen, utan den är också en datakälla för andra upplevelser, till exempel maskininlärningsmodeller.
Under vissa omständigheter kanske det dock inte är den bästa metoden. Till exempel kan självbetjäningsanalytiker som behöver frihet och flexibilitet agera snabbt, och utan beroende av IT, skapa semantiska modeller som ansluter direkt till källdata. I sådana fall är teorin om dimensionsmodellering fortfarande relevant. Den teorin hjälper analytiker att skapa intuitiva och effektiva modeller, samtidigt som man undviker behovet av att skapa och läsa in en dimensionsmodell i ett informationslager. I stället kan en kvasidimensionell modell skapas med hjälp av Power Query, som definierar logiken för att ansluta till och transformera källdata för att skapa och läsa in semantiska modelltabeller. Mer information finns i Förstå star-schema och vikten för Power BI.
Viktigt!
När du använder Power Query för att definiera en dimensionsmodell i den semantiska modellen kan du inte hantera historiska ändringar, vilket kan vara nödvändigt för att analysera det förflutna korrekt. Om det är ett krav bör du skapa ett informationslager och tillåta periodiska ETL-processer att samla in och lagra dimensionsändringar på lämpligt sätt.
Planera för ett informationslager
Du bör hantera skapandet av ett informationslager och utforma en dimensionsmodell som ett seriöst och viktigt åtagande. Det beror på att informationslagret är en kärnkomponent i din dataplattform. Den bör utgöra en solid grund som stöder analys och rapportering – och därmed beslutsfattande – för hela organisationen.
I detta syfte bör ditt informationslager sträva efter att lagra kvalitets-, efterlevnads- och historiskt korrekta data som en enda version av sanningen. Den bör leverera begripliga och navigeringsbara data med snabba prestanda och framtvinga behörigheter så att rätt data bara kan nås av rätt personer. Sträva efter att utforma ditt informationslager för motståndskraft, så att det kan anpassas till förändringar när dina krav utvecklas.
En lyckad implementering av ett informationslager beror på god planering. Information om strategiska och taktiska överväganden och åtgärdsobjekt som leder till en lyckad implementering av Fabric och ditt informationslager finns i microsoft fabric-implementeringsöversikten.
Dricks
Vi rekommenderar att du skapar företagets informationslager iterativt. Börja först med de viktigaste ämnesområdena och utöka sedan informationslagret med andra ämnesområden efter prioritet och resurser över tid.
Relaterat innehåll
I nästa artikel i den här serien får du lära dig mer om vägledning och metodtips för dimensionstabeller.