Conception de schémas en étoile
Il est rare qu’un modèle sémantique Power BI soit composé d’une seule table. Un modèle à table unique peut être une conception simple, peut-être un modèle adapté à une tâche d’exploration de données ou une preuve de concept, mais pas une conception de modèle optimale. Un modèle optimal respecte les principes de conception schéma en étoile. Le schéma en étoile fait référence à une approche de conception couramment utilisée par les concepteurs d’entrepôts de données relationnelles, car il présente une structure conviviale et prend en charge les requêtes analytiques à hautes performances.
Ce principe de conception est appelé schéma en étoile, car il classe les tables de modèle en tant que fait ou dimension. Dans un diagramme, une table de faits forme le centre d’une étoile, tandis que les tables de dimension, lorsqu’elles sont placées autour d’une table de faits, représentent les points de l’étoile.
Tables de faits
Le rôle d’une table de faits est de stocker une accumulation de lignes qui représentent des observations ou des événements qui enregistrent une activité métier spécifique. Par exemple, les événements stockés dans une table de faits de ventes peuvent être des commandes client et des lignes de commande. Vous pouvez également utiliser une table de faits pour enregistrer les mouvements de stocks, les soldes boursiers ou les taux de change quotidiens de la devise. En règle générale, les tables de faits contiennent de nombreuses lignes. À mesure que le temps passe, les lignes de la table de faits s’accumulent. Dans les requêtes analytiques (qui seront définies plus loin dans ce module), les données de la table de faits sont résumées pour produire des valeurs telles que les ventes et la quantité.
Tables de dimension
Les tables de dimension décrivent vos entités métier, qui représentent généralement des personnes, des lieux, des produits ou des concepts. Une table de dimension de date, qui contient une ligne pour chaque date, est un exemple courant de table de dimension de concept. Les colonnes des tables de dimension permettent le filtrage et le regroupement des données de la table de faits.
Chaque table de dimension doit avoir une colonne unique, appelée colonne clé. Une colonne unique ne contient pas de valeurs dupliquées et ne doit jamais comporter de valeurs manquantes. Dans une table de dimension de produit, la colonne peut être nommée ProductKey ou ProductID. Il est probable que des colonnes supplémentaires stockent des valeurs descriptives, telles que le nom du produit, la sous-catégorie, la catégorie, la couleur, etc. Dans les requêtes analytiques, ces colonnes sont utilisées pour filtrer et regrouper les données.
Comparer les tables de faits et de dimension
La figure suivante compare les caractéristiques des tables de faits et de dimension.
Caractéristique | Table de dimension | Table de faits |
---|---|---|
Objectif du modèle | Stocke les entités métier | Stocke les événements ou les observations |
Structure de table | Contient une colonne clé et des colonnes descriptives pour le filtrage et le regroupement | Contient les colonnes de clé de dimension et les colonnes de mesure numériques qui peuvent être résumées |
Volume de données | En général, contient moins de lignes (par rapport aux tables de faits) | Peut contenir de nombreuses lignes |
Objectif de la requête | Pour filtrer et grouper | Pour résumer |
Associer des tables de schéma en étoile
Dans le modèle, les tables de dimension sont liées aux tables de faits à l’aide de relations un-à-plusieurs. Les relations permettent aux filtres et aux groupes appliqués aux colonnes de la table de dimension de se propager à la table de faits. Ce modèle de conception est courant.
Les tables de dimension peuvent être utilisées pour filtrer plusieurs tables de faits et les tables de faits peuvent être filtrées par plusieurs tables de dimension. Toutefois, il n’est pas recommandé de lier une table de faits directement à une autre table de faits.
Pour pratiquer ce concept, téléchargez le fichier Adventure Works DW 2020 M01.pbix, ouvrez-le, puis basculez vers le modèle de diagramme.
Notez que le modèle est composé de sept tables, dont l’une est nommée Ventes et représente la table de faits. Les tables restantes sont des tables de dimension et elles portent les noms suivants :
- Client
- Date
- Product
- Reseller
- Commande client
- Secteur de vente
Notez les relations entre les tables de dimension et de faits et que chaque direction de filtre de relation pointe vers la table de faits. Par conséquent, lorsque des filtres sont appliqués aux colonnes de la table de dimension (pour filtrer ou grouper par valeurs de colonne), les faits associés sont filtrés et résumés.
Si vous examinez le modèle, vous pouvez voir une forme en étoile.
Pour plus d’informations sur la conception « schéma en étoile », consultez Comprendre le schéma en étoile et l’importance pour Power BI.