Partager via


Guide de décision Microsoft Fabric : choisir entre l’entrepôt de données et Lakehouse

Microsoft Fabric offre deux charges de travail de format standard ouvert à l’échelle de l’entreprise pour le stockage de données : Warehouse et Lakehouse. Cet article compare les deux plateformes et les points de décision pour chacune d’elles.

Critère

Diagramme qui contient des arbres de décision pour Lakehouse et Warehouse dans Microsoft Fabric.

Solutions no-code ou pro-code : De quelle manière souhaitez-vous développer ?

  • Spark
    • Utiliser Lakehouse
  • T-SQL
    • Utiliser Warehouse

Besoins d’entreposage : Avez-vous besoin de transactions à plusieurs tables ?

  • Oui
    • Utiliser Warehouse
  • Non
    • Utiliser Lakehouse

Complexité des données : Quel type de données analysez-vous ?

  • Je ne sais pas
    • Utiliser Lakehouse
  • Données non structurées et structurées
    • Utiliser Lakehouse
  • Données structurées uniquement
    • Utiliser Warehouse

Choisir un service candidat

Effectuez une évaluation détaillée du service pour confirmer qu’il répond à vos besoins.

L’élément Entrepôt de données dans Fabric Data Warehouse est un entrepôt de données à l’échelle de l’entreprise au format standard ouvert.

  • Aucune performance à définir avec un minimum de configuration et de déploiement, aucune configuration de calcul ou de stockage nécessaire. ​
  • Expériences d’entrepôt simples et intuitives pour les professionnels des données débutants et expérimentés (no/pro code).
  • L’entrepôt centré sur le lac stocke les données dans OneLake au format Delta ouvert avec une récupération et une gestion faciles des données.
  • Entièrement intégré à toutes les charges de travail Fabric.
  • Chargement et transformation des données à grande échelle, avec des garanties transactionnelles multi-tables complètes fournies par le moteur SQL.
  • Entrepôts virtuels avec interrogation entre bases de données et une couche sémantique entièrement intégrée.
  • Plateforme prête pour l’entreprise avec des performances et une visibilité de l’utilisation de bout en bout, avec une gouvernance et une sécurité intégrées.
  • Flexibilité pour créer un entrepôt de données ou un maillage de données en fonction des besoins organisationnels et du choix d’un code no-code, à faible code ou d’un T-SQL pour les transformations.

L’élément Lakehouse dans Fabric Data Engineering est une plateforme d’architecture de données permettant de stocker, de gérer et d’analyser des données structurées et non structurées au même endroit.

  • Stockez, gérez et analysez des données structurées et non structurées dans un emplacement unique pour obtenir des insights et prendre des décisions plus rapidement et efficacement.
  • Solution flexible et évolutive qui permet aux organisations de gérer de grands volumes de données de tous types et de toutes tailles.
  • Ingérer facilement des données à partir de nombreuses sources différentes, qui sont converties au format Delta unifié
  • Détection et inscription automatiques des tables pour une expérience de fichier à table entièrement managée pour les ingénieurs données et les scientifiques des données. ​
  • Point de terminaison d’analytique SQL automatique et jeu de données par défaut qui permet l’interrogation T-SQL de tables delta dans le lac

Les deux sont inclus dans les capacités Power BI Premium ou Fabric.

Comparer les différentes fonctionnalités d’entreposage

Cette table compare l’entrepôt et le point de terminaison d’analytique SQL du Lakehouse.

Offre Microsoft Fabric

Entrepôt

Point de terminaison d’analytique SQL de Lakehouse


Fonctionnalités principales

Stockage de données complet conforme à ACID avec prise en charge des transactions dans T-SQL.

Lecture seule, point de terminaison d’analytique SQL généré par le système pour Lakehouse pour l’interrogation et le service T-SQL. Prend en charge l’analytique sur les tables Delta Lakehouse et les dossiers Delta Lake référencés via des raccourcis.


Profil de développeur

Développeurs SQL ou développeurs citoyens

Ingénieurs données ou développeurs SQL


Chargement de données

SQL, pipelines, flux de données

Spark, pipelines, flux de données, raccourcis


Prise en charge de la table Delta

Lit et écrit des tables Delta

Lit les tables delta


Couche de stockage

Format de données ouvert - Delta

Format de données ouvert - Delta


Cas d’usage recommandé

  • Entreposage de données pour une utilisation en entreprise
  • Entreposage de données qui prend en charge l’utilisation du service, de l’unité commerciale ou du libre-service
  • Analyse structurée des données dans T-SQL avec des tables, des vues, des procédures et des fonctions et une prise en charge de SQL avancé pour BI
  • Exploration et interrogation de tables delta à partir du lakehouse
  • Mise en lots de zone de données et d’archivage pour l’analyse
  • Architecture Medallion lakehouse avec des zones pour l’analyse du bronze, de l’argent et de l’or
  • Jumelage avec l’entreposage pour les cas d’usage de l’analytique d’entreprise

Expérience de développement

  • Éditeur d’entrepôt avec prise en charge complète des expériences d’interface utilisateur pour l’ingestion, la modélisation, le développement et l’interrogation des données T-SQL pour l’ingestion, la modélisation et l’interrogation des données
  • Prise en charge de la lecture/écriture pour les outils tiers
  • Point de terminaison d’analytique SQL Lakehouse avec prise en charge limitée de T-SQL pour les vues, les fonctions table et les requêtes SQL
  • Expériences d’interface utilisateur pour la modélisation et l’interrogation
  • Prise en charge limitée de T-SQL pour les outils tiers

Fonctionnalités T-SQL

Prise en charge T-SQL complète de DQL, DML et DDL, prise en charge complète des transactions

Prise en charge T-SQL complète de DQL, pas de DML, limitée de DDL, comme les vues SQL et les fonctions à valeurs de tables