Qualité des données pour les bases de données de raccourcis Microsoft Fabric
Les raccourcis sont des objets dans OneLake qui pointent vers d’autres emplacements de stockage. L’emplacement peut être interne ou externe à OneLake. L’emplacement vers lequel pointe un raccourci est appelé chemin cible du raccourci. L’emplacement où le raccourci s’affiche est appelé chemin de raccourci. Les raccourcis apparaissent sous forme de dossiers dans OneLake et toute charge de travail ou service ayant accès à OneLake peut les utiliser.
Les raccourcis dans Microsoft OneLake vous permettent d’unifier vos données entre des domaines, des clouds et des comptes en créant un lac de données virtuel unique pour l’ensemble de votre entreprise. Toutes les expériences Microsoft Fabric et tous les moteurs analytiques peuvent se connecter directement à vos sources de données existantes, telles qu’Azure, Amazon Web Services (AWS) et OneLake via un espace de noms unifié. OneLake gère toutes les autorisations et informations d’identification afin que vous n’ayez pas besoin de configurer séparément chaque charge de travail Fabric pour vous connecter à chaque source de données.
Pour plus d’informations sur les raccourcis Microsoft Fabric, consultez la documentation Fabric.
Configurer la qualité des données pour les bases de données de raccourcis Fabric
Connectez-vous à votre espace de travail Microsoft Fabric. Sélectionnez le bouton de sélection sous Tables, puis sélectionnez Nouveau raccourci. À partir de là, vous pouvez créer :
Raccourci Azure Data Lake Gen2
Sélectionnez le raccourci Azure Data Lake Storage Gen2 dans la page Nouveau raccourci de l’espace de travail Fabric.
Sélectionnez Authentification SAS ADLS Gen2.
Générez une SAP et chaîne de connexion pour votre ressource ADLS Gen2 dans le Portail Azure.
Copiez le point de terminaison du lac de données.
Ajoutez des détails de stockage pour le stockage de raccourcis.
Accédez au dossier delta approprié et choisissez-le.
Affichez un aperçu de la table delta de raccourci dans votre espace de travail Fabric.
Démarrez une analyse de votre ressource Azure Data Lake Gen2 dans le Mappage de données Microsoft Purview à l’aide de l’authentification du principal de service.
Une fois l’analyse terminée, votre ressource de données doit apparaître dans le catalogue de données sous la forme d’une table lakehouse.
Associez la ressource à un produit de données pour la curation et l’évaluation de la qualité des données.
Ouvrez la solution Qualité des données Microsoft Purview et exécutez une analyse de la qualité des données ou profilez vos données comme d’habitude.
Raccourci Amazon S3
Sélectionnez Nouveau raccourci dans l’espace de travail Microsoft Fabric.
Sélectionnez AWS S3 et ajoutez l’URL, l’ID de clé d’accès et le raccourci de la touche d’accès.
Ajoutez l’URL de connexion et les détails de stockage.
Affichez un aperçu du raccourci dans votre espace de travail Fabric.
Démarrez une analyse de votre ressource Amazon S3 dans le Mappage de données Microsoft Purview à l’aide de l’authentification du principal de service.
Une fois l’analyse terminée, votre ressource de données doit apparaître dans le catalogue de données.
Associez la ressource à un produit de données pour la curation et l’évaluation de la qualité des données.
Ouvrez la solution Qualité des données Microsoft Purview et exécutez une analyse de la qualité des données ou profilez vos données comme d’habitude.
Raccourci Google Cloud Storage (GCS)
Sélectionnez Nouveau raccourci dans l’espace de travail Microsoft Fabric.
Sélectionnez Stockage Google Cloud et ajoutez l’URL, l’ID de la clé d’accès et le raccourci de la touche d’accès.
Ajoutez l’URL de connexion et les détails de stockage,
Affichez un aperçu du raccourci dans votre espace de travail Fabric.
Démarrez une analyse de votre ressource Amazon S3 dans le Mappage de données Microsoft Purview à l’aide de l’authentification du principal de service.
Une fois l’analyse terminée, votre ressource de données doit apparaître dans le catalogue de données.
Associez la ressource à un produit de données pour la curation et l’évaluation de la qualité des données.
Ouvrez la solution Qualité des données Microsoft Purview et exécutez une analyse de la qualité des données ou profilez vos données comme d’habitude.
Importante
- Utilisez un principal de service pour les analyses de carte de données et l’identité managée pour les analyses de la qualité des données.
- Toutes les données issues d’un raccourci sont traitées dans la même région.
- La collecte de métadonnées dans Purview pour les sous-objets Fabric Lakehouse est une amélioration basée sur la collecte de métadonnées pour Fabric qui a été publiée en décembre 2023. Cette fonctionnalité est à l’étape de préversion privée .
- Il existe une dépendance vis-à-vis de l’équipe Fabric pour différencier les éléments de raccourci des éléments natifs dans les sous-articles du Kit de développement logiciel (SDK) OneLake pour Lakehouse. Pour l’instant, tous les éléments de raccourci (tables et fichiers) sont considérés comme des éléments natifs dans l’analyse. Vous devez mettre en liste verte votre locataire pour activer l’évaluation DQ des données fabric lakehouse.