Partager via


Qualité des données pour les bases de données de raccourcis Microsoft Fabric

Les raccourcis sont des objets dans OneLake qui pointent vers d’autres emplacements de stockage. L’emplacement peut être interne ou externe à OneLake. L’emplacement vers lequel pointe un raccourci est appelé chemin cible du raccourci. L’emplacement où le raccourci s’affiche est appelé chemin de raccourci. Les raccourcis apparaissent sous forme de dossiers dans OneLake et toute charge de travail ou service ayant accès à OneLake peut les utiliser.

Les raccourcis dans Microsoft OneLake vous permettent d’unifier vos données entre des domaines, des clouds et des comptes en créant un lac de données virtuel unique pour l’ensemble de votre entreprise. Toutes les expériences Microsoft Fabric et tous les moteurs analytiques peuvent se connecter directement à vos sources de données existantes, telles qu’Azure, Amazon Web Services (AWS) et OneLake via un espace de noms unifié. OneLake gère toutes les autorisations et informations d’identification afin que vous n’ayez pas besoin de configurer séparément chaque charge de travail Fabric pour vous connecter à chaque source de données.

Pour plus d’informations sur les raccourcis Microsoft Fabric, consultez la documentation Fabric.

Configurer la qualité des données pour les bases de données de raccourcis Fabric

Connectez-vous à votre espace de travail Microsoft Fabric. Sélectionnez le bouton de sélection sous Tables, puis sélectionnez Nouveau raccourci. À partir de là, vous pouvez créer :

Capture d’écran de l’espace de travail Fabric, avec le bouton nouveau raccourci mis en évidence.

Raccourci Azure Data Lake Gen2

  1. Sélectionnez le raccourci Azure Data Lake Storage Gen2 dans la page Nouveau raccourci de l’espace de travail Fabric.

    Capture d’écran de la page De nouveaux raccourcis Fabric avec ADLS Gen2 mis en surbrillance.

  2. Sélectionnez Authentification SAS ADLS Gen2.

    Capture d’écran de la nouvelle fenêtre de raccourci avec l’authentification par jeton SAS sélectionnée.

  3. Générez une SAP et chaîne de connexion pour votre ressource ADLS Gen2 dans le Portail Azure.

  4. Copiez le point de terminaison du lac de données.

    Capture d’écran de la copie du point de terminaison du lac de données dans le Portail Azure.

  5. Ajoutez des détails de stockage pour le stockage de raccourcis.

    Capture d’écran montrant l’ajout de détails de stockage au raccourci Fabric dans la nouvelle fenêtre de raccourci.

  6. Accédez au dossier delta approprié et choisissez-le.

    Capture d’écran montrant le dossier delta approprié dans la nouvelle fenêtre de raccourci.

  7. Affichez un aperçu de la table delta de raccourci dans votre espace de travail Fabric.

    Capture d’écran de l’aperçu de la table delta OneLake.

  8. Démarrez une analyse de votre ressource Azure Data Lake Gen2 dans le Mappage de données Microsoft Purview à l’aide de l’authentification du principal de service.

    Capture d’écran de l’analyse de la carte de données pour ADLS Gen2.

  9. Une fois l’analyse terminée, votre ressource de données doit apparaître dans le catalogue de données sous la forme d’une table lakehouse.

  10. Associez la ressource à un produit de données pour la curation et l’évaluation de la qualité des données.

    Capture d’écran de la ressource de données de raccourci dans le catalogue.

  11. Ouvrez la solution Qualité des données Microsoft Purview et exécutez une analyse de la qualité des données ou profilez vos données comme d’habitude.

Raccourci Amazon S3

  1. Sélectionnez Nouveau raccourci dans l’espace de travail Microsoft Fabric.

  2. Sélectionnez AWS S3 et ajoutez l’URL, l’ID de clé d’accès et le raccourci de la touche d’accès.

    Capture d’écran de la page de nouveau raccourci Amazon S3 avec des détails supplémentaires.

  3. Ajoutez l’URL de connexion et les détails de stockage.

    Capture d’écran de la page de nouveau raccourci Amazon S3 avec l’URL de connexion et les détails de stockage ajoutés.

  4. Affichez un aperçu du raccourci dans votre espace de travail Fabric.

  5. Démarrez une analyse de votre ressource Amazon S3 dans le Mappage de données Microsoft Purview à l’aide de l’authentification du principal de service.

  6. Une fois l’analyse terminée, votre ressource de données doit apparaître dans le catalogue de données.

  7. Associez la ressource à un produit de données pour la curation et l’évaluation de la qualité des données.

  8. Ouvrez la solution Qualité des données Microsoft Purview et exécutez une analyse de la qualité des données ou profilez vos données comme d’habitude.

Raccourci Google Cloud Storage (GCS)

  1. Sélectionnez Nouveau raccourci dans l’espace de travail Microsoft Fabric.

  2. Sélectionnez Stockage Google Cloud et ajoutez l’URL, l’ID de la clé d’accès et le raccourci de la touche d’accès.

    Capture d’écran de la touche HMAC du raccourci GCS.

  3. Ajoutez l’URL de connexion et les détails de stockage,

    Capture d’écran de l’URL de connexion GCS.

  4. Affichez un aperçu du raccourci dans votre espace de travail Fabric.

  5. Démarrez une analyse de votre ressource Amazon S3 dans le Mappage de données Microsoft Purview à l’aide de l’authentification du principal de service.

  6. Une fois l’analyse terminée, votre ressource de données doit apparaître dans le catalogue de données.

  7. Associez la ressource à un produit de données pour la curation et l’évaluation de la qualité des données.

  8. Ouvrez la solution Qualité des données Microsoft Purview et exécutez une analyse de la qualité des données ou profilez vos données comme d’habitude.

Importante

  • Utilisez un principal de service pour les analyses de carte de données et l’identité managée pour les analyses de la qualité des données.
  • Toutes les données issues d’un raccourci sont traitées dans la même région.
  • La collecte de métadonnées dans Purview pour les sous-objets Fabric Lakehouse est une amélioration basée sur la collecte de métadonnées pour Fabric qui a été publiée en décembre 2023. Cette fonctionnalité est à l’étape de préversion privée .
  • Il existe une dépendance vis-à-vis de l’équipe Fabric pour différencier les éléments de raccourci des éléments natifs dans les sous-articles du Kit de développement logiciel (SDK) OneLake pour Lakehouse. Pour l’instant, tous les éléments de raccourci (tables et fichiers) sont considérés comme des éléments natifs dans l’analyse. Vous devez mettre en liste verte votre locataire pour activer l’évaluation DQ des données fabric lakehouse.