Partager via


Connectez-vous à ADLS et transformez les données avec Azure Databricks

Dans ce guide, vous allez :

  • Créez une table Delta dans votre compte Azure Data Lake Storage (ADLS) Gen2 à l’aide d’Azure Databricks.

  • Créez un raccourci OneLake vers une table Delta dans ADLS.

  • Utilisez Power BI pour analyser les données via le raccourci ADLS.

Prérequis

Avant de commencer, vous devez avoir :

  • Un espace de travail avec un élément Lakehouse

  • Un espace de travail Azure Databricks

  • Un compte ADLS Gen2 pour stocker les tables Delta

Créez une table Delta, créez un raccourci et analysez les données

  1. À l'aide d’un notebook Azure Databricks, créez une table Delta dans votre compte ADLS Gen2.

     # Replace the path below to refer to your sample parquet data with this syntax "abfss://<storage name>@<container name>.dfs.core.windows.net/<filepath>"
    
     # Read Parquet files from an ADLS account
     df = spark.read.format('Parquet').load("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/full/dimension_city/")
    
     # Write Delta tables to ADLS account
     df.write.mode("overwrite").format("delta").save("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/adb_dim_city_delta/")
    
  2. Dans votre lakehouse, sélectionnez les points de suspension (...) à côté de Tables, puis sélectionnez Nouveau raccourci.

    Capture d'écran montrant l'emplacement du nouveau raccourci dans les tableaux.

  3. Dans l'écran Nouveau raccourci, sélectionnez la vignette Azure Data Lake Storage Gen2.

    Capture d'écran des options de mosaïque dans l'écran Nouveau raccourci.

  4. Spécifiez les détails de connexion pour le raccourci, puis sélectionnez Suivant.

    Capture d'écran montrant où entrer les paramètres de connexion pour un nouveau raccourci.

  5. Spécifiez les détails du raccourci. Fournissez un Nom de raccourci et des détails de Sous-chemin, puis sélectionnez Créer. Le sous-chemin doit pointer vers le répertoire où se trouve la table Delta.

    Capture d'écran montrant où saisir les nouveaux détails du raccourci.

  6. Le raccourci s’affiche sous forme de table Delta dans Tables.

    Capture d'écran montrant l'emplacement du raccourci ADLS nouvellement créé.

  7. Vous pouvez maintenant interroger ces données directement à partir d’un notebook.

    df = spark.sql("SELECT * FROM lakehouse1.adls_shortcut_adb_dim_city_delta LIMIT 1000")
    display(df)
    
  8. Pour accéder et analyser cette table Delta via Power BI, sélectionnez Nouveau modèle sémantique Power BI.

    Capture d'écran montrant comment créer un modèle sémantique Power BI.

  9. Sélectionnez le raccourci, puis sélectionnez Confirmer.

    Capture d’écran montrant la configuration du nouveau modèle sémantique.

  10. Lorsque les données sont publiées, sélectionnez Recommencer à zéro.

    Capture d'écran montrant le processus de configuration d'un jeu de données.

  11. Dans l'expérience de création de rapports, les données de raccourci apparaissent sous forme de tableau avec tous leurs attributs.

    Capture d'écran montrant l'expérience de création et les attributs de table.

  12. Pour générer un rapport Power BI, faites glisser les attributs vers le volet sur le côté gauche.

    Capture d'écran montrant les données interrogées via le rapport Power BI.