Partilhar via


Conecte-se ao ADLS e transforme os dados com o Azure Databricks

Neste guia, você irá:

  • Crie uma tabela Delta na sua conta do Azure Data Lake Storage (ADLS) Gen2 usando o Azure Databricks.

  • Crie um atalho OneLake para uma tabela Delta no ADLS.

  • Use o Power BI para analisar dados por meio do atalho ADLS.

Pré-requisitos

Antes de começar, você deve ter:

  • Um espaço de trabalho com um item Lakehouse

  • Um espaço de trabalho do Azure Databricks

  • Uma conta ADLS Gen2 para armazenar tabelas Delta

Criar uma tabela Delta, criar um atalho e analisar os dados

  1. Usando um bloco de anotações do Azure Databricks, crie uma tabela Delta em sua conta ADLS Gen2.

     # Replace the path below to refer to your sample parquet data with this syntax "abfss://<storage name>@<container name>.dfs.core.windows.net/<filepath>"
    
     # Read Parquet files from an ADLS account
     df = spark.read.format('Parquet').load("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/full/dimension_city/")
    
     # Write Delta tables to ADLS account
     df.write.mode("overwrite").format("delta").save("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/adb_dim_city_delta/")
    
  2. Na casa do lago, selecione as reticências (...) ao lado de Tabelas e, em seguida, selecione Novo atalho.

    Captura de ecrã a mostrar a localização do Novo Atalho em Tabelas.

  3. Na tela Novo atalho, selecione o bloco Azure Data Lake Storage Gen2.

    Captura de ecrã das opções de mosaico no ecrã Novo atalho.

  4. Especifique os detalhes da conexão para o atalho e selecione Avançar.

    Captura de ecrã a mostrar onde introduzir as definições de Ligação para um novo atalho.

  5. Especifique os detalhes do atalho. Forneça um Nome de Atalho e detalhes do Subcaminho e selecione Criar. O subcaminho deve apontar para o diretório onde a tabela Delta reside.

    Captura de tela mostrando onde inserir novos detalhes de atalho.

  6. O atalho aparece como uma tabela Delta em Tabelas.

    Captura de tela mostrando a localização do atalho ADLS recém-criado.

  7. Agora você pode consultar esses dados diretamente de um bloco de anotações.

    df = spark.sql("SELECT * FROM lakehouse1.adls_shortcut_adb_dim_city_delta LIMIT 1000")
    display(df)
    
  8. Para aceder e analisar esta tabela Delta através do Power BI, selecione Novo modelo semântico do Power BI.

    Captura de ecrã a mostrar como criar um novo modelo semântico do Power BI.

  9. Selecione o atalho e, em seguida, selecione Confirmar.

    Captura de tela mostrando a nova configuração do modelo semântico.

  10. Quando os dados forem publicados, selecione Iniciar do zero.

    Captura de tela mostrando o processo para configurar um conjunto de dados.

  11. Na experiência de criação de relatório, os dados de atalho aparecem como uma tabela junto com todos os seus atributos.

    Captura de tela mostrando a experiência de criação e os atributos da tabela.

  12. Para criar um relatório do Power BI, arraste os atributos para o painel no lado esquerdo.

    Captura de ecrã a mostrar os dados que estão a ser consultados através do relatório do Power BI.