Tutorial do Lakehouse: criar um lakehouse, ingerir dados de exemplo e criar um relatório
Nesse tutorial, você cria um lakehouse, ingere dados de exemplo na tabela Delta, aplica a transformação quando necessário e, em seguida, cria relatórios. Neste tutorial, você aprenderá a:
- Criar um lakehouse com base na carga de trabalho de Engenharia de Dados
- Baixar e ingerir dados de cliente de exemplo
- Adicionar tabelas ao modelo semântico
- Criar um relatório
Caso não tenha um Microsoft Fabric, inscreva-se para obter uma capacidade de avaliação gratuita.
Pré-requisitos
- Antes de criar um lakehouse, crie um espaço de trabalho do Fabric.
- Antes de ingerir um arquivo CSV, o OneDrive deverá estar configurado. Se você não tiver o OneDrive configurado, inscreva-se na avaliação gratuita do Microsoft 365: Avaliação gratuita - Experimente o Microsoft 365 por um mês.
Criar um lakehouse
Nesta seção, você criará um lakehouse com base na experiência de Engenharia de Dados.
Em Power BI, selecione Espaços de trabalho no menu à esquerda.
Para abrir seu workspace, insira seu nome na caixa de texto de pesquisa localizada na parte superior e selecione-o nos resultados da pesquisa.
No comutador localizado na parte inferior esquerda, selecione Engenharia de Dados.
Na tela Engenharia de Dados, selecione Lakehouse para criar um lakehouse.
Na caixa de diálogo Novo lakehouse, insira wwilakehouse no campo Nome .
Selecione Criar para criar e abrir o novo lakehouse.
Ingerir dados de exemplo
Nesta seção, você ingerirá dados de cliente de exemplo no lakehouse.
Observação
Se você não tiver o OneDrive configurado, inscreva-se na avaliação gratuita do Microsoft 365: Avaliação gratuita - Experimente o Microsoft 365 por um mês.
Baixe o arquivo dimension_customer.csv do repositório de exemplos do Fabric.
Na guia Início, em Obter dados no lakehouse, você verá as opções para carregar dados no lakehouse. Selecione Novo Fluxo de Dados Gen2.
No novo painel de fluxo de dados, selecione Importar de um arquivo de texto ou CSV.
No painel Conectar-se à fonte de dados, selecione o botão de opção Carregar arquivo. Arraste e solte o arquivo dedimension_customer.csv que você baixou na etapa 1. Depois que o arquivo for carregado, selecione Avançar.
Na página Visualizar dados do arquivo , visualize os dados e selecione Criar para continuar e retornar à tela de fluxo de dados.
No painel Configurações de Consulta, atualize o campo Nome como dimension_customer.
Observação
O Fabric adiciona um espaço e um número no final do nome da tabela por padrão. Os nomes de tabela devem ser minúsculos e não devem conter espaços. Renomeie-o adequadamente e remova todos os espaços do nome da tabela.
Neste tutorial, você associou os dados do cliente a um lakehouse. Caso queira adicionar outros itens de dados ao lakehouse, poderá adicioná-los desta forma:
Nos itens de menu, selecione Adicionar destino de dados e selecione Lakehouse. Na tela Conectar-se ao destino de dados, entre em sua conta, se necessário, e selecione Avançar.
Navegue até o wwilakehouse em seu workspace.
Se a tabela dimension_customer não existir, selecione a configuração Nova tabela e insira o nome da tabela dimension_customer. Se a tabela já existir, selecione a configuração Tabela existente e escolha dimension_customer na lista de tabelas no pesquisador de objetos. Selecione Avançar.
No painel Escolher configurações de destino , selecione Substituir como Método de atualização. Selecione Salvar configurações para retornar à tela de fluxo de dados.
Na tela de fluxo de dados, você pode transformar facilmente os dados com base em seus requisitos de negócios. Para simplificar, não estamos fazendo nenhuma alteração neste tutorial. Para continuar, selecione Publicar na parte inferior direita da tela.
Um círculo giratório ao lado do nome do fluxo de dados indica que a publicação está em andamento na exibição do item. Quando a publicação for concluída, selecione ... e selecione Propriedades. Renomeie o fluxo de dados para Carregar Tabela do Lakehouse e selecione Salvar.
Selecione a opção Atualizar agora ao lado do nome do fluxo de dados para atualizar o fluxo de dados. Essa opção executa o fluxo de dados e move os dados do arquivo de origem para a tabela do lakehouse. Enquanto estiver em andamento, você verá um círculo giratório em Coluna atualizada no modo de exibição de item.
Depois que o fluxo de dados for atualizado, selecione o novo lakehouse na barra de navegação esquerda para exibir a tabela Delta dimension_customer.
Selecione a tabela para visualizar seus dados. Você também pode usar o ponto de extremidade de análise do SQL do lakehouse para consultar os dados com instruções SQL. Selecione Ponto de extremidade de análise do SQL no menu suspenso Lakehouse na parte superior direita da tela.
Selecione a tabela dimension_customer para visualizar seus dados ou selecione Nova consulta SQL para gravar suas instruções SQL.
A consulta de exemplo a seguir agrega a contagem de linhas com base na coluna BuyingGroup da tabela dimension_customer . Os arquivos de consulta SQL são salvos automaticamente para referência futura e você pode renomear ou excluir esses arquivos com base em sua necessidade.
Para executar o script, selecione o ícone Executar na parte superior do arquivo de script.
SELECT BuyingGroup, Count(*) AS Total FROM dimension_customer GROUP BY BuyingGroup
Criar um relatório
Nesta seção, você criará um relatório com base nos dados ingeridos.
Anteriormente, todas as tabelas e exibições do lakehouse eram adicionadas automaticamente ao modelo semântico. Com as atualizações recentes para novos lakehouses, você precisa adicionar manualmente as tabelas ao modelo semântico. Abra seu lakehouse e alterne para a exibição do ponto de extremidade de análise SQL. Na guia Relatórios, selecione Gerenciar modelo semântico padrão e selecione as tabelas que deseja adicionar ao modelo semântico. Nesse caso, selecione a tabela dimension_customer.
Para garantir que as tabelas no modelo semântico sempre estejam sincronizadas, alterne para o modo de exibição de Ponto de extremidade de análise SQL e abra o painel de configurações do lakehouse. Selecione a configuração Modelo semântico padrão do Power BI e ative Sincronizar o modelo semântico padrão do Power BI. Para obter mais informações, confira Modelos semânticos padrão do Power BI.
Após a adição da tabela, o Fabric criará um modelo semântico com o mesmo nome do lakehouse.
No painel do modelo semântico, você pode exibir todas as tabelas. Você tem opções para criar relatórios do zero, relatório paginado ou permitir que o Power BI crie automaticamente um relatório com base em seus dados. Para este tutorial, selecione Explorar estes dados em Criar um relatório automaticamente. No próximo tutorial, criamos um relatório do zero.
Como a tabela é uma dimensão e não há medidas nela, o Power BI cria uma medida para a contagem de linhas, a agrega em diferentes colunas e cria gráficos diferentes, conforme mostrado na imagem a seguir. Você pode salvar este relatório para o futuro selecionando Salvar na faixa de opções superior. Você pode fazer mais alterações neste relatório para atender aos seus requisitos, incluindo ou excluindo outras tabelas ou colunas.