Como criar uma base de dados Lake a partir de modelos de bases de dados
Neste artigo, você aprenderá a usar os modelos de banco de dados do Azure Synapse para simplificar a criação de um banco de dados lake. O uso de modelos de banco de dados fornece ao seu banco de dados informações semânticas ricas, permitindo que os usuários finais dos dados entendam mais facilmente quais dados estão disponíveis e como usá-los.
Pré-requisitos
- Pelo menos as permissões de função de usuário Synapse são necessárias para explorar um modelo de banco de dados lake da Galeria.
- As permissões Synapse Administrator ou Synapse Contributor são necessárias no espaço de trabalho Synapse para criar um banco de dados lake.
- As permissões de Colaborador de Dados de Blob de Armazenamento são necessárias no data lake ao usar a opção create table From data lake .
Criar banco de dados lago a partir do modelo de banco de dados
- No hub inicial do espaço de trabalho do Azure Synapse Analytics, selecione Centro de conhecimento e Procurar galeria. Você pousará na guia Modelos de banco de dados Lake.
- A categoria de modelos de banco de dados Lake lista modelos de banco de dados padronizados disponíveis para um setor específico.
- Você também pode visitar a guia Modelos de banco de dados Lake no hub de dados , Adicionar novo recurso, + menu Procurar galeria .
- Selecione o setor em que está interessado (por exemplo, Varejo) e selecione Continuar para navegar até a exploração do modelo de dados.
- Você pousará na tela do banco de dados e poderá explorar as tabelas disponíveis no modelo. Por padrão, a tela mostrará uma seleção das tabelas mais usadas nesse modelo. A tela tem várias ferramentas para ajudá-lo a navegar no diagrama entidade-relacionamento.
- Zoom para ajustar todas as tabelas na tela na área de visualização
- Desfazer a última ação para desfazer uma alteração recente
- Aumente o zoom para aumentar o zoom na tela
- Diminuir o zoom para reduzir o zoom da tela
- Controle deslizante de zoom para controlar o nível de zoom
- Visualização de zoom para fornecer uma visualização da tela
- Expandir tudo Fechar tudo/ para exibir mais ou menos colunas dentro de uma tabela na tela
- Limpar tela para limpar todas as tabelas na tela
À esquerda, você verá a lista de pastas contendo os itens do modelo que você pode adicionar à tela. Existem vários controles para ajudar.
- Caixa de pesquisa para pesquisar tabelas com base num termo. O termo será pesquisado nas tabelas, colunas e descrições do modelo.
- Filtrar tabelas para selecionar seções inteiras do modelo a serem exploradas
- Os modelos empresariais selecionam tabelas de cada área de negócio para mostrar um "best-of".
- Os modelos de área de negócios selecionam tabelas principalmente de uma única área de negócios, mas também incluem tabelas relacionadas de outras áreas de negócios.
- Áreas de negócios são pastas que contêm tabelas relacionadas a essa construção de negócios. Por exemplo, Budget & Forecasting contém tabelas relacionadas ao gerenciamento de orçamentos.
- Você pode expandir as pastas da área de negócios para exibir as tabelas e marcar a caixa de seleção para adicioná-las à tela.
- As tabelas selecionadas podem ser removidas através da caixa de seleção.
- Você também pode clicar nas reticências ao lado da pasta da área de negócios e Selecionar tudo ou Desmarcar tudo para adicionar/remover todas as tabelas dessa área de negócios para a tela.
Você pode selecionar uma tabela na tela. Abre o painel de propriedades da tabela com os separadores Geral, Colunas e Relações.
- A guia Geral tem informações sobre a tabela, como seu nome e descrição.
- A guia Colunas tem os detalhes sobre todas as colunas que compõem a tabela, como nomes de colunas e tipos de dados.
- A guia Relações lista as relações de entrada e saída da tabela com outras tabelas na tela.
- Use a alternância Selecionar tudo para visualizar todas as relações 'de' & 'para' para essa tabela.
- Usando as caixas de seleção ao lado de cada relação na guia relação, adicione a tabela necessária - relação à tela.
Para adicionar rapidamente tabelas relacionadas às tabelas na tela, selecione as reticências à direita do nome da tabela e selecione Adicionar tabelas relacionadas. Todas as tabelas com relações existentes são adicionadas à tela. Se isso adicionar muitas tabelas à tela, use a Última Ação de Desfazer para desfazer essa alteração.
Quando a tela tiver todas as tabelas que atendem aos seus requisitos, selecione Criar banco de dados para continuar com a criação do banco de dados lake. O novo banco de dados aparecerá no designer de banco de dados e você poderá personalizá-lo de acordo com suas necessidades comerciais.
O designer de banco de dados tem mais propriedades à direita que precisam ser configuradas.
- Nome: Dê um nome ao seu banco de dados. Os nomes não podem ser editados após a publicação do banco de dados, portanto, verifique se o nome escolhido está correto.
- Descrição: Fornecer uma descrição ao banco de dados é opcional, mas permite que os usuários entendam a finalidade do banco de dados.
- Configurações de armazenamento para banco de dados: Esta seção contém as informações de armazenamento padrão para tabelas no banco de dados. Esse padrão é aplicado a cada tabela no banco de dados, a menos que seja substituído na própria tabela.
- Serviço vinculado: este é o serviço vinculado padrão usado para armazenar seus dados no Armazenamento do Azure Data Lake. O serviço vinculado padrão associado ao espaço de trabalho Synapse será mostrado, mas você pode alterar o Serviço Vinculado para qualquer conta de armazenamento ADLS que desejar.
- Pasta de entrada: é usada para definir o contêiner padrão e o caminho da pasta dentro desse serviço vinculado usando o navegador de arquivos ou editando manualmente o caminho com o ícone de lápis.
- Formato de dados: os bancos de dados Lake no Azure Synapse Analytics suportam Apache Parquet e texto delimitado como os formatos de armazenamento de dados.
Nota
Você sempre pode substituir as configurações de armazenamento padrão tabela por tabela, e o padrão permanece personalizável. Se você não tiver certeza do que escolher, você pode revisitar isso mais tarde. Se não tiver certeza da hierarquia de pastas no data lake, você também pode especificar curingas para percorrer a estrutura de diretórios.
Você pode começar a personalizar tabelas, colunas e relações herdadas do modelo de banco de dados. Você também pode adicionar tabelas personalizadas, colunas, relacionamentos conforme necessário no banco de dados. Para obter mais informações sobre como modificar um banco de dados lake, consulte Modificar um banco de dados lake.
Com o banco de dados personalizado, agora é hora de publicá-lo. Se você estiver usando a integração do Git com seu espaço de trabalho Synapse, deverá confirmar suas alterações e mesclá-las na ramificação de colaboração. Saiba mais sobre o controle do código-fonte no Azure Synapse. Se estiver a utilizar o modo Synapse Live, pode selecionar Publicar.
A sua base de dados será validada quanto a erros antes de ser publicada. Quaisquer erros encontrados serão mostrados na guia de notificações com instruções sobre como corrigir o erro.
A publicação criará seu esquema de banco de dados no Azure Synapse Metastore. Após a publicação, o banco de dados e os objetos de tabela ficarão visíveis para outros serviços do Azure e permitirão que os metadados do seu banco de dados fluam para aplicativos como o Power BI ou o Microsoft Purview.
Agora você criou um banco de dados lake usando um modelo de banco de dados lake no Azure Synapse.
Próximos passos
Continue a explorar os recursos do designer de banco de dados usando os links abaixo.