O que é data warehousing no Microsoft Fabric?
Aplica-se a:✅ ponto de extremidade de análise SQL e Warehouse no Microsoft Fabric
O Fabric Data Warehouse é uma solução de armazenamento de dados de última geração dentro do Microsoft Fabric.
O armazém centrado no lago é construído em um mecanismo de processamento distribuído de nível empresarial que permite o desempenho líder do setor em escala, minimizando a necessidade de configuração e gerenciamento. Vivendo no data lake e projetado para oferecer suporte nativo a formatos de dados abertos, o data warehouse Fabric permite uma colaboração perfeita entre engenheiros de dados e usuários corporativos sem comprometer a segurança ou a governança.
A experiência SaaS fácil de usar também está totalmente integrada ao Power BI para facilitar a análise e a geração de relatórios, convergindo o mundo dos data lakes e armazéns e simplificando muito o investimento das organizações em seu patrimônio de análise.
Os clientes de armazém de dados beneficiam de:
- Os dados armazenados no formato Delta-parquet permitem transações ACID e a interoperabilidade com outras cargas de trabalho do Fabric significa que você não precisa de várias cópias de dados.
- As consultas entre bancos de dados podem usar várias fontes de dados para insights rápidos sem duplicação de dados.
- Ingera, carregue e transforme facilmente dados em escala através de Pipelines, Dataflows, consulta cruzada de banco de dados ou o comando COPY INTO.
- O gerenciamento autônomo da carga de trabalho com o mecanismo de processamento de consultas distribuído líder do setor significa que não há botões para girar para obter o melhor desempenho da categoria.
- Dimensione quase instantaneamente para atender às demandas de negócios. O armazenamento e a computação são separados.
- Tempo reduzido para insights com um modelo semântico facilmente consumível e sempre conectado que é integrado ao Power BI no modo Direct Lake. Os relatórios têm sempre os dados mais recentes para análise e relatórios.
- Construído para qualquer nível de habilidade, desde o desenvolvedor cidadão até DBA ou engenheiro de dados.
Itens de armazenamento de dados
O Fabric Data Warehouse não é um armazém de dados corporativo tradicional, é um armazém em lago que suporta dois itens de armazenamento distintos: o data warehouse do Fabric e o endpoint de análise SQL. Ambos são criados especificamente para atender às necessidades de negócios dos clientes, proporcionando o melhor desempenho da categoria, minimizando custos e reduzindo despesas gerais administrativas.
Armazém de dados de malha
Em um espaço de trabalho do Microsoft Fabric, um depósito de malha é rotulado como Depósito na coluna Tipo. Quando você precisa de todo o poder e recursos transacionais (suporte a consultas DDL e DML) de um data warehouse, esta é a solução rápida e simples para você.
O armazém pode ser preenchido por qualquer um dos métodos de ingestão de dados suportados, como COPY INTO, Pipelines, Dataflows, ou opções de ingestão de banco de dados cruzado, como CREATE TABLE AS SELECT (CTAS), INSERT.. SELECT ou SELECT INTO.
Para começar a usar o Armazém, consulte:
Ponto de extremidade de análise SQL do Lakehouse
Em um espaço de trabalho do Microsoft Fabric, cada Lakehouse tem um "ponto de extremidade de análise SQL" gerado automaticamente que pode ser usado para fazer a transição da visualização "Lake" do Lakehouse (que suporta engenharia de dados e Apache Spark) para a exibição "SQL" do mesmo Lakehouse para criar exibições, funções, procedimentos armazenados e aplicar segurança SQL.
Com o ponto de extremidade de análise SQL do Lakehouse, os comandos T-SQL podem definir e consultar objetos de dados, mas não manipular ou modificar os dados. Você pode executar as seguintes ações no ponto de extremidade de análise SQL:
- Consulte as tabelas que fazem referência a dados em suas pastas Delta Lake no lago.
- Crie exibições, TVFs embutidos e procedimentos para encapsular sua semântica e lógica de negócios em T-SQL.
- Gerencie permissões nos objetos.
Para começar a usar o ponto de extremidade de análise SQL, consulte:
- Melhor juntos: a casa do lago e o armazém no Microsoft Fabric
- Considerações sobre o desempenho do ponto de extremidade de análise SQL
- Consultar o ponto de extremidade de análise SQL ou o Warehouse no Microsoft Fabric
Armazém ou casa do lago
Ao decidir entre usar um armazém ou um lakehouse, é importante considerar as necessidades específicas e o contexto de seus requisitos de gerenciamento e análise de dados. Igualmente importante, esta não é uma decisão de sentido único!
Você sempre tem a oportunidade de adicionar um ou outro em um ponto posterior, caso suas necessidades de negócios mudem e, independentemente de onde você começar, tanto o armazém quanto o lakehouse usam o mesmo poderoso mecanismo SQL para todas as consultas T-SQL.
Aqui estão algumas diretrizes gerais para ajudá-lo a tomar a decisão:
Escolha um armazém de dados quando precisar de uma solução de escala empresarial com formato padrão aberto, sem desempenho de botões e configuração mínima. Mais adequado para formatos de dados semiestruturados e estruturados, o data warehouse é adequado para profissionais de dados iniciantes e experientes, oferecendo experiências simples e intuitivas.
Escolha um lakehouse quando precisar de um grande repositório de dados altamente não estruturados de fontes heterogêneas, aproveitando o armazenamento de objetos de baixo custo e quiser usar o SPARK como sua principal ferramenta de desenvolvimento. Atuando como um armazém de dados "leve", você sempre tem a opção de usar o ponto de extremidade SQL e as ferramentas T-SQL para fornecer cenários de relatórios e inteligência de dados em sua casa do lago.
Para obter orientações de decisão mais detalhadas, consulte o guia de decisão do Microsoft Fabric: Escolha entre Warehouse e Lakehouse.