Partilhar via


Tabelas em data warehousing no Microsoft Fabric

Aplica-se a:✅ Armazém no Microsoft Fabric

Este artigo detalha os principais conceitos para criar tabelas no Microsoft Fabric.

Nas tabelas, os dados são organizados logicamente em um formato de linha e coluna. Cada linha representa um registro exclusivo e cada coluna representa um campo no registro.

  • No Warehouse, as tabelas são objetos de banco de dados que contêm todos os dados transacionais.

Determinar categoria de tabela

Um esquema em estrela organiza os dados em tabelas de fatos e tabelas de dimensões. Algumas tabelas são usadas para integração ou preparo de dados antes de passar para uma tabela de fatos ou dimensões. Ao projetar uma tabela, decida se os dados da tabela pertencem a uma tabela de fato, dimensão ou integração. Esta decisão informa a estrutura de tabela adequada.

  • As tabelas de fatos contêm dados quantitativos que geralmente são gerados em um sistema transacional e, em seguida, carregados no data warehouse. Por exemplo, uma empresa de varejo gera transações de vendas todos os dias e, em seguida, carrega os dados em uma tabela de fatos de data warehouse para análise.

  • As tabelas de dimensão contêm dados de atributos que podem ser alterados, mas geralmente mudam com pouca frequência. Por exemplo, o nome e o endereço de um cliente são armazenados em uma tabela de dimensões e atualizados somente quando o perfil do cliente muda. Para minimizar o tamanho de uma grande tabela de fatos, o nome e o endereço do cliente não precisam estar em todas as linhas de uma tabela de fatos. Em vez disso, a tabela de fatos e a tabela de dimensões podem compartilhar uma ID de cliente. Uma consulta pode unir as duas tabelas para associar o perfil e as transações de um cliente.

  • As tabelas de integração fornecem um local para integrar ou preparar dados. Por exemplo, você pode carregar dados em uma tabela de preparo, executar transformações nos dados em preparo e, em seguida, inserir os dados em uma tabela de produção.

Uma tabela armazena dados no OneLake como parte do Depósito. A tabela e os dados persistem independentemente de uma sessão estar aberta ou não.

Mesas no Armazém

Para mostrar a organização das tabelas, você pode usar fact, dimou int como prefixos para os nomes das tabelas. A tabela a seguir mostra alguns dos nomes de esquema e tabela para o data warehouse de exemplo WideWorldImportersDW .

WideWorldImportersDW Nome da tabela de origem Tipo de Tabela Nome da tabela do Data Warehouse
City Dimensão wwi.DimCity
Ordenar Facto wwi.FactOrder
  • Os nomes de tabelas são sensíveis a maiúsculas e minúsculas.
  • Os nomes de tabela não podem conter / ou \ terminar com um .arquivo .

Criar uma tabela

Para o Warehouse, você pode criar uma tabela como uma nova tabela vazia. Você também pode criar e preencher uma tabela com os resultados de uma instrução select. A seguir estão os comandos T-SQL para criar uma tabela.

Instrução T-SQL Description
CREATE TABLE Cria uma tabela vazia definindo todas as colunas e opções da tabela.
CREATE TABLE AS SELECT Preenche uma nova tabela com os resultados de uma instrução select. As colunas da tabela e os tipos de dados baseiam-se nos resultados da instrução select. Para importar dados, esta instrução pode selecionar a partir de uma tabela externa.

Este exemplo cria uma tabela com duas colunas:

CREATE TABLE MyTable (col1 int, col2 int );  

Nomes de esquema

O Warehouse suporta a criação de esquemas personalizados. Como no SQL Server, os esquemas são uma boa maneira de agrupar objetos que são usados de maneira semelhante. O código a seguir cria um esquema definido pelo usuário chamado wwi.

  • Os nomes de esquema diferenciam maiúsculas de minúsculas.
  • Os nomes de esquema não podem conter / ou \ terminar com um .arquivo .
CREATE SCHEMA wwi;

Tipos de dados

O Microsoft Fabric suporta os tipos de dados T-SQL mais usados.

Agrupamento

Atualmente, Latin1_General_100_BIN2_UTF8 é o agrupamento padrão e suportado apenas para tabelas e metadados.

Estatísticas

O otimizador de consulta usa estatísticas em nível de coluna quando cria o plano para executar uma consulta. Para melhorar o desempenho da consulta, é importante ter estatísticas sobre colunas individuais, especialmente colunas usadas em junções de consulta. O Warehouse suporta a criação automática de estatísticas.

A atualização estatística não acontece automaticamente. Atualize as estatísticas depois que um número significativo de linhas for adicionado ou alterado. Por exemplo, atualize as estatísticas após uma carga. Para obter mais informações, veja Estatísticas.

Chave primária, chave estrangeira e chave exclusiva

Para o Warehouse, a restrição PRIMARY KEY e UNIQUE só são suportadas quando NONCLUSTERED e NOT ENFORCED são usados.

FOREIGN KEY só é suportado quando NOT ENFORCED é usado.

Alinhar os dados de origem com o data warehouse

As tabelas de depósito são preenchidas carregando dados de outra fonte de dados. Para obter uma carga bem-sucedida, o número e os tipos de dados das colunas nos dados de origem devem estar alinhados com a definição de tabela no data warehouse.

Se os dados forem provenientes de vários armazenamentos de dados, você poderá portá-los para o data warehouse e armazená-los em uma tabela de integração. Quando os dados estiverem na tabela de integração, você poderá usar o poder do data warehouse para implementar operações de transformação. Depois que os dados estiverem preparados, você poderá inseri-los em tabelas de produção.

Limitações

O Warehouse suporta muitos, mas não todos, dos recursos de tabela oferecidos por outros bancos de dados.

A lista a seguir mostra alguns dos recursos de tabela que não são suportados no momento.

  • 1024 colunas máximas por tabela
  • Colunas computadas
  • Visualizações indexadas
  • Tabelas particionadas
  • Sequence
  • Colunas esparsas
  • Chaves substitutas em sequências numéricas com colunas Identidade
  • Sinónimos
  • Tabelas temporárias
  • Acionadores
  • Índices exclusivos
  • Tipos definidos pelo usuário

Importante

Há limitações com a adição de restrições de tabela ou colunas ao usar o controle do código-fonte com o Warehouse.