Descrever os fundamentos do modelo do Power BI

Concluído

Esta unidade apresenta os termos do modelo do Power BI. É importante que você entenda esses termos para escolher a estrutura de modelo apropriada para seu projeto. Esta unidade descreve os seguintes termos:

  • Modelo de dados
  • conjunto de dados do Power BI
  • Consulta analítica
  • Modelo tabular
  • Design do esquema de estrela
  • Modo de armazenamento de tabela
  • Estrutura do modelo

Modelo de dados

Um modelo de dados do Power BI é um recurso de dados consultável otimizado para análise. Os relatórios podem consultar modelos de dados usando uma das duas linguagens analíticas: DAX (Data Analysis Expressions) ou MDX (Multidimensional Expressions). O Power BI usa DAX, enquanto os relatórios paginados podem usar DAX ou MDX. Os recursos Analisar no Excel usam MDX.

Gorjeta

Um modelo de dados também é descrito como modelo semântico, especialmente em cenários empresariais. Comumente, no contexto de uma discussão de dados e neste módulo, um modelo de dados é simplesmente referido como um modelo.

conjunto de dados do Power BI

Você desenvolve um modelo do Power BI no Power BI Desktop e, uma vez publicado em um espaço de trabalho no serviço do Power BI, ele é conhecido como um conjunto de dados. Um conjunto de dados é um artefato do Power BI que é uma fonte de dados para visualizações em relatórios e painéis do Power BI.

Nota

Nem todos os conjuntos de dados são originários de modelos desenvolvidos no Power BI Desktop. Alguns conjuntos de dados representam conexões com modelos hospedados externamente em AAS ou SSAS. Outros podem representar estruturas de dados em tempo real, incluindo conjuntos de dados push, conjuntos de dados de streaming ou conjuntos de dados híbridos. Este módulo diz respeito apenas aos modelos desenvolvidos no Power BI Desktop.

Consulta analítica

Os relatórios e painéis do Power BI devem consultar um conjunto de dados. Quando o Power BI visualiza dados do conjunto de dados, ele prepara e envia uma consulta analítica. Uma consulta analítica produz um resultado de consulta a partir de um modelo que é fácil para uma pessoa entender, especialmente quando visualizado.

Uma consulta analítica tem três fases que são executadas nesta ordem:

  1. Filtro
  2. Agrupar
  3. Resumir

A filtragem (às vezes conhecida como fatiamento) restringe um subconjunto dos dados do modelo. Os valores de filtro não são visíveis no resultado da consulta. A maioria das consultas analíticas aplica filtros porque é comum filtrar por um período de tempo e, geralmente, outros atributos. A filtragem acontece de diferentes maneiras. Em um relatório do Power BI, você pode definir filtros no nível de relatório, página ou visual. Os layouts de relatório geralmente incluem visuais de segmentação de dados para filtrar elementos visuais na página do relatório. Quando o modelo impõe segurança em nível de linha (RLS), ele aplica filtros a tabelas de modelo para restringir o acesso a dados específicos. As medidas, que resumem os dados do modelo, também podem aplicar filtros.

O agrupamento (às vezes conhecido como dicing) divide o resultado da consulta em grupos. Cada grupo também é um filtro, mas, ao contrário da fase de filtragem, os valores de filtro são visíveis no resultado da consulta. Por exemplo, o agrupamento por cliente filtra cada grupo por cliente.

A sumarização produz um único resultado de valor. Normalmente, um visual de relatório resume um campo numérico usando uma função de agregação. As funções agregadas incluem soma, contagem, mínimo, máximo e outras. Você pode obter um resumo simples agregando uma coluna ou pode obter um resumo complexo criando uma medida usando uma fórmula DAX.

Considere um exemplo: uma página de relatório do Power BI inclui uma segmentação de dados para filtrar por um único ano. Há também um gráfico de colunas que mostra as vendas trimestrais para o ano filtrado.

Screenshot of the Power BI report described in the previous paragraph.

Neste exemplo, a segmentação de dados filtra o visual por ano civil de 2021. O gráfico de colunas agrupa por trimestres (do ano filtrado). Cada coluna é um grupo que representa um filtro visível. As alturas das colunas representam os valores de vendas resumidos para cada trimestre do ano filtrado.

Modelo tabular

Um modelo do Power BI é um modelo tabular. Um modelo tabular compreende uma ou mais tabelas de colunas. Também pode incluir relações, hierarquias e cálculos.

Design do esquema de estrela

Para produzir um modelo tabular otimizado e fácil de usar, recomendamos que você produza um design de esquema em estrela. O design de esquema em estrela é uma abordagem de modelagem madura amplamente adotada por data warehouses relacionais. Ele requer que você classifique as tabelas modelo como dimensão ou fato.

As tabelas de dimensões descrevem entidades empresariais; as coisas que você modela. As entidades podem incluir produtos, pessoas, lugares e conceitos, incluindo o próprio tempo. As tabelas de fatos armazenam observações ou eventos e podem ser, por exemplo, ordens de venda, saldos de estoque, taxas de câmbio ou leituras de temperatura. Uma tabela de fatos contém colunas de chave de dimensão relacionadas a tabelas de dimensão e colunas de medida numérica. Uma tabela de fatos forma o centro de uma estrela, e as tabelas de dimensões relacionadas formam os pontos da estrela.

Screenshot of a star schema design with a fact table in the center and dimension tables forming the points of the star.

Em uma consulta analítica, as colunas da tabela de dimensões filtram ou agrupam. As colunas da tabela de fatos são resumidas.

Para obter mais informações, consulte Compreender o esquema em estrela e a importância para o Power BI.

Modo de armazenamento de tabela

Cada tabela de modelo do Power BI (exceto tabelas calculadas) tem uma propriedade de modo de armazenamento. A propriedade do modo de armazenamento pode ser Import, DirectQuery ou Dual, e determina se os dados da tabela são armazenados no modelo.

  • Importar – As consultas recuperam dados armazenados ou armazenados em cache no modelo.
  • DirectQuery – As consultas passam para a fonte de dados.
  • Dual – As consultas recuperam dados armazenados ou passam para a fonte de dados. O Power BI determina o plano mais eficiente, esforçando-se para usar dados armazenados em cache sempre que possível.

Estrutura do modelo

As configurações do modo de armazenamento de tabela determinam a estrutura do modelo, que pode ser importada, DirectQuery ou composta. As unidades a seguir neste módulo descrevem cada uma dessas estruturas e fornecem orientação sobre seu uso.

  • Um modelo de importação compreende tabelas que têm sua propriedade de modo de armazenamento definida como Importar.
  • Um modelo DirectQuery compreende tabelas que têm sua propriedade de modo de armazenamento definida como DirectQuery e pertencem ao mesmo grupo de origem. O grupo de origem é descrito posteriormente neste módulo.
  • Um modelo composto compreende mais de um grupo de fontes.