Determinar quando desenvolver um modelo composto

Concluído

Um modelo composto compreende mais de um grupo de fontes. Normalmente, há sempre o grupo de origem de importação e um grupo de origem do DirectQuery.

Diagram shows a star schema composite model. The model stores imported data for some tables, and other tables pass-through queries to the underlying data source, in this case an Azure S Q L Database.

Nota

Geralmente, os benefícios e limitações associados aos modos de armazenamento de importação e DirectQuery se aplicam a modelos compostos.

Benefícios do modelo composto

Existem vários benefícios no desenvolvimento de um modelo composto.

Os modelos compostos proporcionam flexibilidade de design. Você pode optar por integrar dados usando diferentes modos de armazenamento, alcançando o equilíbrio certo entre dados importados e dados de passagem. Geralmente, os modelos empresariais se beneficiam do uso de tabelas DirectQuery em grandes fontes de dados e do aumento do desempenho da consulta com tabelas importadas. Os recursos do Power BI que dão suporte a esse cenário são descritos posteriormente nesta unidade.

Os modelos compostos também podem aumentar o desempenho de um modelo DirectQuery fornecendo ao Power BI a oportunidade de satisfazer algumas consultas analíticas de dados importados. A consulta de dados armazenados em cache quase sempre tem um desempenho melhor do que as consultas de passagem.

Por fim, quando seu modelo inclui tabelas DirectQuery em um modelo remoto, como um conjunto de dados do Power BI, você pode estender seu modelo com novas colunas e tabelas calculadas. Isso resulta em um modelo especializado baseado em um modelo central. Para obter mais informações, consulte Cenários de uso do Power BI: BI de autoatendimento gerenciado personalizável.

Limitações do modelo composto

Existem várias limitações relacionadas aos modelos compostos.

  • As tabelas de modo de armazenamento de importação (ou dupla, conforme descrito mais adiante) ainda exigem atualização periódica. Os dados importados podem ficar fora de sincronia com os dados de origem do DirectQuery, por isso é importante atualizá-los periodicamente.

  • Quando uma consulta analítica deve combinar dados importados e DirectQuery, o Power BI deve consolidar os resultados da consulta do grupo de origem, o que pode afetar o desempenho. Para ajudar a evitar essa situação para consultas de grão mais alto, você pode adicionar tabelas de agregação de importação ao seu modelo (ou habilitar agregações automáticas) e definir tabelas de dimensão relacionadas para usar o modo de armazenamento duplo. Este cenário é descrito mais adiante nesta unidade.

  • Ao encadear modelos (DirectQuery para conjuntos de dados do Power BI), as modificações feitas em modelos upstream podem quebrar modelos downstream. Certifique-se de avaliar o impacto das modificações executando a análise de impacto do conjunto de dados primeiro.

  • As relações entre tabelas de diferentes grupos de origem são conhecidas como relações limitadas. Uma relação de modelo é limitada quando o Power BI não consegue determinar um lado "um" de uma relação. Relações limitadas podem resultar em diferentes avaliações de consultas de modelo e cálculos. Para obter mais informações, consulte Avaliação de relacionamento.

Aumente o desempenho do modelo DirectQuery com a importação de dados

Quando há uma justificativa para desenvolver um modelo DirectQuery, você pode atenuar algumas limitações usando recursos específicos do Power BI que envolvem a importação de tabelas.

Importar tabelas de agregação

Você pode adicionar tabelas de agregação definidas pelo usuário no modo de armazenamento de importação ou habilitar agregações automáticas. Dessa forma, o Power BI direciona consultas de fatos de grão mais alto para uma agregação em cache. Para aumentar ainda mais o desempenho da consulta, certifique-se de que as tabelas de dimensão relacionadas estejam definidas para usar o modo de armazenamento duplo.

As agregações automáticas são um recurso Premium. Para obter mais informações, consulte Agregações automáticas.

Modo de armazenamento duplo

Uma tabela de modo de armazenamento duplo é definida para usar os modos de armazenamento de importação e DirectQuery. No momento da consulta, o Power BI determina o modo mais eficiente a ser usado. Sempre que possível, o Power BI tenta satisfazer consultas analíticas usando dados armazenados em cache.

As tabelas de modo de armazenamento duplo funcionam bem com tabelas de agregação de importação. Eles permitem que o Power BI satisfaça consultas de grão mais alto inteiramente a partir de dados armazenados em cache.

Os visuais de segmentação de dados e as listas de cartões de filtro, que geralmente se baseiam em colunas de tabelas de dimensões, são renderizados mais rapidamente porque são consultados a partir de dados armazenados em cache.

Forneça dados em tempo real a partir de um modelo de importação

Ao configurar uma tabela de importação com atualização incremental, você pode habilitar a opção Obter os dados mais recentes em tempo real com o DirectQuery .

Animated diagram shows the incremental refresh and real-time data set up, and it highlights the Get the latest data in real-time with DirectQuery option.

Ao habilitar essa opção, o Power BI cria automaticamente uma partição de tabela que usa o modo de armazenamento DirectQuery. Nesse caso, a tabela se torna uma tabela híbrida, o que significa que ela tem partições de importação para armazenar dados mais antigos e uma única partição DirectQuery para dados atuais.

Quando o Power BI consulta uma tabela híbrida, a consulta usa o cache para dados mais antigos e passa para a fonte de dados para recuperar dados atuais.

Esta opção só está disponível com uma licença Premium.

Para obter mais informações, consulte Configurar atualização incremental e dados em tempo real.