Determinar quando desenvolver um modelo composto

Concluído

Um modelo composto contém mais de um grupo de origem. Normalmente, há sempre o grupo de origem da importação e um grupo de origem do DirectQuery.

Diagrama mostrando um modelo de composição do esquema estrela que armazena dados importados para algumas tabelas e outras consultas de passagem de tabelas para a fonte de dados subjacente (nesse caso, um Banco de Dados SQL do Azure).

Observação

Em geral, os benefícios e as limitações associados aos modos de importação e de armazenamento do DirectQuery se aplicam aos modelos compostos.

Benefícios do modelo composto

Há vários benefícios no desenvolvimento de um modelo composto.

Os modelos compostos fornecem flexibilidade de design. Você pode optar por integrar dados usando diferentes modos de armazenamento, atingindo o equilíbrio certo entre dados importados e dados de passagem. Normalmente, os modelos empresariais se beneficiam do uso de tabelas do DirectQuery em fontes de dados grandes e do aumento do desempenho da consulta com tabelas importadas. Os recursos do Power BI com suporte para esse cenário são descritos posteriormente nesta unidade.

Modelos compostos também podem aumentar o desempenho de um modelo DirectQuery proporcionando ao Power BI a oportunidade de atender a algumas consultas analíticas de dados importados. A consulta a dados armazenados em cache quase sempre tem um desempenho melhor do que consultas de passagem.

Por fim, quando o modelo inclui tabelas do DirectQuery para um modelo remoto, como um conjunto de dados do Power BI, você pode estender o modelo com novas colunas e tabelas calculadas. Isso resulta em um modelo especializado baseado em um modelo principal. Para obter mais informações, confira Cenários de uso do Power BI: BI de autoatendimento gerenciado personalizável.

Limitações do modelo composto

Há várias limitações relacionadas aos modelos compostos.

  • As tabelas do modo de armazenamento de importação (ou duplo, conforme descrito posteriormente) ainda exigem atualização periódica. Os dados importados podem ficar fora de sincronia com os dados de origem do DirectQuery, portanto, é importante atualizá-los periodicamente.

  • Quando uma consulta analítica precisa combinar dados importados e do DirectQuery, o Power BI precisa consolidar os resultados da consulta do grupo de origem, o que pode afetar o desempenho. Para ajudar a evitar essa situação para consultas de maior granulação, você pode adicionar tabelas de agregação de importação ao modelo (ou habilitar agregações automáticas) e definir tabelas de dimensões relacionadas para usar o modo de armazenamento duplo. Esse cenário é descrito posteriormente nesta unidade.

  • Ao encadear modelos (DirectQuery para conjuntos de dados do Power BI), modificações feitas nos modelos upstream podem interromper os modelos downstream. Certifique-se de avaliar o impacto das modificações executando a análise de impacto do conjunto de dados primeiro.

  • As relações entre tabelas de diferentes grupos de origem são conhecidas como relações limitadas. Uma relação de modelo é limitada quando o Power BI não pode determinar qual é o lado "um" de uma relação. Relações limitadas podem gerar diferentes avaliações das consultas e dos cálculos do modelo. Para obter mais informações, confira Avaliação da relação.

Aumentar o desempenho do modelo DirectQuery usando dados de importação

Quando há uma justificativa para desenvolver um modelo DirectQuery, você pode atenuar algumas limitações usando recursos específicos do Power BI que envolvem as tabelas de importação.

Tabelas de agregação de importação

Você pode adicionar tabelas de agregação definidas pelo usuário no modo de armazenamento de importação ou habilitar agregações automáticas. Dessa forma, o Power BI direciona consultas de fatos de maior granulação para uma agregação armazenada em cache. Para aumentar ainda mais o desempenho da consulta, verifique se as tabelas de dimensões relacionadas estão definidas para usar o modo de armazenamento duplo.

As agregações automáticas são um recurso Premium. Para obter mais informações, confira Agregações automáticas.

Modo de armazenamento duplo

Uma tabela de modo de armazenamento duplo é definida para usar os modos de armazenamento de importação e do DirectQuery. No momento da consulta, o Power BI determina o modo mais eficiente a ser usado. Sempre que possível, o Power BI tenta satisfazer consultas analíticas usando dados armazenados em cache.

As tabelas de modo de armazenamento duplo funcionam bem com tabelas de agregação de importação. Elas permitem que o Power BI satisfaça consultas de maior granulação inteiramente com dados armazenados em cache.

Visuais de segmentação e listas de cartões de filtro, que geralmente são baseados em colunas de tabelas de dimensões, são renderizados mais rapidamente porque são consultados de dados armazenados em cache.

Fornecer dados em tempo real de um modelo de importação

Ao configurar uma tabela de importação com atualização incremental, você pode habilitar a opção Obter os dados mais recentes em tempo real com o DirectQuery.

Diagrama animado mostra a atualização incremental e a configuração de dados em tempo real e destaca a opção Obter dados mais recentes em tempo real com o DirectQuery.

Ao habilitar essa opção, o Power BI cria automaticamente uma partição de tabela que usa o modo de armazenamento do DirectQuery. Nesse caso, a tabela se torna uma tabela híbrida, o que significa que ela tem partições de importação para armazenar dados mais antigos e uma só partição do DirectQuery para dados atuais.

Quando o Power BI consulta uma tabela híbrida, a consulta usa o cache para dados mais antigos e passa para a fonte de dados para recuperar dados atuais.

Essa opção só está disponível com uma licença Premium.

Para obter mais informações, consulte Configurar a atualização incremental e os dados em tempo real.