Determinar quando desenvolver um modelo de importação
Um modelo de importação é composto por tabelas que têm a propriedade de modo de armazenamento definida como Importação. Ele também inclui tabelas calculadas, que você define com uma fórmula DAX.
Benefícios do modelo de importação
Os modelos de importação são a estrutura de modelo desenvolvida com mais frequência porque há muitos benefícios. Os modelos de importação:
- Dão suporte a todos os tipos de fonte de dados do Power BI, incluindo bancos de dados, arquivos, feeds, páginas da Web, fluxos de dados e muito mais.
- Podem integrar dados de origem. Por exemplo, uma tabela obtém seus dados de um banco de dados relacional enquanto uma tabela relacionada obtém seus dados de uma página da Web.
- Dão suporte a todas as funcionalidades de DAX e do Power Query (M).
- Dão suporte a tabelas calculadas.
- Fornecem o melhor desempenho de consulta. Isso ocorre porque os dados armazenados em cache no modelo são otimizados para consultas analíticas (filtrar, agrupar e resumir) e o modelo é armazenado inteiramente na memória.
Em resumo, os modelos de importação oferecem mais opções e flexibilidade de design, além de desempenho rápido. Por esse motivo, o Power BI Desktop usa por padrão o modo de armazenamento de importação quando você opta por "Obter dados".
Limitações do modelo de importação
Apesar dos muitos benefícios atraentes, há limitações dos modelos de importação que você precisa ter em mente. As limitações estão relacionadas ao tamanho do modelo e à atualização de dados.
Tamanho do modelo
O Power BI impõe restrições de tamanho do conjunto de dados, que limitam o tamanho de um modelo. Quando você publica o modelo em uma capacidade compartilhada, há um limite de 1 GB por conjunto de dados. Quando esse limite de tamanho for excedido, o conjunto de dados não será atualizado. Quando você publica o modelo em uma capacidade dedicada (também conhecida como capacidades Premium), ele pode crescer além de 10 GB caso você habilite a Configuração de formato de armazenamento de conjunto de dados grande para a capacidade.
Sempre se esforce para reduzir a quantidade de dados armazenados em tabelas. Essa estratégia ajuda a reduzir a duração das atualizações de modelo e a acelerar as consultas de modelo. Você pode aplicar várias técnicas de redução de dados, incluindo:
- Remover colunas desnecessárias
- Remover linhas desnecessárias
- Agrupar e resumir para elevar a granularidade das tabelas de fatos
- Otimizar tipos de dados de coluna com preferência por dados numéricos
- Preferência por colunas personalizadas no Power Query em vez de colunas calculadas no modelo
- Desabilitar a carga de consulta do Power Query
- Desabilitar data/hora automática
- Use o armazenamento de tabelas DirectQuery, conforme descrito em unidades posteriores deste módulo.
Para obter mais informações, confira Técnicas de redução de dados para a modelagem de importação.
Observação
O limite de 1 GB por conjunto de dados refere-se ao tamanho compactado do modelo do Power BI, não ao volume de dados que está sendo coletado do sistema de origem.
Atualização dedados
Os dados importados devem ser atualizados periodicamente. Os dados do conjunto de dados são tão atuais quanto a última atualização de dados bem-sucedida. Para manter os dados atualizados, você configura a atualização de dados agendada ou, ou os consumidores do relatório podem executar uma atualização sob demanda.
O Power BI impõe limites à frequência com que operações de atualização agendadas podem ocorrer. Eles são de até oito vezes por dia em uma capacidade compartilhada e até 48 vezes por dia em uma capacidade dedicada.
Você determina se esse grau de latência é tolerável. Geralmente, isso depende da velocidade (ou da volatilidade) dos dados e da urgência de manter os usuários informados sobre o estado atual dos dados. Quando os limites de atualização agendados não forem aceitáveis, considere usar tabelas de armazenamento do DirectQuery ou criar uma tabela híbrida. Ou, em vez disso, adote uma abordagem diferente e crie um conjunto de dados em tempo real.
Dica
As tabelas híbridas são descritas na unidade 4. Para obter informações sobre conjuntos de dados em tempo real, percorra o módulo Monitorar dados em tempo real com o Power BI.
Considere também a carga de trabalho e a duração da atualização. Por padrão, para atualizar uma tabela, o Power BI remove todos os dados e os recarrega novamente. Essas operações podem impor uma carga inaceitável aos sistemas de origem, especialmente para tabelas de fatos grandes. Para reduzir essa carga, você pode configurar o recurso de atualização incremental. A atualização incremental automatiza a criação e o gerenciamento de partições de período e atualiza de modo inteligente apenas as partições que exigem atualização.
Quando a fonte de dados dá suporte à atualização incremental, ela pode resultar em atualizações mais rápidas e confiáveis e na redução do consumo de recursos dos sistemas de origem e do Power BI.
Modeladores de dados avançados podem personalizar a própria estratégia de particionamento. Scripts de automação podem criar, gerenciar e atualizar partições de tabela. Para obter mais informações, consulte Cenários de uso do Power BI: gerenciamento avançado de modelo de dados. Esse cenário de uso descreve o uso do ponto de extremidade XMLA disponível com o Power BI Premium.