Design do esquema de estrela
É incomum que um modelo semântico do Power BI seja composto por uma única tabela. Um modelo de tabela única pode ser um design simples, que talvez seja adequado para uma tarefa de exploração de dados ou uma prova de conceito, mas não um que seja um design de modelo ideal. Um modelo ideal cumpre star princípios de conceção de esquemas. O esquema de estrela refere-se a uma abordagem de estrutura que é frequentemente utilizada pelos designers de armazéns de dados relacionais porque apresenta uma estrutura fácil de utilizar e suporta consultas analíticas de alto desempenho.
Este princípio de design denomina-se esquema de estrela porque classifica tabelas de modelos como facto ou dimensão. Num diagrama, uma tabela de factos forma o centro de uma estrela, enquanto as tabelas de dimensões, quando colocadas à volta de uma tabela de factos, representam os pontos da estrela.
Tabelas de factos
A função de uma tabela de factos é armazenar uma acumulação de linhas que representam observações ou eventos que registam uma atividade comercial específica. Por exemplo, os eventos que são armazenados numa tabela de factos de vendas podem ser encomendas de vendas e linhas de encomenda. Também pode usar uma tabela de factos para registar movimentos de ações, saldos de ações ou taxas de câmbio diárias. Em geral, as tabelas de factos contêm várias linhas. À medida que o tempo passa, as linhas da tabela de factos acumulam-se. Em consultas analíticas (que serão definidas mais adiante neste módulo), os dados da tabela de factos são resumidos para produzir valores como vendas e quantidade.
Tabelas de dimensões
As tabelas de dimensões descrevem as suas entidades comerciais, que normalmente representam pessoas, lugares, produtos ou conceitos. Uma tabela de dimensões de data, que contém uma linha para cada data, é um exemplo comum de uma tabela de dimensões de conceito. As colunas nas tabelas de dimensões permitem filtrar e agrupar os dados da tabela de factos.
Cada tabela de dimensões deve ter uma coluna exclusiva, que é conhecida como a sua coluna de chaves. Uma coluna exclusiva não contém valores duplicados e nunca deve ter valores em falta. Numa tabela de dimensões de produto, a coluna pode chamar-se ProductKey ou ProductID. Provavelmente, as colunas adicionais armazenarão valores descritivos, como o nome do produto, a subcategoria, a categoria, a cor e assim por diante. Em consultas analíticas, estas colunas servem para filtrar e agrupar dados.
Comparar tabelas de factos e de dimensões
A figura seguinte compara as características das tabelas de factos e de dimensões.
Característica | Tabela de dimensões | Tabela de factos |
---|---|---|
Objetivo do modelo | Armazena entidades empresariais | Armazena eventos ou observações |
Estrutura da tabela | Inclui uma coluna de chaves e colunas descritivas para filtrar e agrupar | Inclui colunas de chaves de dimensão e colunas de medidas numéricas que podem ser resumidas |
Volume de dados | Normalmente, contém menos linhas (em relação às tabelas de factos) | Pode conter várias linhas |
Qualquer objetivo | Para filtrar e agrupar | Para resumir |
Relacionar tabelas de esquema de estrela
No modelo, as tabelas de dimensões estão relacionadas com tabelas de factos através de relações um-para-muitos. As relações permitem que os filtros e grupos aplicados às colunas da tabela de dimensões sejam propagados para a tabela de factos. Este padrão de design é comum.
As tabelas de dimensões podem servir para filtrar várias tabelas de factos e as tabelas de factos podem ser filtradas por várias tabelas de dimensões. No entanto, não é uma boa prática relacionar uma tabela de factos diretamente com outra tabela de factos.
Para praticar este conceito, transfira e abra o ficheiro Adventure Works DW 2020 M01.pbix e, em seguida, mude para o diagrama de modelo.
Repare que o modelo é composto por sete tabelas, uma das quais denomina-se Vendas e é a tabela de factos. As tabelas restantes são tabelas de dimensões e têm os seguintes nomes:
- Cliente
- Data
- Product
- Reseller
- Encomenda de Vendas
- Território de Vendas
Repare nas relações entre as tabelas de dimensões e de factos e que cada direção de filtro de relação está a apontar para a tabela de factos. Como resultado, quando os filtros são aplicados às colunas da tabela de dimensões (para filtrar ou agrupar por valores de coluna), os factos relacionados são filtrados e resumidos.
Se examinar o padrão, poderá ver a forma de um estrela.
Para obter mais informações sobre star estrutura do esquema, veja Compreender star esquema e a importância para o Power BI.