Descrever os principais conceitos de modelagem de dados
Os modelos analíticos permitem estruturar dados para dar suporte à análise. Os modelos são baseados em tabelas de dados relacionadas e definem os valores numéricos que você deseja analisar ou relatar (conhecidos como medidas) e as entidades pelas quais deseja agregá-los (conhecidos como dimensões). Por exemplo, um modelo pode incluir uma tabela contendo medidas numéricas para vendas (como receita ou quantidade) e dimensões para produtos, clientes e tempo. Isso permitiria agregar medidas de venda em uma ou mais dimensões (por exemplo, para identificar a receita total por cliente ou o total de itens vendidos por produto por mês). Conceitualmente, o modelo forma uma estrutura multidimensional, que é comumente referida como um cubo, na qual qualquer ponto onde as dimensões se cruzam representa uma medida agregada para essas dimensões.)
Nota
Embora comumente nos referimos a um modelo analítico como um cubo, pode haver mais (ou menos) do que três dimensões – simplesmente não é fácil para nós visualizar mais de três!
Tabelas e esquema
As tabelas de dimensão representam as entidades pelas quais você deseja agregar medidas numéricas – por exemplo, produto ou cliente. Cada entidade é representada por uma linha com um valor de chave exclusivo. As colunas restantes representam atributos de uma entidade – por exemplo, os produtos têm nomes e categorias, e os clientes têm endereços e cidades. É comum na maioria dos modelos analíticos incluir uma dimensão de tempo para que você possa agregar medidas numéricas associadas a eventos ao longo do tempo.
As medidas numéricas que serão agregadas pelas várias dimensões no modelo são armazenadas em tabelas Fact . Cada linha em uma tabela de fatos representa um evento registrado que tem medidas numéricas associadas a ela. Por exemplo, a tabela Sales no esquema abaixo representa transações de vendas para itens individuais e inclui valores numéricos para quantidade vendida e receita.
Este tipo de esquema, onde uma tabela de fatos está relacionada a uma ou mais tabelas de dimensão, é referido como um esquema de estrelas (imagine que há cinco dimensões relacionadas a uma única tabela de fatos – o esquema formaria uma estrela de cinco pontas!). Você também pode definir um esquema mais complexo no qual as tabelas de dimensão estão relacionadas a tabelas adicionais contendo mais detalhes (por exemplo, você pode representar atributos de categorias de produtos em uma tabela Categoria separada relacionada à tabela Produto – caso em que o design é referido como um esquema de floco de neve. O esquema de tabelas de fatos e dimensões é usado para criar um modelo analítico, no qual as agregações de medidas em todas as dimensões são pré-calculadas; tornando o desempenho das atividades de análise e relatório muito mais rápido do que calcular as agregações de cada vez.)
Hierarquias de atributos
Uma última coisa que vale a pena considerar sobre modelos analíticos é a criação de hierarquias de atributos que permitem que você faça drill-up ou drill-down rapidamente para encontrar valores agregados em diferentes níveis em uma dimensão hierárquica. Por exemplo, considere os atributos nas tabelas de dimensão que discutimos até agora. Na tabela Produto, você pode formar uma hierarquia na qual cada categoria pode incluir vários produtos nomeados. Da mesma forma, na tabela Cliente , uma hierarquia pode ser formada para representar vários clientes nomeados em cada cidade. Finalmente, na Tabela de tempo, você pode formar uma hierarquia de ano, mês e dia. O modelo pode ser construído com valores pré-agregados para cada nível de uma hierarquia, permitindo que você altere rapidamente o escopo de sua análise – por exemplo, visualizando as vendas totais por ano e, em seguida, detalhando para ver uma divisão mais detalhada das vendas totais por mês.
Modelagem analítica no Microsoft Power BI
Você pode usar o Power BI para definir um modelo analítico de tabelas de dados, que podem ser importados de uma ou mais fontes de dados. Em seguida, você pode usar a interface de modelagem de dados na guia Modelo do Power BI Desktop para definir seu modelo analítico criando relações entre tabelas de fatos e dimensões, definindo hierarquias, definindo tipos de dados e formatos de exibição para campos nas tabelas e gerenciando outras propriedades de seus dados que ajudam a definir um modelo avançado para análise.