Descripción de los conceptos básicos del modelado de datos
Los modelos analíticos permiten estructurar los datos para admitir el análisis. Los modelos se basan en tablas de datos relacionadas y definen los valores numéricos que se quieren analizar o notificar (conocidos como medidas) y las entidades por las que se quieren agregar (conocidas como dimensiones). Por ejemplo, un modelo podría incluir una tabla con medidas numéricas para las ventas (como ingresos o cantidad) y dimensiones para productos, clientes y tiempo. Esto le permitiría agregar medidas de venta en una o varias dimensiones (por ejemplo, para identificar los ingresos totales por cliente o el total de artículos vendidos por producto al mes). Conceptualmente, el modelo forma una estructura multidimensional, que normalmente se conoce como cubo, en la que cualquier punto en el que las dimensiones forman una intersección representa una medida agregada para esas dimensiones.
Nota:
Aunque normalmente se denomina cubo a un modelo analítico, puede haber más (o menos) que tres dimensiones: simplemente no es fácil visualizar más de tres.
Tablas y esquema
Las tablas de dimensiones representan las entidades por las que se quieren agregar las medidas numéricas, por ejemplo, producto o cliente. Cada entidad se representa mediante una fila con un valor de clave único. Las columnas restantes representan los atributos de una entidad; por ejemplo, los productos tienen nombres y categorías, y los clientes tienen direcciones y ciudades. En la mayoría de los modelos analíticos es habitual incluir una dimensión Tiempo para poder agregar medidas numéricas asociadas a eventos en el tiempo.
Las medidas numéricas que agregarán las distintas dimensiones del modelo se almacenan en tablas de hechos. Cada fila de una tabla de hechos representa un evento registrado que tiene medidas numéricas asociadas. Por ejemplo, la tabla Sales (Ventas) del esquema siguiente representa las transacciones de ventas para elementos individuales e incluye valores numéricos para la cantidad vendida y los ingresos.
Este tipo de esquema, donde una tabla de hechos está relacionada con una o varias tablas de dimensiones, se conoce como esquema de estrella (imagine que hay cinco dimensiones relacionadas con una sola tabla de hechos: el esquema formaría una estrella de cinco puntas). También puede definir un esquema más complejo en el que las tablas de dimensiones están relacionadas con tablas adicionales que contienen más detalles (por ejemplo, podría representar atributos de categorías de productos en una tabla Category independiente relacionada con la tabla Product, en cuyo caso el diseño se conoce como un esquema de copo de nieve. El esquema de las tablas de hechos y dimensiones se utiliza para crear un modelo analítico, en el que se calculan previamente las agregaciones de medida para todas las dimensiones. Esto hace que el rendimiento de las actividades de análisis e informes sea mucho más rápido que si se calculan las agregaciones cada vez).
Jerarquías de atributos
Un último aspecto que merece la pena tener en cuenta sobre los modelos analíticos es la creación de jerarquías de atributos que le permiten rastrear agrupando datos o explorar en profundidad rápidamente para buscar valores agregados en distintos niveles en una dimensión jerárquica. Por ejemplo, considere los atributos de las tablas de dimensiones que se han analizado hasta ahora. En la tabla Product, puede formar una jerarquía en la que cada categoría incluya varios productos con nombre. De forma similar, en la tabla Customer, se podría formar una jerarquía para representar varios clientes con nombre en cada ciudad. Por último, en la tabla Time, puede formar una jerarquía de año, mes y día. El modelo se puede crear con valores agregados previamente para cada nivel de una jerarquía, lo que permite cambiar rápidamente el ámbito del análisis; por ejemplo, mediante la visualización del total de ventas por año y, después, la exploración en profundidad para ver un desglose más detallado del total de ventas por mes.
Modelado analítico en Microsoft Power BI
Puede usar Power BI para definir un modelo analítico a partir de tablas de datos, que se pueden importar desde uno o varios orígenes de datos. Después, puede usar la interfaz de modelado de datos de la pestaña Modelo de Power BI Desktop para definir el modelo analítico mediante la creación de relaciones entre tablas de hechos y dimensiones, la definición de jerarquías, el establecimiento de tipos de datos y formatos de presentación para los campos de las tablas, y la administración de otras propiedades de los datos que ayudan a definir un modelo enriquecido para el análisis.