Diseño de esquema de estrella
No es habitual que un modelo semántico de Power BI conste de una sola tabla. Un modelo de tabla única puede ser un diseño sencillo, quizás uno que sea adecuado para una tarea de exploración de datos o una prueba de concepto, pero no uno que sea un diseño de modelo óptimo. Un modelo óptimo cumple con los principios de diseño de esquema de estrella. El esquema de estrella se refiere a un enfoque de diseño que suelen usar los diseñadores de almacenamiento de datos relacionales porque presenta una estructura fácil de usar y admite consultas de análisis de alto rendimiento.
Este principio de diseño se llama esquema de estrella porque clasifica las tablas de modelo como hecho o dimensión. En un diagrama, una tabla de hechos forma el centro de una estrella, mientras que las tablas de dimensiones, cuando se colocan alrededor de una tabla de hechos, representan los puntos de la estrella.
Tablas de hechos
El rol de una tabla de hechos es almacenar una acumulación de filas que representan observaciones o eventos que registran una actividad económica específica. Por ejemplo, los eventos que se almacenan en una tabla de hechos de ventas podrían ser pedidos de ventas y las líneas de pedido. También podría usar una tabla de hechos para registrar movimientos de existencias, saldos de existencias o tasas de cambio de moneda diarias. Por lo general, las tablas de hechos contienen varias filas. A medida que pasa el tiempo, las filas de las tabla de hecho se acumulan. En las consultas de análisis (que se definirán más adelante en este módulo), los datos de la tabla de hechos se resumen para generar valores como ventas y cantidad.
Tablas de dimensiones
Las tablas de dimensiones describen las entidades comerciales, que suelen representar personas, lugares, productos o conceptos. Una tabla de dimensiones de fechas, que contiene una fila para cada fecha, es un ejemplo común de una tabla de dimensiones de concepto. Las columnas de las tablas de dimensiones permiten filtrar y agrupar los datos de la tabla de hechos.
Cada tabla de dimensiones debe tener una columna única, a la que se hace referencia como su columna de clave. Una columna única no contiene valores duplicados y nunca debe tener valores faltantes. En una tabla de dimensiones de producto, la columna podría tener el nombre ProductKey o ProductID. Es probable que columnas adicionales almacenen valores descriptivos, como el nombre del producto, la subcategoría, la categoría, el color, etc. En las consultas de análisis, estas columnas se usan para filtrar y agrupar los datos.
Comparación de las tablas de hechos y de dimensiones
En la ilustración siguiente se comparan las características de las tablas de hechos y de dimensiones.
Característica | Tabla de dimensiones | Tabla de hechos |
---|---|---|
Propósito del modelo | Almacena entidades comerciales | Almacena eventos u observaciones |
Estructura de tabla | Incluye una columna de clave y columnas descriptivas para filtrar y agrupar | Incluye columnas de clave de dimensiones y columnas de medidas numéricas que se pueden resumir |
Volumen de datos | Por lo general, contiene menos filas (en relación con las tablas de hechos) | Puede contener varias filas |
Propósito de la consulta | Filtrar y agrupar | Resumir |
Relación de las tablas de esquema de estrella
En el modelo, las tablas de dimensiones se relacionan con las tablas de hechos mediante relaciones de uno a varios. Las relaciones permiten que los filtros y los grupos que se aplican a las columnas de la tabla de dimensiones se propaguen a la tabla de hechos. Este patrón de diseño es común.
Las tablas de dimensiones se pueden usar para filtrar varias tablas de hechos y las tablas de hechos se pueden filtrar por varias tablas de dimensiones. Sin embargo, no es recomendable relacionar una tabla de hechos directamente a otra tabla de hechos.
Para practicar este concepto, descargue el archivo Adventure Works DW 2020 M01.pbix, ábralo y cambie al diagrama del modelo.
Observe que el modelo se compone de siete tablas, una de las cuales se denomina Sales y es la tabla de hechos. Las tablas restantes son tablas de dimensiones y tienen los nombres siguientes:
- Cliente
- Fecha
- Product
- Reseller
- Pedido de venta
- Territorio de ventas
Observe las relaciones entre las tablas de dimensiones y de hechos y que cada dirección del filtro de relación apunta hacia la tabla de hechos. Como resultado, cuando se aplican filtros a las columnas de la tabla de dimensiones (para filtrar o agrupar por valores de columna), los hechos relacionados se filtran y resumen.
Si examina el patrón, es posible que vea una forma de estrella.
Para más información sobre un diseño de esquemas de estrella, consulte Descripción de un esquema de estrella e importancia para Power BI.