Introducción

Completado

Considere el escenario en el que se han importado datos en Power BI desde varios orígenes distintos y, al examinar estos datos, no están preparado para el análisis. ¿Qué podría suceder para que los datos no estuvieran preparados para el análisis?

Al examinar los datos, se detectan varias incidencias, entre las que se incluyen las siguientes:

  • Una columna denominada Employment status solo contiene números.

  • Varias columnas contienen errores.

  • Algunas columnas contienen valores NULL.

  • El id. de cliente en algunas columnas aparece como si se duplicara varias veces.

  • Una sola columna de dirección ha combinado una dirección, una ciudad, un estado y un código postal.

Comienza a trabajar con los datos, pero cada vez que crea objetos visuales en los informes obtiene datos incorrectos, resultados incorrectos y los informes sencillos sobre las ventas totales están mal.

Los datos con modificaciones pueden ser abrumadores y, aunque es posible que se sienta frustrado, decide trabajar y averiguar cómo hacer que este modelo semántico sea lo más perfecto posible.

Afortunadamente, Power BI y Power Query ofrecen un entorno eficaz para limpiar y preparar los datos. La limpieza de datos tiene las ventajas siguientes:

  • Las medidas y columnas producen resultados más precisos cuando realizan agregaciones y cálculos.

  • Las tablas están organizadas, de forma que los usuarios pueden encontrar los datos de una manera intuitiva.

  • Se quitan los duplicados, lo que facilita la navegación de datos. También generará columnas que se pueden usar en segmentaciones y filtros.

  • Una columna complicada se puede dividir en dos columnas más sencillas. Se pueden combinar varias columnas en una sola para facilitar la legibilidad.

  • Los códigos y enteros se pueden reemplazar por valores legibles para el usuario.

En este módulo, aprenderá a lo siguiente:

  • Resolver incoherencias, valores inesperados o NULL e incidencias de calidad de los datos.

  • Aplicar reemplazos de valores fáciles de usar.

  • Generar perfiles de datos para que pueda obtener más información sobre una columna específica antes de usarla.

  • Evaluar y transformar tipos de datos de columna.

  • Aplicar transformaciones de forma de datos a estructuras de tabla.

  • Combinar consultas.

  • Aplicar convenciones de nomenclatura fáciles de comprender a columnas y consultas.

  • Editar el código M en el Editor avanzado.