Introdução

Concluído

Considere o cenário em que tem dados de diferentes origens importados para o Power BI e quando os examina, não estão preparados para análise. O que pode fazer com que os dados não estejam preparados para análise?

Ao examinar os dados, descobre vários problemas, incluindo:

  • Uma coluna denominada Employment status (Situação profissional) só contém números.

  • Várias colunas contêm erros.

  • Algumas colunas contêm valores nulos.

  • O ID de cliente de algumas colunas aparece como se estivesse duplicado.

  • Uma única coluna de endereço tem uma combinação de rua, cidade, distrito e código postal.

Começa a trabalhar com os dados, mas sempre que cria elementos visuais em relatórios, obtém maus dados e resultados incorretos e os relatórios simples sobre os totais de vendas estão errados.

Os dados sujos podem ser esmagadores e, apesar de se sentir frustrado, decide começar a trabalhar e descobrir como tornar este modelo semântico o mais imaculado possível.

Felizmente, o Power BI e o Power Query oferecem-lhe um ambiente avançado para limpar e preparar os dados. Os dados limpos têm as seguintes vantagens:

  • As medidas e as colunas produzem resultados mais rigorosos quando realizam agregações e cálculos.

  • As tabelas estão organizadas para que os utilizadores possam encontrar os dados intuitivamente.

  • Os duplicados são removidos, o que facilita a navegação pelos dados. Também são produzidas colunas que podem ser utilizadas em segmentações de dados e filtros.

  • Uma coluna complexa pode ser dividida em duas colunas mais simples. Várias colunas podem ser combinadas numa só para uma maior legibilidade.

  • Os códigos e os números inteiros podem ser substituídos por valores legíveis por humanos.

Neste módulo, irá aprender a:

  • Resolver inconsistências, valores inesperados ou nulos e problemas de qualidade de dados.

  • Aplicar substituições de valor fáceis de utilizar.

  • Identificar os dados para poder saber mais sobre uma coluna específica antes de a utilizar.

  • Avaliar e transformar tipos de dados de colunas.

  • Aplicar transformações de formas de dados a estruturas de tabelas.

  • Combinar consultas.

  • Aplicar convenções de nomenclatura fáceis de utilizar a colunas e consultas.

  • Editar código M no Editor Avançado.