Introdução
Considere o cenário em que tem dados de diferentes origens importados para o Power BI e quando os examina, não estão preparados para análise. O que pode fazer com que os dados não estejam preparados para análise?
Ao examinar os dados, descobre vários problemas, incluindo:
Uma coluna denominada Employment status (Situação profissional) só contém números.
Várias colunas contêm erros.
Algumas colunas contêm valores nulos.
O ID de cliente de algumas colunas aparece como se estivesse duplicado.
Uma única coluna de endereço tem uma combinação de rua, cidade, distrito e código postal.
Começa a trabalhar com os dados, mas sempre que cria elementos visuais em relatórios, obtém maus dados e resultados incorretos e os relatórios simples sobre os totais de vendas estão errados.
Os dados sujos podem ser esmagadores e, apesar de se sentir frustrado, decide começar a trabalhar e descobrir como tornar este modelo semântico o mais imaculado possível.
Felizmente, o Power BI e o Power Query oferecem-lhe um ambiente avançado para limpar e preparar os dados. Os dados limpos têm as seguintes vantagens:
As medidas e as colunas produzem resultados mais rigorosos quando realizam agregações e cálculos.
As tabelas estão organizadas para que os utilizadores possam encontrar os dados intuitivamente.
Os duplicados são removidos, o que facilita a navegação pelos dados. Também são produzidas colunas que podem ser utilizadas em segmentações de dados e filtros.
Uma coluna complexa pode ser dividida em duas colunas mais simples. Várias colunas podem ser combinadas numa só para uma maior legibilidade.
Os códigos e os números inteiros podem ser substituídos por valores legíveis por humanos.
Neste módulo, irá aprender a:
Resolver inconsistências, valores inesperados ou nulos e problemas de qualidade de dados.
Aplicar substituições de valor fáceis de utilizar.
Identificar os dados para poder saber mais sobre uma coluna específica antes de a utilizar.
Avaliar e transformar tipos de dados de colunas.
Aplicar transformações de formas de dados a estruturas de tabelas.
Combinar consultas.
Aplicar convenções de nomenclatura fáceis de utilizar a colunas e consultas.
Editar código M no Editor Avançado.