Introdução
Considere o cenário em que você importou dados para o Power BI de várias fontes diferentes e, quando examinou os dados, descobriu que eles não estão preparados para análise. O que poderá tornar os dados não preparados para análise?
Ao examinar os dados, você descobre vários problemas, incluindo:
Uma coluna chamada Status de emprego contém apenas numerais.
Várias colunas contêm erros.
Algumas colunas contêm valores nulos.
A ID do cliente em algumas colunas é exibida como se ela fosse duplicada repetidamente.
Uma coluna de endereço único tem o endereço, a cidade, o estado e o CEP combinados.
Você começa a trabalhar com os dados, mas toda vez que cria elementos visuais em relatórios, obtém dados inválidos, resultados incorretos e relatórios simples sobre os totais de vendas estão errados.
Dados sujos podem ser desgastantes e, embora possa se sentir frustrado, você decide começar a trabalhar e descobrir como tornar esse modelo semântico o mais imaculado possível.
A boa notícia é que o Power BI e o Power Query oferecem um ambiente avançado para limpar e preparar os dados. Os dados limpos trazem as seguintes vantagens:
As medidas e as colunas produzem resultados mais precisos quando fazem agregações e cálculos.
As tabelas são organizadas, nas quais os usuários podem encontrar os dados de maneira intuitiva.
As duplicatas são removidas, simplificando a navegação de dados. Eles também produzirão colunas que podem ser usadas em segmentações e filtros.
Uma coluna complicada pode ser dividida em duas colunas mais simples. Várias colunas podem ser combinadas em uma só coluna para facilitar a leitura.
Códigos e inteiros podem ser substituídos por valores legíveis por humanos.
Neste módulo, você aprenderá a:
Resolver inconsistências, valores inesperados ou nulos e problemas de qualidade de dados.
Aplicar substituições de valor amigáveis.
Analisar dados para saber mais sobre uma coluna específica antes de usá-la.
Avaliar e transformar os tipos de dados de coluna.
Aplicar transformações da forma dos dados a estruturas de tabela.
Combinar consultas.
Aplicar convenções de nomenclatura amigáveis a colunas e consultas.
Editar o código M no Editor Avançado.