Introdução

Concluído

Considere o cenário em que você importou dados para o Power BI de várias fontes diferentes e, quando examinou os dados, descobriu que eles não estão preparados para análise. O que poderá tornar os dados não preparados para análise?

Ao examinar os dados, você descobre vários problemas, incluindo:

  • Uma coluna chamada Status de emprego contém apenas numerais.

  • Várias colunas contêm erros.

  • Algumas colunas contêm valores nulos.

  • A ID do cliente em algumas colunas é exibida como se ela fosse duplicada repetidamente.

  • Uma coluna de endereço único tem o endereço, a cidade, o estado e o CEP combinados.

Você começa a trabalhar com os dados, mas toda vez que cria elementos visuais em relatórios, obtém dados inválidos, resultados incorretos e relatórios simples sobre os totais de vendas estão errados.

Dados sujos podem ser desgastantes e, embora possa se sentir frustrado, você decide começar a trabalhar e descobrir como tornar esse modelo semântico o mais imaculado possível.

A boa notícia é que o Power BI e o Power Query oferecem um ambiente avançado para limpar e preparar os dados. Os dados limpos trazem as seguintes vantagens:

  • As medidas e as colunas produzem resultados mais precisos quando fazem agregações e cálculos.

  • As tabelas são organizadas, nas quais os usuários podem encontrar os dados de maneira intuitiva.

  • As duplicatas são removidas, simplificando a navegação de dados. Eles também produzirão colunas que podem ser usadas em segmentações e filtros.

  • Uma coluna complicada pode ser dividida em duas colunas mais simples. Várias colunas podem ser combinadas em uma só coluna para facilitar a leitura.

  • Códigos e inteiros podem ser substituídos por valores legíveis por humanos.

Neste módulo, você aprenderá a:

  • Resolver inconsistências, valores inesperados ou nulos e problemas de qualidade de dados.

  • Aplicar substituições de valor amigáveis.

  • Analisar dados para saber mais sobre uma coluna específica antes de usá-la.

  • Avaliar e transformar os tipos de dados de coluna.

  • Aplicar transformações da forma dos dados a estruturas de tabela.

  • Combinar consultas.

  • Aplicar convenções de nomenclatura amigáveis a colunas e consultas.

  • Editar o código M no Editor Avançado.