Usar as ferramentas de criação de perfil de dados
As ferramentas de criação de perfil de dados fornecem maneiras novas e intuitivas de limpar, transformar e entender dados no Editor do Power Query. Eles incluem:
Qualidade da coluna
Distribuição de colunas
Perfil da coluna
Para habilitar as ferramentas de criação de perfil de dados, acesse a guia Exibir na faixa de opções. No Power Query Desktop, habilite as opções desejadas no grupo Visualização de dados, conforme mostrado na imagem a seguir.
No Power Query Online, selecione Visualização de dados e , em seguida, habilite as opções desejadas na lista suspensa.
Depois de habilitar as opções, você verá algo parecido com a imagem a seguir no Editor do Power Query.
Observação
Por padrão, o Power Query executa essa criação de perfil de dados nas primeiras 1.000 linhas de seus dados. Para que ele opere em todo o conjunto de dados, selecione a mensagem Perfilamento de coluna com base nas 1.000 primeiras linhas no canto inferior esquerdo da janela do editor para alterar o perfil da coluna para Perfilamento de coluna com base em todo o conjunto de dados.
Qualidade da coluna
O recurso de qualidade da coluna rotula valores em linhas em cinco categorias:
Válido, em verde.
Erro, em vermelho.
Vazio, em cinza escuro.
Desconhecido, em verde pontilhado. Indica quando há erros em uma coluna; a qualidade dos dados restantes é desconhecida.
Erro inesperado, em vermelho pontilhado.
Esses indicadores são exibidos diretamente abaixo do nome da coluna como parte de um pequeno gráfico de barras, conforme aparece na imagem a seguir.
O número de registros em cada categoria de qualidade de coluna também é exibido como uma porcentagem.
Ao passar o mouse sobre qualquer uma das colunas, você verá a distribuição numérica da qualidade dos valores em toda a coluna. Além disso, selecionar o botão de reticências (...) abre alguns botões de ação rápida para operações nos valores.
Distribuição de colunas
Esse recurso fornece um conjunto de visuais abaixo dos nomes das colunas, os quais demostram a frequência e a distribuição dos valores em cada uma das colunas. Os dados nessas visualizações são classificados em ordem decrescente do valor com a frequência mais alta.
Ao passar o mouse sobre os dados de distribuição em qualquer uma das colunas, você verá informações sobre os dados gerais na coluna (com contagem distinta e valores exclusivos). Distinto refere-se ao número total de valores diferentes em cada coluna. Exclusivo refere-se a valores que têm apenas uma única instância na coluna. Também é possível selecionar o botão de reticências e escolher em um menu de operações disponíveis.
Perfil da coluna
Esse recurso fornece uma visão mais detalhada dos dados em uma coluna. Além do gráfico de distribuição de colunas, ele contém um gráfico de estatísticas de coluna. Essas informações são exibidas abaixo da seção de visualização de dados, conforme a imagem a seguir.
Filtrar por valor
Você pode interagir com o gráfico de distribuição de valor no lado direito e selecionar qualquer uma das barras passando o mouse sobre as partes do gráfico.
Clique com o botão direito do mouse para exibir um conjunto de transformações disponíveis para esse valor.
Copiar dados
No canto superior direito das seções de distribuição de valor e de estatísticas de coluna, você pode selecionar o botão de reticências (...) para exibir um menu de atalho Copiar. Selecione-o para copiar os dados exibidos em qualquer seção para a área de transferência.
Agrupar por valor
Quando você seleciona o botão de reticências (...) no canto superior direito do gráfico de distribuição de valor, além de Copiar, pode selecionar Agrupar por. Esse recurso agrupa os valores em seu gráfico por um conjunto de opções disponíveis.
A imagem abaixo mostra uma coluna de nomes de produtos agrupados por tamanho de texto. Depois que os valores forem agrupados no gráfico, você poderá interagir com valores individuais no gráfico, conforme descrito em Filtrar por valor.