Exercício: Dê uma primeira olhada nos seus dados

Concluído

Lembre-se de que, em nosso cenário, você se deparou com um novo conjunto de dados que contém informações meteorológicas sobre tempestades nos EUA. Nesta unidade, você terá uma visão inicial dos dados em si.

Veja os dados brutos

A primeira coisa que você deseja fazer é examinar os dados reais para saber quais colunas existem, que tipo de dados estão nessas colunas e quais valores possíveis existem. Você não precisa ver todas as linhas na tabela de dados, então vamos fazer uma pequena seleção de toda a tabela.

  1. Execute a consulta a seguir para obter 50 linhas arbitrárias de dados.

    Executar a consulta

    StormEvents
    | take 50
    

    Você deve obter resultados parecidos com a imagem a seguir, embora as linhas específicas exibidas possam ser diferentes:

    Captura de tela mostrando os resultados de take 50query.

  2. Observe a tabela resultante abaixo da consulta, no que é chamado de grade de resultados. Desloque-se para o lado direito para tomar nota de todas as colunas. Você consegue ter uma noção dos tipos de dados e intervalos de valores nessas colunas? Lembre-se de que os campos mostrados são apenas uma amostra de toda a tabela.

Usar a grade de resultados para reorganizar os dados

A grade de resultados oferece uma variedade de ferramentas integradas que provavelmente são ações familiares de outros ambientes. Por exemplo, você pode classificar os dados com base em uma determinada coluna.

Cada um dos exemplos a seguir começa com os resultados da take 50 consulta.

Ordenar os dados numa coluna

Para classificar em uma coluna específica, selecione o nome dessa coluna na grade de resultados. A seta que aparece à direita do nome da coluna indica se ela está classificada em ordem crescente ou decrescente.

  1. Selecione a coluna Estado .

    Captura de ecrã a mostrar colunas ordenadas por coluna de estado.

  2. Veja a lista resultante. Você vê algum estado aparecendo em várias linhas? Lembre-se de que está a ver as 50 linhas que selecionou acima, pelo que não deve esperar ver uma lista completa.

Agrupar os resultados

Levando a classificação de dados um passo adiante, você pode agrupar — ou agregar — resultados por campos comuns. Você deve se lembrar que a lista ordenada acima deu várias entradas para vários estados.

  1. Selecione o ícone de menu à direita da coluna que deseja classificar. Nesse caso, selecione o menu no lado direito da coluna Estado .
  2. Selecione Agrupar por Estado.
  3. Cada estado é seguido por uma contagem de entradas associadas. Selecione a seta à esquerda do nome do estado para expandir essas entradas.

Captura de tela mostrando o processo de seleção de estado e agrupamento por estado na interface do usuário da Web do Azure Data Explorer.

Selecionar um subconjunto de dados

Agora que você tem uma ideia de que tipo de dados existem em sua tabela, você pode selecionar um subconjunto desses dados; por exemplo, apenas eventos de inundação.

  1. Na coluna EventType, selecione os eventos nos quais deseja filtrar. Mantenha pressionada a tecla Shift no teclado para selecionar vários eventos, como Flash Flood, Heavy Rain e Flood.
  2. Clique com o botão direito do mouse em um campo selecionado e selecione Adicionar seleção como filtros. A consulta anterior é alterada para adicionar campos filtrados.
  3. Execute novamente a consulta selecionando o botão Executar . Todos os eventos resultantes são agora um dos tipos selecionados.

Captura de tela mostrando a seleção de células e a adição de seleção como filtros na consulta.

Filtrar um valor

Você também pode filtrar em um único valor. Vamos ver todos os eventos que aconteceram no estado de Ohio.

  1. Selecione o ícone do menu à direita da coluna Estado .

  2. Selecione o ícone de funil.

  3. Embora você possa pesquisar por qualquer tipo de cadeia de caracteres ou correspondência de inteiros, convém procurar qualquer coluna que contenha a palavra Ohio. Você também pode usar esse filtro para encontrar campos de dados incompletos ou vazios.

    Captura de tela da lista suspensa de operadores de cadeia de caracteres.

  4. Abaixo do tipo de filtragem, digite a palavra Ohio. Observe que os resultados são imediatamente filtrados.

    Captura de tela mostrando o filtro de coluna em um valor de cadeia de caracteres.

Resumir células selecionadas

No canto inferior direito da grade de resultados, as células selecionadas são resumidas. Ao selecionar valores inteiros, você também pode ver um resumo estatístico desses valores.

  1. Role até a coluna DamageProperty na grade de resultados.

  2. Clique e arraste uma seleção de células nesta coluna. Estas células serão realçadas por um fundo azul para indicar a seleção.

  3. Observe o canto inferior direito da grelha de resultados. Quais são os valores máximos e mínimos apresentados? Este resumo ajuda-o a compreender o intervalo de dados desta coluna?

    Captura de ecrã a mostrar o resumo estatístico de células inteiras selecionadas.

Expandir um campo dinâmico

Desloque-se para a última coluna da tabela de dados. Você vê a coluna StormSummary ? Este campo contém uma grande quantidade de dados, que não são todos visíveis. Você pode expandir a célula para exibir todas as informações dentro do campo dinâmico.

  1. Selecione o ícone Expandir vista no canto superior direito da grelha de resultados.

  2. Selecione Direita para visualizar os resultados expandidos no painel direito.

  3. Desloque-se para a coluna mais à direita da tabela, StormSummary.

  4. Clique duas vezes em um dos campos desta coluna. O campo será expandido para mostrar o conteúdo em um formato mais fácil de ler:

    Captura de tela de expansão do campo dinâmico de resumo de tempestade.