Exercício: Usar consultas para explorar tendências

Concluído

Você explorou os dados brutos e o intervalo de um conjunto de dados meteorológicos desconhecido. Nesta unidade, você usará visualizações para ver como os dados são distribuídos.

Gráfico de tempo

Lembre-se de que algumas das colunas de dados que você viu na última unidade eram do tipo DateTime e representavam os horários de início e término dos eventos de tempestade. Para ver quais datas têm eventos de dados de tempestade, plote uma contagem de entradas versus hora.

Observe que a unidade anterior usou um subconjunto de 50 linhas de dados, enquanto essa usará o conjunto de dados completo.

A consulta a seguir cria um gráfico de tempo do número de eventos de tempestade por compartimento de oito horas em função do tempo.

  1. Execute a seguinte consulta:

    Executar a consulta

    StormEvents
    | summarize Count = count() by bin (StartTime, 8h)
    | render timechart
    

    Você deve obter resultados parecidos com a seguinte imagem:

    Captura de tela dos resultados do gráfico de tempo.

  2. Confira o gráfico resultante. Você vê alguma lacuna ou anomalia óbvia?

Eventos por estado

Outra maneira de observar a distribuição de dados é agrupar por local do evento (nesse caso, estado) para ver que tipo de tendências podem ser entendidas a partir da distribuição.

  1. Execute a seguinte consulta:

    Executar a consulta

    StormEvents
    | summarize event = count() by State
    | sort by event
    | render barchart 
    

    Você deve obter resultados parecidos com a seguinte imagem:

    Captura de tela do gráfico de barras mostrando os danos por estado.

  2. Confira o gráfico resultante. Há 67 estados diferentes na lista, incluindo aqueles que não são estados oficiais nos EUA, como "Samoa Americana" e "Águas do Havaí". Esse tipo de distribuição de tempestade geográfica faz sentido?

  3. É possível examinar os dados subjacentes selecionando a guia Tabela acima do gráfico. Os números reais ajudam você a entender melhor a distribuição de dados?

    Captura de tela da tabela de dados do gráfico de danos.

Eventos por localização geográfica

Você viu como o número de eventos varia de acordo com o tempo e o estado. Lembre-se de que o mapeamento de esquema mostrou que cada entrada de evento de tempestade contém informações latitudinais e longitudinais. Confira a seguir como os dados se agrupam em um mapa.

  1. A consulta a seguir agrupa eventos por célula geográfica e conta o número de eventos em cada uma delas. Esses resultados são exibidos em um mapa, em que o tamanho do círculo corresponde ao número de eventos na célula. Execute a seguinte consulta:

    Executar a consulta

    StormEvents
    | project BeginLon, BeginLat
    | where isnotnull(BeginLat) and isnotnull(BeginLon)
    | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6)
    | project geo_s2cell_to_central_point(hash), count_summary
    | extend Events = "count"
    | render piechart with (kind = map)
    

    Você deve obter resultados parecidos com a seguinte imagem:

    Captura de tela do resultado do gráfico de mapa com círculos mostrando o número de eventos em uma determinada área.

  2. Tente ampliar pressionando Ctrl +. Agora que você viu os tipos de tempestades representados, faz sentido que haja mais deles na região nordeste dos EUA e no golfo do México?