Exercício: use consultas para explorar tendências

Concluído

Você explorou os dados brutos e o alcance de um conjunto de dados meteorológicos desconhecido. Nesta unidade, você usará visualizações para ver como os dados são distribuídos.

Gráfico de tempo

Lembre-se de que algumas das colunas de dados que você viu na última unidade eram do tipo DateTime e representavam as horas de início e término para eventos de tempestade. Para ver quais datas têm eventos de dados de tempestade, você pode plotar uma contagem de entradas versus tempo.

Observe que a unidade anterior usava um subconjunto de 50 linhas de dados, enquanto essa unidade usará o conjunto de dados completo.

A consulta a seguir cria um gráfico de tempo do número de eventos de tempestade por compartimento de 8 horas em função do tempo.

  1. Execute a seguinte consulta:

    Executar a consulta

    StormEvents
    | summarize Count = count() by bin (StartTime, 8h)
    | render timechart
    

    Você deve obter resultados parecidos com a seguinte imagem:

    Captura de ecrã dos resultados do gráfico de tempo.

  2. Dê uma olhada no gráfico resultante. Vê alguma lacuna ou anomalia óbvia?

Eventos por estado

Outra maneira de olhar para a distribuição de dados é agrupar por local de evento (neste caso, estado) para ver que tipo de tendências podem ser entendidas a partir da distribuição.

  1. Execute a seguinte consulta:

    Executar a consulta

    StormEvents
    | summarize event = count() by State
    | sort by event
    | render barchart 
    

    Você deve obter resultados parecidos com a seguinte imagem:

    Captura de tela do gráfico de barras mostrando danos por estado.

  2. Dê uma olhada no gráfico resultante. Há 67 estados diferentes na lista, incluindo aqueles que não são estados oficiais nos EUA, como "Samoa Americana" e "águas do Havaí". Este tipo de distribuição geográfica das tempestades faz sentido?

  3. Você pode examinar os dados subjacentes selecionando a guia Tabela acima do gráfico. Os números reais ajudam a entender melhor a distribuição de dados?

    Captura de tela da tabela de dados para o gráfico de danos.

Eventos por localização geográfica

Você viu como o número de eventos varia com base no tempo e no estado. Lembre-se de que o mapeamento do esquema mostrou que cada entrada de evento de tempestade contém informações latitudinais e longitudinais. Vamos dar uma olhada em como os clusters de dados em um mapa.

  1. A consulta a seguir agrupa eventos por célula geográfica e conta o número de eventos em cada célula. Esses resultados são exibidos em um mapa, onde o tamanho do círculo corresponde ao número de eventos nessa célula. Execute a seguinte consulta:

    Executar a consulta

    StormEvents
    | project BeginLon, BeginLat
    | where isnotnull(BeginLat) and isnotnull(BeginLon)
    | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6)
    | project geo_s2cell_to_central_point(hash), count_summary
    | extend Events = "count"
    | render piechart with (kind = map)
    

    Você deve obter resultados parecidos com a seguinte imagem:

    Captura de tela do resultado do gráfico de mapa com círculos mostrando o número de eventos em uma determinada área.

  2. Tente aumentar o zoom pressionando Ctrl+. Agora que você já viu os tipos de tempestades representadas, faz sentido que haja mais desses tipos de tempestades na área nordeste dos EUA e no golfo do México?