Exercício: use consultas para explorar tendências
Você explorou os dados brutos e o alcance de um conjunto de dados meteorológicos desconhecido. Nesta unidade, você usará visualizações para ver como os dados são distribuídos.
Gráfico de tempo
Lembre-se de que algumas das colunas de dados que você viu na última unidade eram do tipo DateTime e representavam as horas de início e término para eventos de tempestade. Para ver quais datas têm eventos de dados de tempestade, você pode plotar uma contagem de entradas versus tempo.
Observe que a unidade anterior usava um subconjunto de 50 linhas de dados, enquanto essa unidade usará o conjunto de dados completo.
A consulta a seguir cria um gráfico de tempo do número de eventos de tempestade por compartimento de 8 horas em função do tempo.
Execute a seguinte consulta:
StormEvents | summarize Count = count() by bin (StartTime, 8h) | render timechart
Você deve obter resultados parecidos com a seguinte imagem:
Dê uma olhada no gráfico resultante. Vê alguma lacuna ou anomalia óbvia?
Eventos por estado
Outra maneira de olhar para a distribuição de dados é agrupar por local de evento (neste caso, estado) para ver que tipo de tendências podem ser entendidas a partir da distribuição.
Execute a seguinte consulta:
StormEvents | summarize event = count() by State | sort by event | render barchart
Você deve obter resultados parecidos com a seguinte imagem:
Dê uma olhada no gráfico resultante. Há 67 estados diferentes na lista, incluindo aqueles que não são estados oficiais nos EUA, como "Samoa Americana" e "águas do Havaí". Este tipo de distribuição geográfica das tempestades faz sentido?
Você pode examinar os dados subjacentes selecionando a guia Tabela acima do gráfico. Os números reais ajudam a entender melhor a distribuição de dados?
Eventos por localização geográfica
Você viu como o número de eventos varia com base no tempo e no estado. Lembre-se de que o mapeamento do esquema mostrou que cada entrada de evento de tempestade contém informações latitudinais e longitudinais. Vamos dar uma olhada em como os clusters de dados em um mapa.
A consulta a seguir agrupa eventos por célula geográfica e conta o número de eventos em cada célula. Esses resultados são exibidos em um mapa, onde o tamanho do círculo corresponde ao número de eventos nessa célula. Execute a seguinte consulta:
StormEvents | project BeginLon, BeginLat | where isnotnull(BeginLat) and isnotnull(BeginLon) | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6) | project geo_s2cell_to_central_point(hash), count_summary | extend Events = "count" | render piechart with (kind = map)
Você deve obter resultados parecidos com a seguinte imagem:
Tente aumentar o zoom pressionando Ctrl+. Agora que você já viu os tipos de tempestades representadas, faz sentido que haja mais desses tipos de tempestades na área nordeste dos EUA e no golfo do México?