Exercício: Usar consultas para explorar tendências
Você explorou os dados brutos e o intervalo de um conjunto de dados meteorológicos desconhecido. Nesta unidade, você usará visualizações para ver como os dados são distribuídos.
Gráfico de tempo
Lembre-se de que algumas das colunas de dados que você viu na última unidade eram do tipo DateTime e representavam os horários de início e término dos eventos de tempestade. Para ver quais datas têm eventos de dados de tempestade, plote uma contagem de entradas versus hora.
Observe que a unidade anterior usou um subconjunto de 50 linhas de dados, enquanto essa usará o conjunto de dados completo.
A consulta a seguir cria um gráfico de tempo do número de eventos de tempestade por compartimento de oito horas em função do tempo.
Execute a seguinte consulta:
StormEvents | summarize Count = count() by bin (StartTime, 8h) | render timechart
Você deve obter resultados parecidos com a seguinte imagem:
Confira o gráfico resultante. Você vê alguma lacuna ou anomalia óbvia?
Eventos por estado
Outra maneira de observar a distribuição de dados é agrupar por local do evento (nesse caso, estado) para ver que tipo de tendências podem ser entendidas a partir da distribuição.
Execute a seguinte consulta:
StormEvents | summarize event = count() by State | sort by event | render barchart
Você deve obter resultados parecidos com a seguinte imagem:
Confira o gráfico resultante. Há 67 estados diferentes na lista, incluindo aqueles que não são estados oficiais nos EUA, como "Samoa Americana" e "Águas do Havaí". Esse tipo de distribuição de tempestade geográfica faz sentido?
É possível examinar os dados subjacentes selecionando a guia Tabela acima do gráfico. Os números reais ajudam você a entender melhor a distribuição de dados?
Eventos por localização geográfica
Você viu como o número de eventos varia de acordo com o tempo e o estado. Lembre-se de que o mapeamento de esquema mostrou que cada entrada de evento de tempestade contém informações latitudinais e longitudinais. Confira a seguir como os dados se agrupam em um mapa.
A consulta a seguir agrupa eventos por célula geográfica e conta o número de eventos em cada uma delas. Esses resultados são exibidos em um mapa, em que o tamanho do círculo corresponde ao número de eventos na célula. Execute a seguinte consulta:
StormEvents | project BeginLon, BeginLat | where isnotnull(BeginLat) and isnotnull(BeginLon) | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6) | project geo_s2cell_to_central_point(hash), count_summary | extend Events = "count" | render piechart with (kind = map)
Você deve obter resultados parecidos com a seguinte imagem:
Tente ampliar pressionando Ctrl +. Agora que você viu os tipos de tempestades representados, faz sentido que haja mais deles na região nordeste dos EUA e no golfo do México?