Ćwiczenie: używanie zapytań do eksplorowania trendów
Zapoznaliśmy się z nieprzetworzonymi danymi i zakresem nieznanego zestawu danych meteorologicznych. W tej lekcji użyjesz wizualizacji, aby zobaczyć, jak dane są dystrybuowane.
Schemat czasu
Przypomnij sobie, że niektóre kolumny danych, które zostały wyświetlone w ostatniej lekcji, to data /godzina i były reprezentowane czasy rozpoczęcia i zakończenia dla zdarzeń burzy. Aby zobaczyć, które daty mają zdarzenia storm-data, możesz wykreślić liczbę wpisów w porównaniu z czasem.
Pamiętaj, że w poprzedniej lekcji użyto podzestawu 50 wierszy danych, natomiast w tej lekcji zostanie użyty pełny zestaw danych.
Poniższe zapytanie tworzy wykres czasu liczby zdarzeń burzy na 8-godzinny przedział jako funkcję czasu.
Uruchom poniższe zapytanie:
StormEvents | summarize Count = count() by bin (StartTime, 8h) | render timechart
Powinny zostać wyświetlone wyniki, które wyglądają jak na poniższej ilustracji:
Przyjrzyj się wynikowej grafowi. Czy widzisz jakieś oczywiste luki lub anomalie?
Zdarzenia według stanu
Innym sposobem przyjrzenia się dystrybucji danych jest grupowanie według lokalizacji zdarzeń (w tym przypadku stan), aby zobaczyć, jakiego rodzaju trendy można zrozumieć z dystrybucji.
Uruchom poniższe zapytanie:
StormEvents | summarize event = count() by State | sort by event | render barchart
Powinny zostać wyświetlone wyniki, które wyglądają jak na poniższej ilustracji:
Przyjrzyj się wynikowej grafowi. Na liście znajduje się 67 różnych stanów, w tym tych, które nie są oficjalnymi stanami w USA, takimi jak "Samoa Amerykańskie" i "Wody Hawajskie". Czy ten typ dystrybucji burzy geograficznej ma sens?
Możesz przyjrzeć się bazowym danym, wybierając kartę Tabela nad wykresem. Czy rzeczywiste liczby pomagają lepiej zrozumieć rozkład danych?
Zdarzenia według lokalizacji geograficznej
Pokazano, jak liczba zdarzeń różni się w zależności od czasu i stanu. Pamiętaj, że mapowanie schematu wykazało, że każdy wpis zdarzenia burzy zawiera informacje o latitudinal i podłużnym. Przyjrzyjmy się, jak klastry danych są na mapie.
Poniższe zapytanie grupuje zdarzenia według komórki geograficznej i zlicza liczbę zdarzeń w każdej komórce. Te wyniki są wyświetlane na mapie, gdzie rozmiar okręgu odpowiada liczbie zdarzeń w tej komórce. Uruchom poniższe zapytanie:
StormEvents | project BeginLon, BeginLat | where isnotnull(BeginLat) and isnotnull(BeginLon) | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6) | project geo_s2cell_to_central_point(hash), count_summary | extend Events = "count" | render piechart with (kind = map)
Powinny zostać wyświetlone wyniki, które wyglądają jak na poniższej ilustracji:
Spróbuj powiększyć, naciskając Ctrl +. Teraz, gdy widzieliście typy burz reprezentowanych, czy ma sens, że istnieje więcej tego typu burz w północno-wschodniej części USA i zatoki Meksyku?