Ćwiczenie: używanie zapytań do eksplorowania trendów

Ukończone

Zapoznaliśmy się z nieprzetworzonymi danymi i zakresem nieznanego zestawu danych meteorologicznych. W tej lekcji użyjesz wizualizacji, aby zobaczyć, jak dane są dystrybuowane.

Schemat czasu

Przypomnij sobie, że niektóre kolumny danych, które zostały wyświetlone w ostatniej lekcji, to data /godzina i były reprezentowane czasy rozpoczęcia i zakończenia dla zdarzeń burzy. Aby zobaczyć, które daty mają zdarzenia storm-data, możesz wykreślić liczbę wpisów w porównaniu z czasem.

Pamiętaj, że w poprzedniej lekcji użyto podzestawu 50 wierszy danych, natomiast w tej lekcji zostanie użyty pełny zestaw danych.

Poniższe zapytanie tworzy wykres czasu liczby zdarzeń burzy na 8-godzinny przedział jako funkcję czasu.

  1. Uruchom poniższe zapytanie:

    Uruchamianie zapytania

    StormEvents
    | summarize Count = count() by bin (StartTime, 8h)
    | render timechart
    

    Powinny zostać wyświetlone wyniki, które wyglądają jak na poniższej ilustracji:

    Zrzut ekranu przedstawiający wyniki wykresu czasowego.

  2. Przyjrzyj się wynikowej grafowi. Czy widzisz jakieś oczywiste luki lub anomalie?

Zdarzenia według stanu

Innym sposobem przyjrzenia się dystrybucji danych jest grupowanie według lokalizacji zdarzeń (w tym przypadku stan), aby zobaczyć, jakiego rodzaju trendy można zrozumieć z dystrybucji.

  1. Uruchom poniższe zapytanie:

    Uruchamianie zapytania

    StormEvents
    | summarize event = count() by State
    | sort by event
    | render barchart 
    

    Powinny zostać wyświetlone wyniki, które wyglądają jak na poniższej ilustracji:

    Zrzut ekranu przedstawiający wykres słupkowy przedstawiający uszkodzenie według stanu.

  2. Przyjrzyj się wynikowej grafowi. Na liście znajduje się 67 różnych stanów, w tym tych, które nie są oficjalnymi stanami w USA, takimi jak "Samoa Amerykańskie" i "Wody Hawajskie". Czy ten typ dystrybucji burzy geograficznej ma sens?

  3. Możesz przyjrzeć się bazowym danym, wybierając kartę Tabela nad wykresem. Czy rzeczywiste liczby pomagają lepiej zrozumieć rozkład danych?

    Zrzut ekranu przedstawiający tabelę danych z powodu uszkodzenia wykresu.

Zdarzenia według lokalizacji geograficznej

Pokazano, jak liczba zdarzeń różni się w zależności od czasu i stanu. Pamiętaj, że mapowanie schematu wykazało, że każdy wpis zdarzenia burzy zawiera informacje o latitudinal i podłużnym. Przyjrzyjmy się, jak klastry danych są na mapie.

  1. Poniższe zapytanie grupuje zdarzenia według komórki geograficznej i zlicza liczbę zdarzeń w każdej komórce. Te wyniki są wyświetlane na mapie, gdzie rozmiar okręgu odpowiada liczbie zdarzeń w tej komórce. Uruchom poniższe zapytanie:

    Uruchamianie zapytania

    StormEvents
    | project BeginLon, BeginLat
    | where isnotnull(BeginLat) and isnotnull(BeginLon)
    | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6)
    | project geo_s2cell_to_central_point(hash), count_summary
    | extend Events = "count"
    | render piechart with (kind = map)
    

    Powinny zostać wyświetlone wyniki, które wyglądają jak na poniższej ilustracji:

    Zrzut ekranu przedstawiający wynik wykresu mapy z okręgami pokazującymi liczbę zdarzeń w danym obszarze.

  2. Spróbuj powiększyć, naciskając Ctrl +. Teraz, gdy widzieliście typy burz reprezentowanych, czy ma sens, że istnieje więcej tego typu burz w północno-wschodniej części USA i zatoki Meksyku?