Упражнение. Использование запросов для изучения тенденций
Вы изучили необработанные данные и диапазон незнакомого метеорологического набора данных. В этом уроке вы будете использовать визуализации для просмотра распределения данных.
Timechart
Помните, что некоторые столбцы данных, которые вы видели в последнем уроке, были типа DateTime, и представляли время начала и окончания для событий шторма. Чтобы узнать, какие даты имеют события storm-data, можно наметить количество записей и времени.
Обратите внимание, что предыдущий модуль использовал подмножество из 50 строк данных, в то время как в этом уроке будет использоваться полный набор данных.
Следующий запрос создает диаграмму времени числа событий шторма в 8-часовом контейнере в качестве функции времени.
Выполните приведенный ниже запрос:
StormEvents | summarize Count = count() by bin (StartTime, 8h) | render timechart
Вы должны получить результаты, аналогичные приведенным на следующем рисунке:
Посмотрите на результирующий граф. Вы видите какие-либо очевидные пробелы или аномалии?
События по состоянию
Другим способом просмотра распределения данных является группирование по расположению событий (в данном случае — состояние), чтобы увидеть, какие тенденции можно понять из распределения.
Выполните приведенный ниже запрос:
StormEvents | summarize event = count() by State | sort by event | render barchart
Вы должны получить результаты, аналогичные приведенным на следующем рисунке:
Посмотрите на результирующий граф. В списке есть 67 различных штатов, в том числе те, которые не являются официальными штатами в США, таких как "Американская Самоа" и "Гавайские воды". Имеет ли смысл этот тип географического распределения штормов?
Вы можете просмотреть базовые данные, выбрав вкладку "Таблица " над диаграммой. Помогут ли фактические числа лучше понять распределение данных?
События по географическому расположению
Вы узнали, как количество событий зависит от времени и состояния. Напомним, что сопоставление схемы показало, что каждая запись события storm содержит latitudinal и longitudinal information. Давайте рассмотрим, как кластеры данных на карте.
Следующий запрос группирует события по географической ячейке и подсчитывает количество событий в каждой ячейке. Эти результаты отображаются на карте, где размер круга соответствует количеству событий в этой ячейке. Выполните приведенный ниже запрос:
StormEvents | project BeginLon, BeginLat | where isnotnull(BeginLat) and isnotnull(BeginLon) | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6) | project geo_s2cell_to_central_point(hash), count_summary | extend Events = "count" | render piechart with (kind = map)
Вы должны получить результаты, аналогичные приведенным на следующем рисунке:
Попробуйте увеличить масштаб, нажав клавиши CTRL +. Теперь, когда вы видели типы штормов представлены, имеет ли смысл, что есть больше этих типов штормов в северо-восточной части США и залива Мексики?