练习:使用查询浏览趋势
你了解了不熟悉的气象数据集的原始数据和范围。 在本单元中,你将使用可视化效果查看数据的分布方式。
时间表
回想一下,你在上一个单元中看到的一些数据列的类型为“日期/时间”,并表示风暴事件的开始和结束时间。 要查看哪些日期具有风暴数据事件,可以绘制条目与时间的计数。
请注意,上一个单元使用了 50 个数据行的子集,而此单元将使用完整的数据集。
以下查询创建每 8 小时箱的风暴事件数作为时间函数的时间图表。
运行以下查询:
StormEvents | summarize Count = count() by bin (StartTime, 8h) | render timechart
应获得如下图所示的结果:
查看生成的图形。 你是否看到任何明显的差距或异常?
按州划分的事件
查看数据分布的另一种方法是按事件位置(在本例中为州)进行分组,以查看可以从分布中了解哪种趋势。
运行以下查询:
StormEvents | summarize event = count() by State | sort by event | render barchart
应获得如下图所示的结果:
查看生成的图形。 列表中有 67 个不同的州 - 包括那些不是美国官方州的州,如“美属萨摩亚”和“夏威夷水域”。 这种类型的地理风暴分布是否有意义?
可以通过选择图表上方的“表”选项卡来查看基础数据。 实际数字是否有助于更好地了解数据分布?
按地理位置划分的事件
你已了解了事件数量如何因时间和州而异。 回想一下,架构映射显示每个风暴事件条目都包含纬度和经度信息。 让我们看一下数据如何在地图上进行聚类。
以下查询按地理单元格对事件进行分组,并计算每个单元格中的事件数。 这些结果显示在地图上,其中圆大小对应于该单元格中的事件数。 运行以下查询:
StormEvents | project BeginLon, BeginLat | where isnotnull(BeginLat) and isnotnull(BeginLon) | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6) | project geo_s2cell_to_central_point(hash), count_summary | extend Events = "count" | render piechart with (kind = map)
应获得如下图所示的结果:
通过按 Ctrl + 尝试放大。 既然你已看到了所代表的风暴类型,那么在美国东北部地区和墨西哥湾中有更多的此类风暴是否有意义?