练习:使用查询浏览趋势

已完成

你了解了不熟悉的气象数据集的原始数据和范围。 在本单元中,你将使用可视化效果查看数据的分布方式。

时间表

回想一下,你在上一个单元中看到的一些数据列的类型为“日期/时间”,并表示风暴事件的开始和结束时间。 要查看哪些日期具有风暴数据事件,可以绘制条目与时间的计数。

请注意,上一个单元使用了 50 个数据行的子集,而此单元将使用完整的数据集。

以下查询创建每 8 小时箱的风暴事件数作为时间函数的时间图表。

  1. 运行以下查询:

    运行查询

    StormEvents
    | summarize Count = count() by bin (StartTime, 8h)
    | render timechart
    

    应获得如下图所示的结果:

    时间图表结果的屏幕截图。

  2. 查看生成的图形。 你是否看到任何明显的差距或异常?

按州划分的事件

查看数据分布的另一种方法是按事件位置(在本例中为州)进行分组,以查看可以从分布中了解哪种趋势。

  1. 运行以下查询:

    运行查询

    StormEvents
    | summarize event = count() by State
    | sort by event
    | render barchart 
    

    应获得如下图所示的结果:

    显示按州损坏的条形图的屏幕截图。

  2. 查看生成的图形。 列表中有 67 个不同的州 - 包括那些不是美国官方州的州,如“美属萨摩亚”和“夏威夷水域”。 这种类型的地理风暴分布是否有意义?

  3. 可以通过选择图表上方的“表”选项卡来查看基础数据。 实际数字是否有助于更好地了解数据分布?

    损坏图表的数据表的屏幕截图。

按地理位置划分的事件

你已了解了事件数量如何因时间和州而异。 回想一下,架构映射显示每个风暴事件条目都包含纬度和经度信息。 让我们看一下数据如何在地图上进行聚类。

  1. 以下查询按地理单元格对事件进行分组,并计算每个单元格中的事件数。 这些结果显示在地图上,其中圆大小对应于该单元格中的事件数。 运行以下查询:

    运行查询

    StormEvents
    | project BeginLon, BeginLat
    | where isnotnull(BeginLat) and isnotnull(BeginLon)
    | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6)
    | project geo_s2cell_to_central_point(hash), count_summary
    | extend Events = "count"
    | render piechart with (kind = map)
    

    应获得如下图所示的结果:

    地图图表结果的屏幕截图,其中圆圈显示给定区域中的事件数。

  2. 通过按 Ctrl + 尝试放大。 既然你已看到了所代表的风暴类型,那么在美国东北部地区和墨西哥湾中有更多的此类风暴是否有意义?