练习:首先查看数据

已完成

回顾我们的场景,你遇到了一个新的数据集,其中包含有关美国风暴的气象信息。 在本单元中,你将首先查看数据本身。

查看原始数据

你需要做的第一件事就是查看实际数据,了解存在哪些列、这些列中有哪些数据类型以及存在哪些可能的值。 无需查看数据表中的每一行,因此让我们在整个表中选择一小部分。

  1. 运行以下查询以获取 50 行任意数据。

    运行查询

    StormEvents
    | take 50
    

    尽管你看到的特定行可能不同,但应获得如下图所示的结果:

    显示获取 50query 的结果的屏幕快照。

  2. 查看查询下方生成的表,这就是所谓的“结果网格”。 滚动到右侧以记下所有列。 你能从这些列中了解数据类型和值范围吗? 请记住,显示的字段只是整个表的采样。

使用结果网格重新组织数据

结果网格提供了一系列内置工具,这些工具可能是来自其他环境的熟悉操作。 例如,可以根据特定列对数据进行排序。

以下示例中的每一列都以 take 50 查询中的结果开头。

对列中的数据进行排序

若要对特定列进行排序,请在结果网格中选择该列的名称。 列名称右侧显示的箭头指示它是按升序还是降序排序。

  1. 选择“状态”列。

    显示按状态列排序的列的屏幕截图。

  2. 查看生成的列表。 你是否看到出现在多行中的任何状态? 请记住,你看到的是上面选择的 50 行,因此应该不会看到完整的列表。

对结果进行分组

进一步对数据进行排序,可以按常见字段对结果进行分组或聚合。 回想一下,上面的排序列表提供了多个州的多个条目。

  1. 选择要排序的列右侧的菜单图标。 在这种情况下,选择“状态”列右侧的菜单。
  2. 选择“按州分组”
  3. 每个状态后跟关联条目的计数。 选择状态名称左侧的箭头以展开这些条目。

显示在 Azure 数据资源管理器 Web UI 中选择状态和按状态分组的过程的屏幕截图。

选择数据的子集

现在,你已了解表中有哪种类型的数据,你可以选择该数据的子集,例如仅选择洪水事件。

  1. 在 EventType 列中,选择要筛选的事件。 按住键盘上的 Shift 键以选择多个事件,例如“暴洪”、“暴雨”和“洪水”。
  2. 右键单击所选字段,然后选择“添加选定内容作为筛选器”。 上述查询将更改为添加筛选的字段。
  3. 选择“运行”按钮以重新运行查询。 所有生成的事件现在都是所选类型之一。

显示选择单元格并将所选内容添加为查询中的筛选器的屏幕截图。

筛选值

还可以筛选单个值。 让我们看看俄亥俄州发生的所有事件。

  1. 选择“状态”列右侧的菜单图标。

  2. 选择漏斗图标

  3. 虽然可以搜索任何类型的字符串或整数匹配项,但你需要查找包含“俄亥俄州”一词的任何列。 还可以使用此筛选器查找不完整或空的数据字段。

    字符串运算符下拉列表的屏幕截图。

  4. 在筛选类型下方,输入“俄亥俄州”一词。 请注意,会立即筛选出结果。

    显示针对字符串值的列筛选器的屏幕截图。

汇总所选单元格

在结果网格的右下角,将汇总所选单元格。 选择整数值时,还可以查看这些值的统计摘要。

  1. 滚动到结果网格中的 DamageProperty 列。

  2. 单击并拖动此列中的所选单元格。 这些单元格将以蓝色背景突出显示,以指示所选内容。

  3. 查看结果网格的右下角。 显示的最大值和最小值是什么? 此摘要是否有助于了解此列中的数据范围?

    显示所选整数单元格的统计摘要的屏幕截图。

展开动态字段

滚动到数据表中的最后一列。 是否看到 StormSummary 列? 此字段包含大量数据,这些数据并非全部可见。 可以展开单元格以查看动态字段中的所有信息。

  1. 选择结果网格右上角的“展开视图”图标。

  2. 选择“右侧”以查看右窗格中展开的结果。

  3. 滚动到表最右侧的 StormSummary 列。

  4. 双击此列中的其中一个字段。 该字段将展开以采用更易于读取的格式显示内容:

    展开风暴摘要动态字段的屏幕截图。