了解 Kusto 查询的基本结构
所有行业的组织都要处理源源不断的数据流,并需要将此类数据转换为有意义的可操作见解。 在气象方案中,你已获得了一个数据集,其中包含美国的暴风雨数据。 在此单元中,你将了解 Kusto 查询语言 (KQL) 的基本结构,以便可将它用于分析和解释此数据集。
什么是 Kusto 查询?
Kusto 查询是处理数据并返回结果的只读请求。 该请求以纯文本形式表述,易于阅读、撰写和自动执行。 Kusto 查询具有一个或多个查询语句,并以表格或图形格式返回数据。
表格查询语句包含零个或多个运算符。 每个运算符都以表格输入开头,并返回表格输出。 运算符按竖线 (|
) 进行排序。 数据从一个运算符流向或通过管道传送到下一个运算符。 每个步骤都将对数据进行筛选或操作,然后将结果馈送到接下来的步骤。
把它想象成一个漏斗图,开始时可获得一个完整数据表。 每次数据通过另一个运算符时,都会经过筛选、重排或汇总。 由于从一个运算符到另一个运算符的信息发送是按顺序执行的,因此查询运算符顺序很重要。 在漏斗图的末尾将会得到精简的输出。
这些运算符是特定于 KQL 的,不过 SQL 或其他语言通常也有与它们相似的运算符。
接下来看一个示例查询:
StormEvents
| where StartTime between (datetime(2007-11-01) .. datetime(2007-12-01))
| where State == "FLORIDA"
| count
该查询以对“StormEvents”表的引用开头,并包含运算符 where
和 count
。 每个运算符用竖线隔开。 源表的数据行先按 StartTime 列的值进行筛选,然后再按 State 列的值进行筛选。 在上一行中,查询返回包含一列和一行的表,其中包含剩余行的计数。
在接下来的单元中,你将连接到数据集,了解一些最常用的运算符。 然后,你将使用这些运算符回答有关包含美国气象数据的示例数据集的问题。