Поделиться через


window выражение группирования

Область применения:флажок Databricks SQL флажок Databricks Runtime

Создает скользящееwindow на основе прыжков через выражение метки времени.

Синтаксис

window(expr, width [, slide [, start] ] )

Аргументы

  • expr: выражение TIMESTAMP, указывающее тему window.
  • width: литерал STRING, представляющий ширину window как литерал INTERVAL DAY TO SECOND.
  • slide: необязательный STRING литерал, представляющий offset с начала до полуночи, выраженный как литерал INTERVAL HOUR TO SECOND.
  • start: необязательный литерал STRING, представляющий начало следующего window, выраженное в виде литерала INTERVAL DAY TO SECOND.

Возвраты

Возвращает set группировок, с которыми можно работать с агрегатными функциями. Имя GROUP BYcolumn — window. Тип STRUCT<start TIMESTAMP, end TIMESTAMP>

slide должен быть меньше или равным width. start должен быть меньше slide.

Если slide<width строки в каждой группе перекрываются. По умолчанию slide равно width, таким образом expr секционируются на группы. Окно начинается с 1970-01-01 00:00:00 UTC + start. По умолчанию значение start равно '0 SECONDS'

Примеры

> SELECT window, min(val), max(val), count(val)
  FROM VALUES (TIMESTAMP'2020-08-01 12:20:21', 17),
              (TIMESTAMP'2020-08-01 12:20:22', 12),
              (TIMESTAMP'2020-08-01 12:23:10',  8),
              (TIMESTAMP'2020-08-01 12:25:05', 11),
              (TIMESTAMP'2020-08-01 12:28:59', 15),
              (TIMESTAMP'2020-08-01 12:30:01', 23),
              (TIMESTAMP'2020-08-01 12:30:15',  2),
              (TIMESTAMP'2020-08-01 12:35:22', 16) AS S(stamp, val)
  GROUP BY window(stamp, '2 MINUTES 30 SECONDS', '30 SECONDS', '15 SECONDS');
  {2020-08-01 12:19:15, 2020-08-01 12:21:45} 12       17       2
  {2020-08-01 12:18:15, 2020-08-01 12:20:45} 12       17       2
  {2020-08-01 12:20:15, 2020-08-01 12:22:45} 12       17       2
  {2020-08-01 12:19:45, 2020-08-01 12:22:15} 12       17       2
  {2020-08-01 12:18:45, 2020-08-01 12:21:15} 12       17       2
  {2020-08-01 12:21:45, 2020-08-01 12:24:15} 8        8        1
  {2020-08-01 12:22:45, 2020-08-01 12:25:15} 8        11       2
  {2020-08-01 12:21:15, 2020-08-01 12:23:45} 8        8        1
  {2020-08-01 12:22:15, 2020-08-01 12:24:45} 8        8        1
  {2020-08-01 12:20:45, 2020-08-01 12:23:15} 8        8        1
  {2020-08-01 12:23:45, 2020-08-01 12:26:15} 11       11       1
  {2020-08-01 12:23:15, 2020-08-01 12:25:45} 11       11       1
  {2020-08-01 12:24:45, 2020-08-01 12:27:15} 11       11       1
  {2020-08-01 12:24:15, 2020-08-01 12:26:45} 11       11       1
  {2020-08-01 12:27:15, 2020-08-01 12:29:45} 15       15       1
  {2020-08-01 12:27:45, 2020-08-01 12:30:15} 15       23       2
  {2020-08-01 12:28:45, 2020-08-01 12:31:15} 2        23       3
  {2020-08-01 12:26:45, 2020-08-01 12:29:15} 15       15       1
  {2020-08-01 12:28:15, 2020-08-01 12:30:45} 2        23       3
  {2020-08-01 12:29:45, 2020-08-01 12:32:15} 2        23       2