explode 表值生成器函数

适用于:勾选“是” Databricks SQL 勾选“是” Databricks Runtime

通过取消嵌套 collection 返回行集。

在 Databricks SQL 和 Databricks Runtime 13.3 LTS 及更高版本中,此函数支持命名参数调用

语法

explode(collection)

参数

  • collectionARRAYMAP 表达式。

返回

由数组的元素或者映射的键和值组成的行集。 由数组的 explode 生成的列名为 col。 映射的列名为 keyvalue

如果 collectionNULL,则不会生成任何行。 若要返回数组或映射值的单个行 NULL,请使用 explode_outer() 函数。

  • 适用于: 勾选“是” Databricks Runtime 12.1 及更早版本:

    explode 只能作为表达式的根或跟在 LATERAL VIEW 之后放入 SELECT 列表中。 将该函数放入 SELECT 列表中时,同一个 SELECT 列表中不得有其他生成器函数,否则会引发 UNSUPPORTED_GENERATOR.MULTI_GENERATOR

  • 适用于: 勾选“是” Databricks SQL 勾选“是” Databricks Runtime 12.2 LTS 及更高版本:

    LATERAL VIEW 子句SELECT 列表调用的语法已弃用。 请改为将 explode 作为 table_reference 调用。

示例

适用于:勾选“是”Databricks SQL 勾选“是”Databricks Runtime 12.1 及更低版本:

> SELECT explode(array(10, 20)) AS elem, 'Spark';
 10 Spark
 20 Spark

> SELECT explode(map(1, 'a', 2, 'b')) AS (num, val), 'Spark';
 1   a   Spark
 2   b   Spark

> SELECT explode(array(1, 2)), explode(array(3, 4));
  Error: UNSUPPORTED_GENERATOR.MULTI_GENERATOR

-- The difference between explode() and explode_outer() is that explode_outer() returns NULL if the array is NULL.
> SELECT explode_outer(c1) AS elem, 'Spark' FROM VALUES(array(10, 20)), (null) AS T(c1);
 10   Spark
 20   Spark
 NULL Spark

> SELECT explode(c1) AS elem, 'Spark' FROM VALUES(array(10, 20)), (null) AS T(c1);
 10 Spark
 20 Spark

适用于: 勾选“是” Databricks SQL 勾选“是” Databricks Runtime 12.2 LTS 及更高版本:

> SELECT elem, 'Spark' FROM explode(array(10, 20)) AS t(elem);
 10 Spark
 20 Spark

> SELECT num, val, 'Spark' FROM explode(map(1, 'a', 2, 'b')) AS t(num, val);
 1   a   Spark
 2   b   Spark

> SELECT * FROM explode(array(1, 2)), explode(array(3, 4));
 1   3
 1   4
 2   3
 2   4

-- Using lateral correlation in Databricks 12.2 and above
> SELECT * FROM explode(array(1, 2)) AS t, LATERAL explode(array(3 * t.col, 4 * t.col));
 1   3
 1   4
 2   6
 2   8