共用方式為


函式

適用於: 核取記號為「是」 Databricks Runtime

Spark SQL 提供兩個函式功能,以滿足各種需求:內建函式和使用者定義函式 (UDF)。

若要瞭解函式解析和函式調用,請參閱: 函式調用

內建函式

本文提供匯總、陣列和對應、日期和時間戳,以及 JSON 數據的常用內建函式類別的使用方式和描述。

SQL 和 Python 使用者定義函式

SQL 和 Python 使用者定義函式 (UDF) 是您可以自行定義的函式,可以傳回純量值或結果集。

如需詳細資訊,請參閱 CREATE FUNCTION (SQL, Python)。

外部使用者定義函式

UDF 可讓您在系統內建函式不足以執行所需的工作時定義自己的函式。 若要使用 UDF,請先定義函式,然後使用 Spark 註冊函式,最後呼叫已註冊的函式。 UDF 可以在單一數據列上採取行動,也可以同時處理多個數據列。 Spark SQL 也支援整合 UDF 的現有 Hive 實作、使用者定義聚合函數 (UDAF),以及使用者定義數據表函數 (UDTF)。