函式
適用於: Databricks Runtime
Spark SQL 提供兩個函式功能,以滿足各種需求:內建函式和使用者定義函式 (UDF)。
若要瞭解函式解析和函式調用,請參閱: 函式調用。
內建函式
本文提供匯總、陣列和對應、日期和時間戳,以及 JSON 數據的常用內建函式類別的使用方式和描述。
SQL 和 Python 使用者定義函式
SQL 和 Python 使用者定義函式 (UDF) 是您可以自行定義的函式,可以傳回純量值或結果集。
如需詳細資訊,請參閱 CREATE FUNCTION (SQL, Python)。
外部使用者定義函式
UDF 可讓您在系統內建函式不足以執行所需的工作時定義自己的函式。 若要使用 UDF,請先定義函式,然後使用 Spark 註冊函式,最後呼叫已註冊的函式。 UDF 可以在單一數據列上採取行動,也可以同時處理多個數據列。 Spark SQL 也支援整合 UDF 的現有 Hive 實作、使用者定義聚合函數 (UDAF),以及使用者定義數據表函數 (UDTF)。