共用方式為


函式

適用於:核取記號為「是」 Databricks Runtime

Spark SQL 提供兩個函式功能,以滿足各種需求:內建函式和使用者定義函式 (UDF)。

若要瞭解函式解析和函式調用,請參閱: 函式調用

內建函式

本文提供匯總、陣列和對應、日期和時間戳,以及 JSON 數據的常用內建函式類別的使用方式和描述。

SQL 和 Python 使用者定義函式

SQL 和 Python 使用者定義函數 (UDF) 是您可以自行定義的函式,可以傳回純量 values 或結果集。

如需詳細資訊,請參閱 CREATE FUNCTION (SQL, Python)

外部使用者定義函式

UDF 可讓您在系統內建函式不足以執行所需的工作時定義自己的函式。 若要使用 UDF,請先定義函式,然後使用 Spark 註冊函式,最後呼叫已註冊的函式。 UDF 可以在單一數據列上採取行動,也可以同時處理多個數據列。 Spark SQL 也支援整合 UDF 的現有 Hive 實作、使用者定義聚合函數 (UDAF),以及使用者定義 table 函數 (UDTF)。