Udostępnij za pośrednictwem


Funkcje

Dotyczy: zaznacz pole wyboru oznaczone jako tak Databricks Runtime

Usługa Spark SQL udostępnia dwie funkcje spełniające szeroką gamę potrzeb: wbudowane funkcje i funkcje zdefiniowane przez użytkownika (UDF).

Aby dowiedzieć się więcej na temat rozpoznawania funkcji i wywołania funkcji, zobacz: Wywołanie funkcji.

Funkcje wbudowane

W tym artykule przedstawiono użycie i opisy kategorii często używanych wbudowanych funkcji agregacji, tablic i map, dat i sygnatur czasowych oraz danych JSON.

Funkcje zdefiniowane przez użytkownika w języku SQL i Python

Funkcje zdefiniowane przez użytkownika (UDF) i SQL i Python to funkcje, które można zdefiniować samodzielnie, które mogą zwracać wartości skalarne lub zestawy wyników.

Aby uzyskać więcej informacji, zobacz CREATE FUNCTION (SQL, Python).

Funkcje zdefiniowane przez użytkownika zewnętrznego

Funkcje zdefiniowane przez użytkownika umożliwiają definiowanie własnych funkcji, gdy wbudowane funkcje systemu nie są wystarczające do wykonania żądanego zadania. Aby użyć funkcji zdefiniowanych przez użytkownika, należy najpierw zdefiniować funkcję, a następnie zarejestrować funkcję za pomocą platformy Spark, a następnie wywołać zarejestrowaną funkcję. Funkcja UDF może działać w jednym wierszu lub działać na wielu wierszach jednocześnie. Usługa Spark SQL obsługuje również integrację istniejących implementacji programu Hive funkcji zdefiniowanych przez użytkownika, funkcji agregujących zdefiniowanych przez użytkownika (UDAF) i funkcji tabeli zdefiniowanych przez użytkownika (UDTF).