Funkcje
Dotyczy: Databricks Runtime
Usługa Spark SQL udostępnia dwie funkcje spełniające szeroką gamę potrzeb: wbudowane funkcje i funkcje zdefiniowane przez użytkownika (UDF).
Aby dowiedzieć się więcej na temat rozpoznawania funkcji i wywołania funkcji, zobacz: Wywołanie funkcji.
Funkcje wbudowane
W tym artykule przedstawiono użycie i opisy kategorii często używanych wbudowanych funkcji agregacji, tablic i map, dat i sygnatur czasowych oraz danych JSON.
Funkcje zdefiniowane przez użytkownika w języku SQL i Python
Funkcje zdefiniowane przez użytkownika (UDF) w SQL i Pythonie to funkcje, które można zdefiniować samodzielnie i które mogą zwracać wartości skalarne lub zestawy wyników.
Aby uzyskać więcej informacji, zobacz CREATE FUNCTION (SQL, Python).
Funkcje zdefiniowane przez użytkownika zewnętrznego
Funkcje zdefiniowane przez użytkownika umożliwiają definiowanie własnych funkcji, gdy wbudowane funkcje systemu nie są wystarczające do wykonania żądanego zadania. Aby użyć funkcji zdefiniowanych przez użytkownika, należy najpierw zdefiniować funkcję, a następnie zarejestrować funkcję za pomocą platformy Spark, a następnie wywołać zarejestrowaną funkcję. Funkcja UDF może działać w jednym wierszu lub działać na wielu wierszach jednocześnie. Spark SQL obsługuje także integrację istniejących implementacji Hive funkcji definiowanych przez użytkownika, funkcji agregujących definiowanych przez użytkownika (UDAF) oraz funkcji tabeli definiowanych przez użytkownika (UDTF).