Funktioner
Gäller för: Databricks Runtime
Spark SQL tillhandahåller två funktionsfunktioner för att uppfylla en mängd olika behov: inbyggda funktioner och användardefinierade funktioner (UDF:er).
Information om funktionsupplösning och funktionsanrop finns i: Funktionsanrop.
Inbyggda funktioner
Den här artikeln beskriver användning och beskrivningar av kategorier av inbyggda funktioner som används ofta för aggregering, matriser och kartor, datum och tidsstämplar samt JSON-data.
Användardefinierade sql- och Python-funktioner
SQL- och Python-användardefinierade funktioner (UDF: er) är funktioner som du kan definiera själv som kan returnera skalär values eller resultatuppsättningar.
Mer information finns i CREATE FUNCTION (SQL, Python).
Externa användardefinierade funktioner
Med UDF:er kan du definiera dina egna funktioner när systemets inbyggda funktioner inte räcker för att utföra önskad uppgift. Om du vill använda UDF:er definierar du först funktionen, registrerar sedan funktionen med Spark och anropar slutligen den registrerade funktionen. En UDF kan agera på en enskild rad eller agera på flera rader samtidigt. Spark SQL stöder också integrering av befintliga Hive-implementeringar av UDF:er, användardefinierade aggregeringsfunktioner (UDAF) och användardefinierade table funktioner (UDTF).