Dela via


Metodtips för serverlös beräkning

I den här artikeln får du rekommendationer om bästa praxis för att använda serverlös beräkning i dina notebook-filer och jobb.

Genom att följa dessa rekommendationer förbättrar du produktiviteten, kostnadseffektiviteten och tillförlitligheten för dina arbetsbelastningar i Azure Databricks.

Migrera arbetsbelastningar till serverlös beräkning

För att skydda isoleringen av användarkod använder serverlös beräkning Azure Databricks säkert läge för delad åtkomst. På grund av detta kräver vissa arbetsbelastningar kodändringar för att fortsätta arbeta med serverlös beräkning. En lista över funktioner som inte stöds finns i Serverlösa beräkningsbegränsningar.

Vissa arbetsbelastningar är enklare att migrera än andra. Arbetsbelastningar som uppfyller följande krav är enklast att migrera:

  • Data som används måste lagras i Unity Catalog.
  • Arbetsbelastningen ska vara kompatibel med beräkning av delat åtkomstläge.
  • Arbetsbelastningen ska vara kompatibel med Databricks Runtime 14.3 eller senare.

Om du vill testa om en arbetsbelastning fungerar med serverlös beräkning kör du den på en icke-serverlös beräkningsresurs med läget Delad åtkomst och en Databricks Runtime på 14.3 eller senare. Om körningen lyckas är arbetsbelastningen redo för migrering.

På grund av betydelsen av den här ändringen och den aktuella listan över begränsningar migreras inte många arbetsbelastningar sömlöst. I stället för att återskapa allt rekommenderar Azure Databricks att du prioriterar serverlös beräkningskompatibilitet när du skapar nya arbetsbelastningar.

Mata in data från externa system

Eftersom serverlös beräkning inte stöder JAR-filinstallation kan du inte använda en JDBC- eller ODBC-drivrutin för att mata in data från en extern datakälla.

Alternativa strategier som du kan använda för inmatning är:

Alternativ för inmatning

När du använder serverlös beräkning kan du också använda följande funktioner för att köra frågor mot dina data utan att flytta dem.

  • Om du vill begränsa dataduplicering eller garantera att du frågar efter nyaste möjliga data rekommenderar Databricks att du använder Deltadelning. Se Vad är deltadelning?.
  • Om du vill göra ad hoc-rapportering och proof-of-concept-arbete rekommenderar Databricks att du provar rätt val, vilket kan vara Lakehouse Federation. Lakehouse Federation möjliggör synkronisering av hela databaser till Azure Databricks från externa system och styrs av Unity Catalog. Se Vad är Lakehouse Federation?.

Prova en eller båda av dessa funktioner och se om de uppfyller dina krav på frågeprestanda.

Övervaka kostnaden för serverlös beräkning

Det finns flera funktioner som du kan använda för att övervaka kostnaden för serverlös beräkning: