Dela via


Funktionsarkiv för arbetsyta (äldre)

Kommentar

Den här dokumentationen täcker funktionslagret för arbetsytor. Funktionsarkiv för arbetsytor är endast tillgängligt för arbetsytor som skapats före 19 augusti 2024, 16:00:00 (UTC).

Databricks rekommenderar att du använder Feature Engineering i Unity Catalog. Funktion Store för arbetsytor kommer att fasas ut i framtiden.

Varför använda Workspace Feature Store?

Funktionsarkivet för arbetsytor är helt integrerat med andra komponenter i Azure Databricks.

  • Upptäckbarhet. Med funktionsarkivets användargränssnitt, som är tillgängligt från Databricks-arbetsytan, kan du bläddra och söka efter befintliga funktioner.
  • Härstamning. När du skapar funktionen table i Azure Databricks, sparas de datakällor som används för att skapa funktionen table och är tillgängliga. För varje egenskap i en egenskap tablekan du också få tillgång till de modeller, anteckningsböcker, uppgifter och slutpunkter som använder egenskapen.
  • Integrering med bedömning och servering av modeller. När du använder funktioner från Funktionsarkiv för att träna en modell paketeras modellen med funktionsmetadata. När du använder modellen för batchbedömning eller online-slutsatsdragning hämtar den automatiskt funktioner från Funktionsarkiv. Anroparen behöver inte känna till dem eller inkludera logik för att söka efter eller join funktioner för att poängsätta nya data. Detta gör modelldistribution och uppdateringar mycket enklare.
  • Punkt-i-tid-sökningar. Funktionsarkivet stöder tidsserier och händelsebaserade användningsfall som kräver rätt tidpunkt.

Hur fungerar Workspace Feature Store?

Det typiska arbetsflödet för maskininlärning med funktionsarkivet följer den här vägen:

  1. Skriv kod för att konvertera rådata till funktioner och skapa en Spark DataFrame som innehåller önskade funktioner.
  2. Skriv dataramen som en funktion table i arbetsytans funktionslager.
  3. Träna en modell med hjälp av funktioner från funktionsarkivet. När du gör detta lagrar modellen specifikationerna för funktioner som används för träning. När modellen används för slutsatsdragning ansluter den automatiskt funktioner från lämplig funktion tables.
  4. Registrera modellen i modellregistret.

Nu kan du använda modellen för att göra förutsägelser om nya data. För batchanvändningsfall hämtar modellen automatiskt de funktioner den behöver från Funktionsarkivet.

Funktionslagerarbetsflöde för användningsfall för batchmaskininlärning.

Publicera funktionerna i en onlinebutik för användning i realtid. Se Onlinebutiker från tredje part.

Vid slutsatsdragningen läser modellen förberäknade funktioner från onlinebutiken och kopplar dem till de data som anges i klientbegäran till modellen som betjänar slutpunkten.

Funktionslagerflöde för maskininlärningsmodeller som hanteras.

Börja använda Workspace Feature Store

Börja med att prova de här exempelanteckningsböckerna för att get. Den grundläggande notebook-filen beskriver hur du skapar en funktion table, använder den för att träna en modell och utför sedan batchbedömning med hjälp av automatisk funktionssökning. Den introducerar även användargränssnittet för funktionsutveckling och visar hur du kan använda det för att söka efter funktioner och förstå hur funktioner skapas och används.

Exempelanteckningsbok för Basic Workspace Feature Store

Get anteckningsbok

Taxi-exempelanteckningsboken illustrerar processen med att skapa funktioner, uppdatera dem och använda dem för modellträning och batchinferens.

Arbetsyta Funktion Store taxi exempel notebook

Get anteckningsbok

Datatyper som stöds

Information om datatyper som stöds finns i Datatyper som stöds.