Dela via


Hanterad vs extern volumes

I den här artikeln beskrivs skillnaderna mellan hanterade volumes och externa volumes och varför du kan välja att använda externa volumes. Databricks rekommenderar administrerade volumes som en enklaste lösningen för lagring och åtkomsthantering av icke-tabelldata.

Mer information om hur du använder Unity Catalog för att konfigurera åtkomst till molnobjektlagring finns i Ansluta till molnobjektlagring och -tjänster med Unity Catalog.

Beteendeskillnader mellan administrerade och externa volumes

Hanterade och externa volumes ger nästan identiska upplevelser när du använder Azure Databricks-verktyg, UIs och API:er. Följande är skillnaderna mellan dessa volymtyper.

volumes Managed ger en fullständigt hanterad lagringsupplevelse. Detta innebär följande:

  • Alla filinteraktioner inom det hanterade volumes måste ske genom Unity Catalog.
  • Katalognamngivning och datalayout hanteras av Unity Catalog. Katalognamn innehåller hashvärden för att undvika konflikter i underliggande lagringskonton för molnobjekt.
  • När du släpper en hanterad volym tar Azure Databricks bort underliggande data inom 30 dagar.

Externa volumes tar med datastyrning till molnobjektlagring. Detta innebär följande:

  • Du kan använda moln-URI:er i Azure Databricks eller externa system för att interagera med filer i externa volumes.
  • Alla kataloger som skapats i en extern volym eller filer som laddats upp är i förhållande till de som angavs när de LOCATION skapades.
  • När du släpper en extern volym remove du volymen från Unity Catalog men underliggande data förblir oförändrade på den externa platsen.

Varför använda externa volumes?

Med externa volumes kan du lägga till Unity Catalog datastyrning till befintliga lagringskataloger för molnobjekt. Vissa användningsfall för externa volumes inkluderar följande:

  • Lägga till styrning till datafiler utan migrering.
  • Styr filer som skapats av andra system som måste matas in eller nås av Azure Databricks.
  • Styra data som produceras av Azure Databricks som måste nås direkt från molnobjektlagring av andra system.

Databricks rekommenderar att du använder externa volumes för att lagra icke-tabellbaserade datafiler som läs- eller skrivs av externa system utöver Azure Databricks. Unity-Catalog styr inte läsningar och skrivningar som utförs direkt mot molnobjektlagring från externa system, så du måste konfigurera ytterligare principer och credentials i ditt molnkonto för att säkerställa att datastyrningsprinciper respekteras utanför Azure Databricks.