Datastyrning med Unity Catalog
Den här guiden visar hur du hanterar data- och AI-objektåtkomst i Azure Databricks. Information om Azure Databricks-säkerhet finns i säkerhetsguiden. Azure Databricks tillhandahåller centraliserad styrning för data och AI med Unity Catalog och Delta Sharing.
Centralisera åtkomstkontroll med hjälp av Unity Catalog
Unity Catalog är en detaljerad styrningslösning för data och AI på Databricks-plattformen. Det förenklar säkerheten och styrningen av dina data och AI-tillgångar genom att tillhandahålla en central plats för att administrera och granska åtkomst till data och AI-tillgångar.
I de flesta konton är Unity Catalog aktiverat som standard när du skapar en arbetsyta. Mer information finns i Automatisk aktivering av Unity Catalog.
En diskussion om hur du använder Unity Catalog på ett effektivt sätt finns i Metodtips för Unity Catalog.
Spåra data härstamning med Hjälp av Unity Catalog
Du kan använda Unity Catalog för att samla in körningsdata härstamning mellan frågor på valfritt språk som körs i ett Azure Databricks-kluster eller SQL-lager. Ursprunget avbildas ned till kolumnnivån och innehåller notebook-filer, jobb och instrumentpaneler relaterade till frågan. Mer information finns i Avbilda och visa data härstamning med hjälp av Unity Catalog.
Identifiera data med Hjälp av Catalog Explorer
Databricks Catalog Explorer tillhandahåller ett användargränssnitt för att utforska och hantera data och AI-tillgångar, inklusive scheman (databaser), tabeller, volymer (icke-tabelldata) och registrerade ML-modeller, tillsammans med tillgångsbehörigheter, dataägare, externa platser och autentiseringsuppgifter. Du kan använda fliken Insikter i Katalogutforskaren för att visa de vanligaste frågorna och användarna i en tabell som är registrerad i Unity Catalog.
Dela data med deltadelning
Deltadelning är ett öppet protokoll som utvecklats av Databricks för säker data- och AI-tillgångsdelning med andra organisationer, eller med andra team i din organisation, oavsett vilka beräkningsplattformar de använder.
Konfigurera granskningsloggning
Databricks ger åtkomst till granskningsloggar för aktiviteter som utförs av Databricks-användare, så att ditt företag kan övervaka detaljerade Databricks-användningsmönster.
Med Unity Catalog kan du enkelt komma åt och fråga efter ditt kontos driftdata, inklusive granskningsloggar, fakturerbar användning och ursprung med hjälp av systemtabeller (offentlig förhandsversion).
Konfigurera identitet
Alla bra datastyrningsberättelser börjar med en stark identitetsgrund. Information om hur du bäst konfigurerar identiteter i Azure Databricks finns i Metodtips för identiteter.
Äldre datastyrningslösningar
Azure Databricks tillhandahåller även följande äldre styrningsmodeller:
- Tabellåtkomstkontroll är en äldre datastyrningsmodell som gör att du programmatiskt kan bevilja och återkalla åtkomst till objekt som hanteras av arbetsytans inbyggda Hive-metaarkiv. Databricks rekommenderar att du använder Unity Catalog i stället för tabellåtkomstkontroll. Unity Catalog förenklar säkerheten och styrningen av dina data genom att tillhandahålla en central plats för att administrera och granska dataåtkomst över flera arbetsytor i ditt konto.
- Genomströmning av autentiseringsuppgifter för Azure Data Lake Storage (äldre) är också en äldre datastyrningsfunktion som gör att du kan autentisera automatiskt till Azure Storage från Azure Databricks-kluster med samma Microsoft Entra-ID-identitet som du använder för att logga in på Azure Databricks. Databricks rekommenderar att du använder Unity Catalog i stället.