Vad är Azure Databricks Clean Rooms?
Viktigt!
Den här funktionen finns som allmänt tillgänglig förhandsversion.
Den här artikeln introducerar Clean Rooms, en Azure Databricks-funktion som använder deltadelning och serverlös beräkning för att tillhandahålla en säker och sekretessskyddande miljö där flera parter kan arbeta tillsammans med känsliga företagsdata utan direkt åtkomst till varandras data.
Krav
För att kunna använda rena rum måste du:
- Ha ett konto som är aktiverat för serverlös beräkning. Se Aktivera serverlös beräkning.
- Ha en arbetsyta som är aktiverad för Unity Catalog. Se Aktivera en arbetsyta för Unity Catalog.
Hur fungerar Clean Rooms?
När du skapar ett rent rum skapar du följande:
- Ett skyddsbart objekt i unity-katalogens metaarkiv.
- Det "centrala" rena rummet, som är en isolerad tillfällig miljö som hanteras av Databricks.
- Ett skyddsbart objekt för rent rum i medarbetarens Unity Catalog-metaarkiv.
Tabeller, volymer (icketabelldata), vyer och anteckningsbokfiler som någon av samarbetspartnerna delar i den rena miljön delas endast med den centrala rena miljön, med Delta Sharing.
Medarbetare kan inte se data i andra medarbetares tabeller, vyer eller volymer, men de kan se kolumnnamn och kolumntyper, och de kan köra godkänd notebook-kod som körs över datatillgångarna. Notebook-koden körs i det centrala renrummet. Notebook-filer kan också generera utdatatabeller som gör att din medarbetare tillfälligt kan spara skrivskyddade utdata i unity catalog-metaarkivet så att de kan arbeta med dem på sina arbetsytor.
Hur säkerställer Clean Rooms en miljö utan förtroende?
Databricks Clean Rooms-modellen är "no-trust". Alla medarbetare i ett rent rum utan förtroende har lika privilegier, inklusive skaparen av det rena rummet. Clean Rooms är utformat för att förhindra körning av obehörig kod och obehörig delning av data. Alla medarbetare måste till exempel godkänna en notebook-fil innan den kan köras. Det här förtroendet framtvingas implicit genom att hindra en medarbetare från att köra alla notebook-filer som de själva har skapat: du kan bara köra en notebook-fil som skapats av den andra medarbetaren.
Ytterligare skyddsåtgärder eller begränsningar
Följande skyddsåtgärder finns utöver den implicita processen för godkännande av notebook-filer som nämns ovan:
När ett rent rum har skapats är det låst för att förhindra att nya medarbetare ansluter till det rena rummet.
Om någon medarbetare tar bort det rena rummet är det centrala rena rummet tomt och inga uppgifter om rent rum kan köras av någon användare.
Under den offentliga förhandsversionen är varje rent rum begränsat till två medarbetare.
Du kan inte byta namn på det rena rummet.
Det rena rummets namn måste vara unikt i varje medarbetares metaarkiv, så att alla medarbetare kan referera till samma rena rum otvetydigt.
Kommentarer om det rena rummet som kan skyddas på varje medarbetares arbetsyta sprids inte till andra medarbetare.
Vad delas med andra medarbetare?
- Rent rumsnamn.
- Molnet och regionen i det centrala rena rummet.
- Ditt organisationsnamn (som kan vara valfritt namn).
- Din identifierare för delning av rent rum (globalt metaarkiv-ID + arbetsyte-ID + användarens e-postadress).
- Alias för delade tabeller, vyer eller volymer.
- Kolumnmetadata (kolumnnamn eller alias och typ).
- Notebook-filer (skrivskyddade).
- Utdatatabeller (skrivskyddade, tillfälliga).
- Systemtabell för rena rumshändelser.
- Körningshistorik, inklusive:
- Namnet på anteckningsboken som körs
- Medarbetare som körde anteckningsboken (inte användaren).
- Tillståndet för notebook-körningen.
- Starttiden för notebook-körningen.
Vad delas med det centrala rena rummet?
Allt som visas i föregående avsnitt.
Skrivskyddade tabeller, volymer, vyer och notebook-filer.
Tabeller, vyer och volymer registreras i det centrala renrummets metaarkiv med eventuella angivna alias. Datatillgångar delas under hela livscykeln för det rena rummet.
Begränsningar
Under den offentliga förhandsversionen gäller följande begränsningar:
- Inga Scala-bibliotek för tjänstautentiseringsuppgifter ingår i den nödvändiga Databricks Runtime-versionen.
Resurskvoter
Azure Databricks tillämpar resurskvoter för alla objekt som kan skyddas av Clean Room. Dessa kvoter visas i Resursgränser. Om du förväntar dig att överskrida dessa resursgränser kontaktar du ditt Azure Databricks-kontoteam.
Du kan övervaka din kvotanvändning med hjälp av API:erna för Enhetskatalogens resurskvoter. Se Övervaka din användning av Unity Catalog-resurskvoter.