Delen via


Wat is Azure Databricks Clean Rooms?

Belangrijk

Deze functie is beschikbaar als openbare preview.

In dit artikel maakt u kennis met Clean Rooms, een Azure Databricks-functie die gebruikmaakt van Delta Sharing en serverloze berekeningen om een veilige en privacybeveiligde omgeving te bieden waarin meerdere partijen kunnen samenwerken aan gevoelige bedrijfsgegevens zonder directe toegang tot elkaars gegevens.

Vereisten

Als u in aanmerking wilt komen voor het gebruik van schone ruimten, moet u het volgende doen:

Hoe werkt Clean Rooms?

Wanneer u een schone ruimte maakt, maakt u het volgende:

  • Een beveiligbaar clean room-object in uw Unity Catalog-metastore.
  • De 'centrale' schone ruimte, een geïsoleerde kortstondige omgeving die wordt beheerd door Databricks.
  • Een beveiligbaar clean room-object in de Unity Catalog-metastore van uw samenwerker.

Tabellen, volumes (niet-tabellaire gegevens), weergaven en notitieblokken die medewerkers in de clean room delen, worden alleen met de centrale clean room gedeeld, met behulp van Delta Sharing.

Samenwerkers kunnen de gegevens niet zien in de tabellen, weergaven of volumes van andere medewerkers, maar ze kunnen kolomnamen en kolomtypen zien en ze kunnen goedgekeurde notebookcode uitvoeren die via de gegevensassets werkt. De notebookcode wordt uitgevoerd in de centrale clean room. Notebooks kunnen ook uitvoertabellen genereren waarmee uw samenwerker tijdelijk alleen-lezenuitvoer kan opslaan in hun Unity Catalog-metastore, zodat ze ermee kunnen werken in hun werkruimten.

Schone ruimten eenvoudige architectuur en stroom, met uitvoertabellen

Hoe zorgt Clean Rooms voor een omgeving zonder vertrouwen?

Het Databricks Clean Rooms-model is 'geen vertrouwen'. Alle medewerkers in een no-trust clean room hebben gelijke bevoegdheden, waaronder de maker van de schone kamer. Clean Rooms is ontworpen om te voorkomen dat niet-geautoriseerde code en het niet-geautoriseerd delen van gegevens worden voorkomen. Alle medewerkers moeten bijvoorbeeld een notitieblok goedkeuren voordat het kan worden uitgevoerd. Deze vertrouwensrelatie wordt impliciet afgedwongen door te voorkomen dat een samenwerker een notitieblok uitvoert dat ze zelf hebben gemaakt: u kunt alleen een notitieblok uitvoeren dat is gemaakt door de andere samenwerker.

Aanvullende beveiliging of beperkingen

Naast het hierboven genoemde impliciete goedkeuringsproces voor notebooks zijn de volgende beveiligingsmaatregelen aanwezig:

  • Nadat een schone ruimte is gemaakt, wordt deze vergrendeld om te voorkomen dat nieuwe medewerkers lid worden van de schone ruimte.

  • Als een medewerker de schone kamer verwijdert, is de centrale schone ruimte leeg en kunnen geen clean room-taken door elke gebruiker worden uitgevoerd.

  • Tijdens de openbare preview is elke schone kamer beperkt tot twee medewerkers.

  • U kunt de naam van de schone kamer niet wijzigen.

    De naam van de clean room moet uniek zijn in de metastore van elke samenwerker, zodat alle medewerkers ondubbelzinnig naar dezelfde schone ruimte kunnen verwijzen.

  • Opmerkingen over de schone ruimte die kunnen worden beveiligd in de werkruimte van elke samenwerker, worden niet doorgegeven aan andere medewerkers.

Wat wordt er gedeeld met andere medewerkers?

  • Schone kamernaam.
  • Cloud en regio van de centrale schone kamer.
  • De naam van uw organisatie (dit kan elke gewenste naam zijn).
  • De id voor het delen van een schone ruimte (globale metastore-id + werkruimte-id + e-mailadres van de gebruiker).
  • Aliassen van gedeelde tabellen, weergaven of volumes.
  • Kolommetagegevens (kolomnaam of alias en type).
  • Notitieblokken (alleen-lezen).
  • Uitvoertabellen (alleen-lezen, tijdelijk).
  • Systeemtabel clean room events.
  • Uitvoeringsgeschiedenis, waaronder:
    • De naam van het notebook dat wordt uitgevoerd
    • Samenwerker die het notebook heeft uitgevoerd (geen gebruiker).
    • De status van het notebook wordt uitgevoerd.
    • De begintijd van de notebookuitvoering.

Wat wordt gedeeld met de centrale schone kamer?

  • Alles wat in de vorige sectie wordt vermeld.

  • Alleen-lezen tabellen, volumes, weergaven en notebooks.

    Tabellen, weergaven en volumes worden geregistreerd in de metastore van de centrale clean room met eventuele opgegeven aliassen. Gegevensbronnen worden gedurende de hele levenscyclus van de cleanroom gedeeld.

Beperkingen

Tijdens de openbare preview gelden de volgende beperkingen:

  • Er zijn geen Scala-bibliotheken met servicereferenties opgenomen in de vereiste Databricks Runtime-versie.

Resourcequota

Azure Databricks dwingt resourcequota af voor alle clean room beveiligbare objecten. Deze quota worden vermeld in resourcelimieten. Als u verwacht deze resourcelimieten te overschrijden, neemt u contact op met uw Azure Databricks-accountteam.

U kunt uw quotumgebruik bewaken met behulp van de quota-API's voor Unity Catalog-resources. Zie Monitor your usage of Unity Catalog resource quotas.

Aan de slag