Wat zijn schema's in Azure Databricks?
In Unity Catalogis een schema een onderliggend element van een catalog en kan tables, views, volumes, modellen en functies bevatten. Schema's bieden meer gedetailleerde categorieën gegevensorganisatie dan catalogs.
In dit artikel wordt de rol van schema's in de Azure Databricks-gegevensobjecthiërarchie in Unity Catalogbeschreven.
Zie Databaseobjecten in de verouderde Hive-metastore in de verouderde Hive-metastore voor informatie over schema's in de verouderde Hive-metastore.
Wat is een schema?
In Unity Catalogis een schema het tweede niveau van de naamruimte van Unity Catalog(catalog.schema.table-etc
).
Een schema organiseert gegevens en AI-assets in logische categorieën die gedetailleerder zijn dan catalogs. Doorgaans vertegenwoordigt een schema één gebruikssituatie, project of teamsandbox. Ongeacht het categorietype zijn schema's een handig hulpmiddel voor het beheren van gegevenstoegangsbeheer en het verbeteren van de zichtbaarheid van gegevens.
Notitie
In Azure Databricks worden schema's ook wel databases genoemd. Is bijvoorbeeld CREATE DATABASE
een alias voor CREATE SCHEMA
. Deze terminologie verschilt van die van sommige relationele databasesystemen waarin een database een verzameling schema's is.
Beheerde locaties voor schema's
In Unity Catalog kunt u de gegevens fysiek isoleren voor alle beheerde tables en beheerde volumes in een schema van die van andere schema's in een catalog door een beheerde opslaglocatie op te geven voor de schema. Dit is geheel optioneel. Als u geen beheerde opslaglocatie opgeeft voor de schema, bevinden de gegevens zich in de beheerde opslaglocatie van de catalog(en als er geen is gedefinieerd voor de catalog, bevindt deze zich in de beheerde opslaglocatie van de metastore). Zie Een beheerde opslaglocatie opgeven in Unity Catalog.
Gegevensisolatie voor externe tables en volumes is afhankelijk van hoe u de gegevens in uw cloudopslag beheert. Het is onafhankelijk van de beheerde locatie van de schema.