Partager via


En quoi consistent les schémas dans Azure Databricks ?

Dans Unity Catalog, un schéma est un parent d'un catalogue et peut contenir des tables, des vues, des volumes, des modèles et des fonctions. Les schémas fournissent des catégories d'organisation des données plus granulaires que les catalogues.

Cet article décrit le rôle des schémas dans la hiérarchie des objets de données Azure Databricks dans Unity Catalog.

Pour plus d'informations sur les schémas dans le métastore Hive local de l'espace de travail hérité, consultez Objets de base de données dans le métastore Hive hérité.

Qu'est-ce qu'un schéma ?

Dans Unity Catalog, un schéma est le deuxième niveau de l'espace de noms à trois niveaux (catalog.schema.table-etc).

Diagramme du modèle objet Unity Catalog, centré sur le schéma

Un schéma organise les données et les ressources d'IA en catégories logiques plus granulaires que les catalogues. En règle générale, un schéma représente un seul cas d’utilisation, projet ou bac à sable d’équipe. Quel que soit le type de catégorie, les schémas sont un outil utile pour gérer l’Access Control aux données et améliorer la détection des données.

Remarque

Dans Azure Databricks, les schémas sont parfois appelés bases de données. Par exemple, CREATE DATABASE ajoute un alias pour CREATE SCHEMA. Cette terminologie diffère de celle de certains systèmes de bases de données relationnelles dans lesquels une base de données est un ensemble de schémas.

Pour plus d'informations sur la hiérarchie des objets de données dans Unity Catalog, consultez Qu'est-ce qu'un objet de base de données dans Azure Databricks ?.

Emplacements managés pour les schémas

Dans Unity Catalog, vous pouvez isoler physiquement les données de toutes les tables et volumes gérés d'un schéma de celles des autres schémas d'un catalogue en spécifiant un emplacement de stockage géré pour le schéma. Cette option est entièrement facultative. Si vous ne spécifiez pas d'emplacement de stockage géré pour le schéma, les données résident dans l'emplacement de stockage géré du catalogue (et si aucun n'est défini pour le catalogue, elles résident dans l'emplacement de stockage géré du métastore). Consultez Spécifier un emplacement de stockage managé dans Unity Catalog.

L'isolation des données pour les tables et les volumes externes dépend de la manière dont vous gérez les données dans votre stockage cloud. Il est indépendant de l’emplacement managé du schéma.

Étapes suivantes