Travailler avec des tables gérés
Azure Databricks gère le cycle de vie et la disposition des fichiers pour une tablemanagée. Les tables gérés sont le moyen par défaut de créer tables.
Databricks recommande d’utiliser des tables managés pour toutes les données tabulaires gérées dans Azure Databricks.
Remarque
Cet article se concentre sur Unity Catalog gérétables. Des tables gérés dans l'ancien metastore Hive ont des comportements différents. Consultez Objets de base de données dans le metastore Hive hérité.
Travailler avec des tables gérés
Vous pouvez utiliser des tables managés dans tous les langages et produits pris en charge dans Azure Databricks. Vous avez besoin de certains privilèges pour créer, update, supprimer ou interroger des tablesgérés. Consultez Gérer les privilèges dans Unity, Catalog.
Vous ne devez pas utiliser d’outils en dehors d’Azure Databricks pour manipuler des fichiers dans des tables managés directement.
Vous ne devriez interagir avec les fichiers de données que dans un table géré en utilisant le nom table.
Les fichiers de données pour les tables managés sont stockés dans l’emplacement de stockage managé associé au conteneur schema. Voir Spécifier un emplacement de stockage géré dans Unity Catalog.
Créer un table géré
Par défaut, chaque fois que vous créez un table à l’aide de commandes SQL, Spark ou d’autres outils dans Azure Databricks, le table est géré.
La syntaxe SQL suivante montre comment créer une table managée vide à l’aide de SQL. Remplacez le texte de substitution values:
<catalog-name>
: nom du catalog qui contiendra le table.<schema-name>
: nom du schema qui contiendra le table.<table-name>
: nom du table.<column-specification>
: nom et type de données pour chaque column.
CREATE TABLE <catalog-name>.<schema-name>.<table-name>
(
<column-specification>
);
De nombreux utilisateurs créent des tables managés à partir de résultats de requête ou d'opérations d'écriture de DataFrame. Les articles suivants illustrent certains des nombreux modèles que vous pouvez utiliser pour créer une table managée sur Azure Databricks :
- CREATE TABLE [USING]
- CREATE TABLE LIKE
- Créer ou modifier un table à l’aide du chargement de fichiers
Autorisations requises
Pour créer un tablemanagé, vous devez disposer des éléments suivants :
- Autorisation
USE SCHEMA
sur le schema parent de la table. - Autorisation
USE CATALOG
sur le catalog parent de la table. - Autorisation
CREATE TABLE
sur le schema parent de la table.
Supprimer un table géré
Vous devez être le propriétaire du tableou avoir le privilège MANAGE
sur le table pour supprimer une table. Pour supprimer un tablemanagé, exécutez la commande SQL suivante :
DROP TABLE IF EXISTS catalog_name.schema_name.table_name;
Lorsqu’un table managé est supprimé, ses données sous-jacentes sont supprimées de votre locataire cloud dans les 30 jours.