Condividi tramite


Creare uno schema

Questo articolo illustra come creare schemi nel Catalogo Unity e nel Metastore Hive Legacy.

Per informazioni sugli schemi in Azure Databricks, incluso un confronto tra il comportamento dello schema in Unity Catalog e il metastore Hive, vedere Che cosa sono gli schemi in Azure Databricks?.

Operazioni preliminari

Per creare uno schema nel catalogo unity:

  • È necessario disporre di un metastore del catalogo Unity collegato all'area di lavoro in cui si esegue la creazione dello schema.
  • È necessario disporre delle autorizzazioni per i dati USE CATALOG e CREATE SCHEMA nel catalogo padre dello schema. Un amministratore del metastore o il proprietario del catalogo può concederti tali privilegi. Se sei un amministratore del metastore, puoi concedere questi privilegi a te stesso.
  • Per specificare un percorso di archiviazione gestito facoltativo per le tabelle e i volumi nello schema, è necessario definire una posizione esterna in Unity Catalog e devi avere il privilegio CREATE MANAGED STORAGE sulla posizione esterna. Consultare Specificare una posizione di archiviazione gestita in Unity Catalog.
  • Il cluster che si utilizza per eseguire un notebook per creare uno schema deve usare una modalità di accesso conforme al Catalogo Unity. Vedere Modalità di accesso usata. I warehouse SQL supportano sempre il catalogo Unity.

Per creare uno schema nel metastore Hive:

Creare uno schema

Per creare uno schema nel catalogo Unity, è possibile usare Esplora cataloghi o comandi SQL. Per creare uno schema nel metastore Hive, è necessario usare i comandi SQL.

Esploratore di Cataloghi

  1. Accedere a un'area di lavoro collegata al metastore di Unity Catalog.
  2. Fare clic sull'icona CatalogoCatalogo.
  3. Nel riquadro catalogo a sinistra, fare clic sul catalogo in cui si vuole creare lo schema.
  4. Nel riquadro dei dettagli fare clic su Crea schema.
  5. Assegnare allo schema un nome e aggiungere qualsiasi commento che consenta agli utenti di comprendere lo scopo dello schema.
  6. (Facoltativo) Specificare un percorso di archiviazione gestito. Richiede il CREATE MANAGED STORAGE privilegio per la posizione esterna di destinazione. Consultare "Specificare un percorso di archiviazione gestito in Unity Catalog" e "posizioni gestite per gli schemi".
  7. Cliccare su Crea.
  8. Concedere privilegi allo schema. Consultare Gestire i privilegi in Unity Catalog.
  9. Fare clic su Salva.

SQL

  1. Eseguire i comandi SQL seguenti in un notebook o nell'editor di query SQL. Gli elementi tra parentesi sono facoltativi. Puoi usare entrambi SCHEMA o DATABASE. Sostituire i valori dei segnaposto:

    • <catalog-name>: nome del catalogo principale per lo schema. Se si sta creando uno schema nel metastore Hive e si è in un'area di lavoro abilitata per il Catalogo Unity, utilizzare hive_metastore come nome del catalogo. Se l'area di lavoro non è abilitata per Unity Catalog, non specificare alcun catalogo.
    • <schema-name>: nome dello schema.
    • <location-path>: percorso facoltativo di una posizione di archiviazione gestita. Usalo con MANAGED LOCATION per Unity Catalog e con LOCATION per il metastore Hive. In Unity Catalog è necessario avere il privilegio CREATE MANAGED STORAGE sulla posizione esterna del percorso specificato. Consultare Specificare un percorso di archiviazione gestito in Unity Catalog e Percorsi gestiti per gli schemi.
    • <comment>: Descrizione facoltativa o altro commento.
    • <property-key> = <property-value> [ , ... ]: facoltativo. Proprietà e valori di Spark SQL da impostare per lo schema.

    Per descrizioni più dettagliate dei parametri, vedere CREATE SCHEMA.

    CREATE { DATABASE | SCHEMA } [ IF NOT EXISTS ] <catalog-name>.<schema-name>
        [ MANAGED LOCATION '<location-path>' | LOCATION '<location-path>']
        [ COMMENT <comment> ]
        [ WITH DBPROPERTIES ( <property-key = property_value [ , ... ]> ) ];
    
  2. Concedere privilegi allo schema. Per i privilegi del Catalogo di Unity, vedere Gestione dei privilegi in Unity Catalog.

È anche possibile creare uno schema usando il provider Databricks Terraform e databricks_schema. È possibile recuperare un elenco di ID schema usando databricks_schemas

Passaggi successivi