Condividi tramite


CREATE SCHEMA

Si applica a:segno di spunta sì Databricks SQL segno di spunta sì Databricks Runtime

Crea uno schema (database) con il nome specificato. Se esiste già uno schema con lo stesso nome, viene generata un'eccezione.

Sintassi

CREATE SCHEMA [ IF NOT EXISTS ] schema_name
    [ COMMENT schema_comment |
     { LOCATION schema_directory | MANAGED LOCATION location_path } |
     WITH DBPROPERTIES ( { property_name = property_value } [ , ... ] ) ] [...]

Parametri

  • schema_name

    Nome dello schema da creare.

    Gli schemi creati nel catalogo hive_metastore possono contenere solo caratteri ASCII alfanumerici e caratteri di sottolineatura (INVALID_SCHEMA_OR_RELATION_NAME).

  • SE NON ESISTE

    Crea uno schema con il nome specificato, se non esiste. Se esiste già uno schema con lo stesso nome, non verrà eseguita alcuna operazione.

  • POSIZIONE schema_directory

    LOCATION non è supportato nel catalogo unity. Se si vuole specificare un percorso di archiviazione per uno schema nel catalogo unity, usare MANAGED LOCATION.

    schema_directory è un valore letterale STRING. Percorso del file system in cui deve essere creato lo schema specificato. Se il percorso specificato non esiste nel file system sottostante, crea una directory con il percorso. Se la posizione non viene specificata, lo schema viene creato nella directory del magazzino predefinita, il cui percorso è configurato dalla configurazione statica spark.sql.warehouse.dir.

    Avviso

    Se uno schema (database) viene registrato nel metastore Hive a livello di area di lavoro, eliminando tale schema usando l'opzione CASCADE tutti i file in tale percorso dello schema verranno eliminati in modo ricorsivo, indipendentemente dal tipo di tabella (gestito o esterno).

    Se lo schema viene registrato in un metastore del catalogo Unity, i file per Unity Catalog tabelle gestite vengono eliminati in modo ricorsivo. Tuttavia, i file relativi a tabelle esterne non vengono eliminati. È necessario gestire questi file usando direttamente il provider di archiviazione cloud.

    Pertanto, per evitare perdite accidentali di dati, è consigliabile non registrare mai uno schema in un metastore Hive in una posizione con dati esistenti. Né è consigliabile creare nuove tabelle esterne in una posizione gestita dagli schemi del metastore Hive o contenere tabelle gestite dal catalogo Unity.

  • COMMENTo schema_comment

    Un valore STRING letterale. Descrizione dello schema.

  • POSIZIONE GESTITA location_path

    MANAGED LOCATION è facoltativo e richiede il catalogo Unity. Se desideri specificare un percorso di archiviazione per uno schema registrato nel metastore a livello di workspace in Hive o di terze parti, utilizza invece LOCATION.

    location_path deve essere un valore STRING letterale. Specifica il percorso verso una radice di archiviazione per lo schema, che è diverso dalla radice di archiviazione del catalogo o del metastore. Questo percorso deve essere definito in una configurazione della posizione esterna ed è necessario avere il privilegio CREATE MANAGED STORAGE per la configurazione della posizione esterna. È possibile usare il percorso definito nella configurazione della posizione esterna o un sottopercorso (in altre parole, 'abfss://container@storageaccount.dfs.core.windows.net/finance' o 'abfss://container@storageaccount.dfs.core.windows.net/finance/product'). Supportato in Databricks SQL o nei cluster che eseguono Databricks Runtime 11.3 LTS e versioni successive.

    Vedi anche Usare tabelle gestite e Creare un metastore del catalogo Unity.

  • WITH DBPROPERTIES ( { property_name = property_value } [ , ... ] )

    Proprietà dello schema nelle coppie chiave-valore.

  • OPTIONS

    Imposta i parametri specifici del tipo di connessione necessari per identificare il catalogo nella connessione.

    • option

      La chiave dell'opzione. La chiave può essere costituita da uno o più identificatori separati da un punto o da un valore letterale STRING.

      Le chiavi di opzione devono essere univoche e fanno distinzione tra maiuscole e minuscole.

    • value

      Valore per l'opzione. Il valore deve essere un'espressione costante BOOLEAN, STRING, INTEGER o DECIMAL. Il valore può anche essere una chiamata alla funzione SQL SECRET. Ad esempio, l'oggetto value per password può includere secret('secrets.r.us', 'postgresPassword') anziché immettere la password letterale.

Esempi

  -- Create schema `customer_sc`. This throws exception if schema with name customer_sc
-- already exists.
> CREATE SCHEMA customer_sc;

-- Create schema `customer_sc` only if schema with same name doesn't exist.
> CREATE SCHEMA IF NOT EXISTS customer_sc;

-- Create schema `customer_sc` only if schema with same name doesn't exist with
-- `Comments`,`Specific Location` and `Database properties`. LOCATION is not supported in Unity Catalog.
> CREATE SCHEMA IF NOT EXISTS customer_sc COMMENT 'This is customer schema' LOCATION '/samplepath'
    WITH DBPROPERTIES (ID=001, Name='John');

-- Create schema with a different managed storage location than the metastore's. MANAGED LOCATION is supported only in Unity Catalog.
> CREATE SCHEMA customer_sc MANAGED LOCATION 'abfss://container@storageaccount.dfs.core.windows.net/finance';

-- Verify that properties are set.
> DESCRIBE SCHEMA EXTENDED customer_sc;
database_description_item database_description_value
------------------------- --------------------------
            Database Name                customer_sc
              Description  This is customer schema
                  Location      hdfs://hacluster/samplepath
                Properties    ((ID,001), (Name,John))