CREATE TABLE s formátem Hive

Článek
01/22/2025

Platí pro: zaškrtnutí označeného ano Databricks Runtime

Definuje table pomocí formátu Hive.

Syntaxe

CREATE [ EXTERNAL ] TABLE [ IF NOT EXISTS ] table_identifier
    [ ( col_name1[:] col_type1 [ COMMENT col_comment1 ], ... ) ]
    [ COMMENT table_comment ]
    [ PARTITIONED BY ( col_name2[:] col_type2 [ COMMENT col_comment2 ], ... )
        | ( col_name1, col_name2, ... ) ]
    [ ROW FORMAT row_format ]
    [ STORED AS file_format ]
    [ LOCATION path ]
    [ TBLPROPERTIES ( key1=val1, key2=val2, ... ) ]
    [ AS select_statement ]

row_format:
    : SERDE serde_class [ WITH SERDEPROPERTIES (k1=v1, k2=v2, ... ) ]
    | DELIMITED [ FIELDS TERMINATED BY fields_terminated_char [ ESCAPED BY escaped_char ] ]
        [ COLLECTION ITEMS TERMINATED BY collection_items_terminated_char ]
        [ MAP KEYS TERMINATED BY map_key_terminated_char ]
        [ LINES TERMINATED BY row_terminated_char ]
        [ NULL DEFINED AS null_char ]

Klauzule mezi klauzulí definice column a klauzulí AS SELECT se mohou objevit v libovolném pořadí. Můžete například napsat COMMENT table_comment za TBLPROPERTIES.

Poznámka:

Musíte zadat buď klauzuli STORED AS , nebo ROW FORMAT klauzuli. V opačném případě analyzátor SQL použije k analýze syntaxi CREATE TABLE [USING], a standardně vytvoří Delta table.

Parameters

table_identifier

Název table, který je volitelně kvalifikovaný názvem schema.

Syntax:[schema_name.] table_name
EXTERNÍ

Definuje table pomocí cesty zadané v LOCATION.
DĚLENÉ PODLE

Rozdělí table podle zadaného columns.
FORMÁT ŘÁDKU

Pomocí klauzule SERDE zadejte vlastní SerDe pro table. V opačném případě použijte DELIMITED klauzuli k použití nativní SerDe a zadejte oddělovač, řídicí znak, znak null atd.
SERDE

Určuje vlastní SerDe pro table.
serde_class

Určuje plně kvalifikovaný název třídy vlastního SerDe.
SERDEPROPERTIES

list párů klíč-hodnota sloužících k označení definice SerDe.
ODDĚLENÝ

Klauzuli DELIMITED lze použít k určení nativní SerDe a stav oddělovače, řídicí znak, null znak atd.
POLE UKONČENA UŽIVATELEM

Slouží k definování oddělovače column.
POLOŽKY KOLEKCE UKONČENÉ UŽIVATELEM

Slouží k definování oddělovače položek kolekce.
MAPOVÉ KLÍČE UKONČENÉ POMOCÍ

Slouží k definování oddělovače klíčů mapy.
ŘÁDKY UKONČENÉ UŽIVATELEM

Slouží k definování oddělovače řádků.
HODNOTA NULL DEFINOVANÁ JAKO

Slouží k definování konkrétní hodnoty pro hodnotu NULL.
ESCAPED BY

Definujte řídicí mechanismus.
POLOŽKY KOLEKCE UKONČENÉ UŽIVATELEM

Definujte oddělovač položek kolekce.
MAPOVÉ KLÍČE UKONČENÉ POMOCÍ

Definujte oddělovač klíčů mapy.
ŘÁDKY UKONČENÉ UŽIVATELEM

Definujte oddělovač řádků.
HODNOTA NULL DEFINOVANÁ JAKO

Definujte konkrétní hodnotu pro NULL.
ULOŽENO JAKO

Formát souboru pro table. Dostupné formáty zahrnují TEXTFILE, , SEQUENCEFILERCFILE, ORC, PARQUET, a AVRO. Alternativně můžete zadat vlastní vstupní a výstupní formáty prostřednictvím INPUTFORMAT a OUTPUTFORMAT. Pouze formáty TEXTFILE, SEQUENCEFILEa RCFILE lze použít s ROW FORMAT SERDE a pouze TEXTFILE s ROW FORMAT DELIMITED.
UMÍSTĚNÍ

Cesta k adresáři, kde je uloženo wheretable data, což může být cesta v distribuovaném úložišti.
KOMENTÁŘ

Řetězcový literál pro popis table.
TBLPROPERTIES

list párů klíč-hodnota sloužících k označení definice table.
SELECT_STATEMENT AS

Naplní table pomocí dat z příkazu select.

Příklady

--Use hive format
CREATE TABLE student (id INT, name STRING, age INT) STORED AS ORC;

--Use data from another table
CREATE TABLE student_copy STORED AS ORC
    AS SELECT * FROM student;

--Specify table comment and properties
CREATE TABLE student (id INT, name STRING, age INT)
    COMMENT 'this is a comment'
    STORED AS ORC
    TBLPROPERTIES ('foo'='bar');

--Specify table comment and properties with different clauses order
CREATE TABLE student (id INT, name STRING, age INT)
    STORED AS ORC
    TBLPROPERTIES ('foo'='bar')
    COMMENT 'this is a comment';

--Create partitioned table
CREATE TABLE student (id INT, name STRING)
    PARTITIONED BY (age INT)
    STORED AS ORC;

--Create partitioned table with different clauses order
CREATE TABLE student (id INT, name STRING)
    STORED AS ORC
    PARTITIONED BY (age INT);

--Use Row Format and file format
CREATE TABLE student (id INT, name STRING)
    ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
    STORED AS TEXTFILE;

--Use complex datatype
CREATE EXTERNAL TABLE family(
        name STRING,
        friends ARRAY<STRING>,
        children MAP<STRING, INT>,
        address STRUCT<street: STRING, city: STRING>
    )
    ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ESCAPED BY '\\'
    COLLECTION ITEMS TERMINATED BY '_'
    MAP KEYS TERMINATED BY ':'
    LINES TERMINATED BY '\n'
    NULL DEFINED AS 'foonull'
    STORED AS TEXTFILE
    LOCATION '/tmp/family/';

--Use predefined custom SerDe
CREATE TABLE avroExample
    ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.avro.AvroSerDe'
    STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat'
        OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat'
    TBLPROPERTIES ('avro.schema.literal'='{ "namespace": "org.apache.hive",
        "name": "first_schema",
        "type": "record",
        "fields": [
                { "name":"string1", "type":"string" },
                { "name":"string2", "type":"string" }
            ] }');

--Use personalized custom SerDe(we may need to `ADD JAR xxx.jar` first to ensure we can find the serde_class,
--or you may run into `CLASSNOTFOUND` exception)
ADD JAR /tmp/hive_serde_example.jar;

CREATE EXTERNAL TABLE family (id INT, name STRING)
    ROW FORMAT SERDE 'com.ly.spark.serde.SerDeExample'
    STORED AS INPUTFORMAT 'com.ly.spark.example.serde.io.SerDeExampleInputFormat'
        OUTPUTFORMAT 'com.ly.spark.example.serde.io.SerDeExampleOutputFormat'
    LOCATION '/tmp/family/';

Sdílet prostřednictvím

CREATE TABLE s formátem Hive

Syntaxe

Parameters

Příklady

Váš názor

Další materiály

Sdílet prostřednictvím

CREATE TABLE s formátem Hive

Syntaxe

Parameters

Příklady

Související příkazy

Váš názor

Další materiály