Partições

Artigo
03/23/2025

Aplica-se a: assinalado como sim Databricks SQL Databricks Runtime

Uma partição é composta por um subconjunto de linhas numa tabela que compartilham o mesmo valor para um subconjunto predefinido de colunas chamadas colunas de particionamento. O uso de partições pode acelerar consultas na tabela, bem como a manipulação de dados.

Para usar partições, defina o conjunto de colunas de particionamento ao criar uma tabela incluindo a cláusula PARTITIONED BY.

Ao inserir ou manipular linhas em uma tabela, o Azure Databricks despacha automaticamente as linhas para as partições apropriadas.

Você também pode especificar a partição diretamente usando uma cláusula PARTITION.

Essa sintaxe também está disponível para tabelas que não usam o formato Delta Lake, para particionar rapidamente as partições DROP, ADD ou RENAME, utilizando a instrução ALTER TABLE.

PARTICIONADO POR

A cláusula PARTITIONED BY especificou uma lista de colunas ao longo das quais a nova tabela é particionada.

Sintaxe

PARTITIONED BY ( { partition_column [ column_type ] } [, ...] )

Parâmetros

coluna_de_partição

Um identificador pode fazer referência a um column_identifier na tabela. Se você especificar mais de uma coluna, não deve haver duplicatas. Se você fizer referência a todas as colunas no column_specification da tabela, um erro será gerado.
tipo_de_coluna

A menos que o partition_column se refira a um column_identifier no column_specificationda tabela, column_type define o tipo de dados do partition_column.

Nem todos os tipos de dados suportados pelo Databricks SQL são suportados por todas as fontes de dados.

Notas

A menos que você defina uma tabela Delta Lake, as colunas de particionamento que fazem referência às colunas na especificação da coluna são sempre movidas para o final da tabela.

PARTITION

Use a cláusula PARTITION para identificar uma partição a ser consultada ou manipulada.

Uma partição é identificada nomeando todas as suas colunas e associando cada uma a um valor. Você não precisa especificá-los em uma ordem específica.

A menos que você esteja adicionando uma nova partição a uma tabela existente, você pode omitir colunas ou valores para indicar que a operação se aplica a todas as partições correspondentes correspondentes ao subconjunto de colunas.

PARTITION ( { partition_column  [ = partition_value | LIKE pattern ] } [ , ... ] )

Parâmetros

partition_column

Uma coluna designada como coluna de partição da tabela. Não é possível especificar a mesma coluna duas vezes.
= partition_value

Um literal de um tipo de dados que corresponde ao tipo da coluna de partição. Se você omitir um valor de partição, a especificação corresponderá a todos os valores dessa coluna de partição.
LIKE pattern

Este formulário só é permitido em ALTER SHARE ADD TABLE.

Compara a representação de cadeia de caracteres de partition_column com pattern. patterndeve ser um literal de cadeia de caracteres como usado em LIKE.

Exemplos

-- Use the PARTTIONED BY clause in a table definition
> CREATE TABLE student(university STRING,
                       major      STRING,
                       name       STRING)
         PARTITIONED BY(university, major)

> CREATE TABLE professor(name STRING)
         PARTITIONED BY(university STRING,
                        department STRING);

-- Use the PARTITION specification to INSERT into a table
> INSERT INTO student
         PARTITION(university= 'TU Kaiserslautern') (major, name)
         SELECT major, name FROM freshmen;

-- Use the partition specification to add and drop a partition
> CREATE TABLE log(date DATE, id INT, event STRING)
     USING CSV
     PARTITIONED BY (date);

> ALTER TABLE log ADD PARTITION(date = DATE'2021-09-10');

> ALTER TABLE log DROP PARTITION(date = DATE'2021-09-10');

-- Drop all partitions from the named university, independent of the major.
> ALTER TABLE student DROP PARTITION(university = 'TU Kaiserslautern');

Partilhar via

Partições

PARTICIONADO POR

Sintaxe

Parâmetros

Notas

PARTITION

Parâmetros

Exemplos

Comentários

Recursos adicionais