INSERT OVERWRITE DIRECTORY
Aplica-se a: SQL do Databricks
Runtime do Databricks
Substitui os dados existentes no diretório com os novos valores usando o formato de arquivo Spark apresentado. Especifique a linhas inserida por expressões de valor ou o resultado de uma consulta.
Sintaxe
INSERT OVERWRITE [ LOCAL ] DIRECTORY [ directory_path ]
USING file_format [ OPTIONS ( { key [ = ] val } [ , ... ] ) ]
{ VALUES ( { value | NULL } [ , ... ] ) [ , ( ... ) ] | query }
Parâmetros
directory_path
O diretório de destino. Também pode ser especificado em
OPTIONS
usandopath
. A palavra-chaveLOCAL
especifica que o diretório está no sistema de arquivos local.file_format
O formato de arquivo a ser usado na inserção. Uma destas opções válidas:
TEXT
,CSV
,JSON
,JDBC
,PARQUET
,ORC
,HIVE
eLIBSVM
ou um nome de classe totalmente qualificado de uma implementação personalizada deorg.apache.spark.sql.execution.datasources.FileFormat
.OPTIONS ( { key [ = ] val } [ , … ] )
Especifica uma ou mais opções para a gravação do formato de arquivo.
VALUES ( { value | NULL } [ , … ] ) [ , ( … ) ]
Os valores a serem inseridos. Um valor explicitamente especificado ou um NULO pode ser inserido. Uma vírgula deve ser usada para separar cada valor na cláusula. Mais de um conjunto de valores pode ser especificado para inserir várias linhas.
query
Uma consulta que produz as linhas a serem inseridas. Um dos seguintes formatos:
- Uma instrução
SELECT
- Uma instrução
TABLE
- Uma instrução
FROM
- Uma instrução
Exemplos
INSERT OVERWRITE DIRECTORY '/tmp/destination'
USING parquet
OPTIONS (col1 1, col2 2, col3 'test')
SELECT * FROM test_table;
INSERT OVERWRITE DIRECTORY
USING parquet
OPTIONS ('path' '/tmp/destination', col1 1, col2 2, col3 'test')
SELECT * FROM test_table;