Поделиться через


INSERT OVERWRITE DIRECTORY

Область применения:флажок Databricks SQL флажок Databricks Runtime

Перезаписывает существующие данные в каталоге новыми значениями с помощью заданного формата файла Spark. Добавляемые строки определяются выражениями значений или результатом запроса.

Синтаксис

INSERT OVERWRITE [ LOCAL ] DIRECTORY [ directory_path ]
    USING file_format [ OPTIONS ( { key [ = ] val } [ , ... ] ) ]
    { VALUES ( { value | NULL } [ , ... ] ) [ , ( ... ) ] | query }

Параметры

  • directory_path

    Каталог назначения. Также его можно указать в OPTIONS с помощью path. Ключевое слово LOCAL обозначает, что каталог находится в локальной файловой системе.

  • file_format

    Формат файла, используемый для вставки. Допускаются следующие значения: TEXT, CSV, JSON, JDBC, PARQUET, ORC, HIVE, LIBSVM или полное имя класса пользовательской реализации org.apache.spark.sql.execution.datasources.FileFormat.

  • OPTIONS ( { ключ [ = val } [ , ... ] )

    Задает один или несколько параметров для записи формата файла.

  • VALUES ( { значение | NULL } [ , … ] ) [ , ( … ) ]

    Вставляемые значения. Можно вставить явно указанное значение или NULL. Для разделения значений в предложении используйте запятую. Для вставки нескольких строк можно указать несколько наборов значений.

  • query

    Запрос, создающий вставляемые строки. Один из следующих форматов:

    • Инструкция SELECT
    • Инструкция TABLE
    • Инструкция FROM

Примеры

INSERT OVERWRITE DIRECTORY '/Volumes/my_catalog/my_schema/my_volume/'
    USING parquet
    OPTIONS (col1 1, col2 2, col3 'test')
    SELECT * FROM test_table;

INSERT OVERWRITE DIRECTORY
    USING parquet
    OPTIONS ('path' '/Volumes/my_catalog/my_schema/my_volume/', col1 1, col2 2, col3 'test')
    SELECT * FROM test_table;