Поделиться через


Что такое представление?

Представление является результатом запроса по одной или нескольким таблицам и представлениям в каталоге Unity. Представление — это объект только для чтения, состоящий из одной или нескольких таблиц и представлений в хранилище метаданных. Вы можете создать из таблиц и из других представлений в нескольких схемах и каталогах.

В этой статье описываются представления, которые можно создать в Azure Databricks.

Представления в каталоге Unity

В каталоге Unity представления располагаются на третьем уровне трехуровневого пространства имен (catalog.schema.view):

Схема объектной модели каталога Unity, ориентированная на представление

Представление хранит текст запроса обычно в одном или нескольких источниках данных или таблицах в хранилище метаданных. В Azure Databricks представление эквивалентно кадру данных Spark, сохраненном как объект в схеме. В отличие от кадров данных, можно запрашивать представления из любого места в Azure Databricks, предполагая, что у вас есть разрешение на это. Создание представления не обрабатывает и не записывает данные. Только текст запроса регистрируется в хранилище метаданных в связанной схеме.

Примечание.

Представления могут иметь другую семантику выполнения, если они поддерживаются источниками данных, отличными от разностных таблиц. Databricks рекомендует всегда определять представления, ссылаясь на источники данных с помощью имени таблицы или представления. Определение представлений для наборов данных путем указания пути или URI может привести к путанице требований к управлению данными.

Материализованные представления

Материализованные представления постепенно вычисляют и обновляют результаты, возвращаемые определяющим запросом.

Вы можете зарегистрировать материализованные представления в каталоге Unity с помощью Databricks SQL или определить их как часть конвейера Delta Live Tables. См. статью "Использование материализованных представлений в Databricks SQL " и "Что такое разностные динамические таблицы?".

Временные представления

Временное представление имеет ограниченную область и сохраняемость и не регистрируется в схеме или каталоге. Время существования временного представления зависит от используемой среды.

  • В записных книжках и заданиях область действия временных представлений ограничена уровнем записной книжки или скрипта. Они не могут ссылаться за пределами записной книжки, в которой они объявлены, и больше не существуют, когда записная книжка отсоединяется от кластера.
  • В Databricks SQL область действия временных представлений ограничена уровнем запроса. Несколько инструкций в одном запросе могут использовать временное представление, однако на него нельзя ссылаться в других запросах даже в рамках одной панели мониторинга.

Динамические представления

Динамические представления можно использовать для обеспечения управления доступом на уровне строк и столбцов в дополнение к маскированию данных. См. раздел Создание динамического представления.

Представления в хранилище метаданных Hive (устаревшая версия)

Вы можете определить устаревшие представления Hive для любого источника данных и зарегистрировать их в устаревшем хранилище метаданных Hive. Databricks рекомендует перенести все устаревшие представления Hive в каталог Unity. Просмотр представлений в хранилище метаданных Hive.

Глобальное временное представление Hive (устаревшая версия)

Глобальные временные представления — это устаревшая функция Azure Databricks, которая позволяет зарегистрировать временное представление, доступное для всех рабочих нагрузок, работающих с вычислительным ресурсом. Глобальные временные представления — это устаревшая удержание Hive и HDFS. Databricks рекомендует использовать глобальные временные представления.