Что такое схемы в Azure Databricks?
В каталоге Unity схема является дочерним элементом каталога и может содержать таблицы, представления, тома, модели и функции. Схемы предоставляют более детализированные категории организации данных, чем каталоги.
В этой статье описывается роль схем в иерархии объектов данных Azure Databricks в каталоге Unity.
Сведения о схемах в устаревшем хранилище метаданных Hive для рабочей области см . в разделе "Объекты базы данных" в устаревшем хранилище метаданных Hive.
Что такое схема?
В каталоге Unityсхема является вторым уровнем трехуровневого пространства имен каталога Unity (catalog.schema.table-etc
).
диаграмма объектной модели каталога Unity, сосредоточенная на схеме
Схема упорядочивает ресурсы данных и ИИ в логические категории, которые более детализируются, чем каталоги. Обычно схема представляет один вариант использования, проект или тестовую среду команды. Независимо от типа категории схемы — это полезное средство для управления доступом к данным и улучшения возможности обнаружения данных.
Примечание.
В Azure Databricks схемы иногда называются базами данных. Например, CREATE DATABASE
является псевдонимом для CREATE SCHEMA
. Эта терминология отличается от некоторых реляционных систем баз данных, в которых база данных является коллекцией схем.
Дополнительные сведения о иерархии объектов данных в каталоге Unity см. в статье Что такое объекты базы данных в Azure Databricks?.
Управляемые расположения для схем
В рамках каталога Unity можно физически изолировать данные всех управляемых таблиц и управляемых томов в одной схеме от данных других схем, указав управляемое расположение хранилища для этой схемы. Это совершенно необязательно. Если для схемы не указано управляемое расположение хранилища, данные находятся в управляемом расположении хранилища каталога (и если ни одно не определено для каталога, данные находятся в управляемом расположении хранилища метахранилища). См. Укажите управляемое расположение хранилища в каталоге Unity.
Изоляция данных для внешних таблиц и томов зависит от того, как вы управляете данными в облачном хранилище. Он не зависит от контролируемого местоположения схемы.