Поделиться через


Управляйте настройками catalog по умолчанию

В этой статье вводится значение Unity Catalogcatalogпо умолчанию, объясняется, как определить, какие catalog использовать в качестве значения по умолчанию, и показано, как его изменить.

Что такое catalog по умолчанию в Unity Catalog?

catalog по умолчанию настраивается для каждой рабочей области, которая активирована для Unity Catalog. catalog по умолчанию позволяет выполнять операции с данными без указания catalog. Если при выполнении операций с данными вы опустите верхнеуровневое имя catalog, по умолчанию предполагается catalog.

Администратор рабочей области может просматривать или переключать настройки catalog по умолчанию с помощью интерфейса настроек администратора. Вы также можете setcatalog по умолчанию для кластера с помощью конфигурации Spark.

Команды, которые не указывают catalog (например, GRANT CREATE TABLE ON SCHEMA myschema TO mygroup) оцениваются для catalog в следующем порядке:

  1. Используется ли catalogset для сеанса с помощью высказывания USE CATALOG или параметров JDBC?
  2. Находится ли конфигурация Spark spark.databricks.sql.initial.catalog.namespaceset в кластере?
  3. Существует ли в кластере область рабочей среды по умолчанию catalogset?

Конфигурация catalog по умолчанию при включении Unity Catalog

catalog по умолчанию, настроенный для вашей рабочей области, зависит от того, как ваша рабочая область была включена для Unity Catalog:

  • Для некоторых рабочих областей, которые были включены для Unity автоматически, рабочей области была в качестве по умолчанию. См. автоматическое включение CatalogUnity.
  • Для всех остальных рабочих областей hive_metastorecatalogset в качестве catalogпо умолчанию.

При миграции из хранилища метаданных Hive в Unity Cataloghive_metastore можно setcatalog по умолчанию, чтобы избежать влияния на существующий код, ссылающийся на хранилище метаданных Hive.

Измените catalog по умолчанию

Администратор рабочей области может изменить значение по умолчанию catalog для рабочей области. Любой пользователь с разрешением на создание или изменение вычислительного ресурса может set другой catalog по умолчанию для вычислительного ресурса.

Предупреждение

Изменение catalog по умолчанию может нарушить существующие операции с данными, которые зависят от него.

Чтобы настроить другое значение catalog по умолчанию для рабочей области, выполните следующие шаги.

  1. Войдите в рабочую область в качестве администратора рабочей области.
  2. Щелкните имя пользователя в верхней строке рабочей области и selectнастройки администратора в раскрывающемся списке.
  3. Перейдите на вкладку Дополнительно.
  4. На ряду catalog по умолчанию для рабочей области введите имя catalog, затем нажмите кнопку Сохранить.

Перезапустите хранилища и кластеры SQL, чтобы изменения вступили в силу. Все новые и перезапущенные хранилища SQL и кластеры будут использовать этот catalog в качестве рабочей области по умолчанию.

Вы также можете переопределить catalog по умолчанию для определенного кластера, задав следующую конфигурацию Spark в кластере. Этот подход недоступен для хранилищ SQL:

spark.databricks.sql.initial.catalog.name

Инструкции см. в разделе "Конфигурация Spark".

Просмотр текущего catalog по умолчанию

Чтобы установить get текущим значением catalog по умолчанию для вашей рабочей области, можно использовать оператор SQL в записной книжке или в запросе редактора SQL. Администратор рабочей области может getcatalog по умолчанию через интерфейс настроек администрирования.

Параметры администратора

  1. Войдите в рабочую область в качестве администратора рабочей области.
  2. Щелкните ваше имя пользователя в верхней панели рабочей области и выберите selectНастройки Администратора из раскрывающегося списка.
  3. Перейдите на вкладку Дополнительно.
  4. На строке рабочей области Default просмотрите имя .

SQL

Выполните следующую команду в записной книжке или в редакторе SQL-запросов, работающем в SQL-хранилище или в кластере, совместимом с Unity Catalog. catalog рабочей среды по умолчанию возвращается, пока ни USE CATALOG команда или настройка JDBC не была set в сеансе, и ни одна spark.databricks.sql.initial.catalog.namespace конфигурация не установлена для кластера set.

SELECT current_catalog();