Поделиться через


Использование внешнего хранилища метаданных Hive для пула Synapse Spark

Примечание.

Внешние хранилища метаданных Hive больше не будут поддерживаться в последующих версиях после выполнения Azure Synapse для Apache Spark 3.4 в Synapse.

Azure Synapse Analytics позволяет пулам Apache Spark в той же рабочей области совместно использовать управляемое хранилище метаданных Hive (HMS) в качестве каталога. Когда клиент хочет сохранять метаданные каталога Hive за пределами рабочей области и использовать объекты каталога совместно с другими вычислительными механизмами (такими как HDInsight и Azure Databricks) за ее пределами, он может подключиться к внешнему хранилищу метаданных Hive. Из этой статьи вы узнаете, как подключить Synapse Spark к внешнему хранилищу метаданных Apache Hive.

Поддерживаемые версии хранилища метаданных Hive

Эта функция работает с Spark 3.3. В следующей таблице приведены поддерживаемые версии хранилища метаданных Hive (HMS) для каждой версии Spark.

Версия Spark HMS 2.3.x HMS 3.1.X
3,3 Да Да
3,4 Да Да

Настройка связанной службы для хранилища метаданных Hive

Примечание.

В качестве внешнего хранилища метаданных Hive поддерживаются только База данных SQL Azure и База данных Azure для MySQL. Проверка подлинности SQL(username-password) поддерживается для обоих типов баз данных. Кроме того, для База данных SQL Azure и Spark 3.4 поддерживается проверка подлинности управляемых удостоверений (включая назначаемые системой и назначаемые пользователем). Если указанная база данных пуста, подготовьте ее к работе с помощью средства создания схемы Hive, чтобы создать схему базы данных.

Выполните действия ниже, чтобы настроить связанную службу для внешнего хранилища метаданных Hive в рабочей области Synapse.

  1. Откройте Synapse Studio, перейдите в раздел Управление и связанные службы слева и щелкните Создать, чтобы создать связанную службу.

    Снимок экрана: настройка связанной службы хранилища метаданных Hive.

  2. Выберите Базу данных SQL Azure и нажмите кнопку Продолжить.

  3. Укажите Имя связанной службы. Запишите имя связанной службы. Эта информация будет использоваться для настройки Spark через некоторое время.

  4. Выберите устаревшую версию и выберите строку подключения.

  5. Выберите База данных SQL Azure для внешнего хранилища метаданных Hive из списка подписок Azure или введите сведения вручную.

  6. Задайте тип проверки подлинности как один из SQL Authenticationили System-assigned managed identity User-assigned managed identity. Для SQL Authenticationэтого укажите имя пользователя и пароль для настройки подключения. Для System-assigned managed identityэтого страница автоматически заполняет удостоверение управления, связанное с текущей рабочей областью. Для User-assigned managed identityпараметра выберите или создайте учетные данные, привязанные к управляемому удостоверению, назначаемого пользователем.

  7. Проверьте подключение , чтобы проверить проверку подлинности.

  8. Щелкните Создать, чтобы сохранить связанную службу.