Поделиться через


Интеграция DBeaver с Azure Databricks

Заметка

В этой статье рассматриваются DBeaver, разработанные сторонними разработчиками. Чтобы связаться с поставщиком, перейдите на страницу с вопросами и проблемами в репозитории dbeaver/dbeaver на сайте GitHub.

DBeaver — это локальное многоплатформенное средство базы данных для разработчиков, администраторов баз данных, аналитиков данных, инженеров данных и других пользователей, которые должны работать с базами данных. DBeaver поддерживает Azure Databricks, а также другие популярные базы данных.

В этой статье описывается, как использовать локальный компьютер разработки для установки, настройки и использования бесплатного DBeaver Community Edition (CE) с открытым исходным кодом для работы с базами данных в Azure Databricks.

Заметка

Эта статья была протестирована с помощью macOS, Databricks JDBC Driver версии 2.6.36 и DBeaver CE версии 23.3.0.

Требования

Перед установкой DBeaver локальный компьютер разработки должен соответствовать следующим требованиям:

  • 64-разрядная операционная система: Linux, macOS или Windows. (Поддерживается 32-разрядная версия Linux, но не рекомендуется.)
  • Установите драйвер Databricks JDBC Driver на ваш локальный компьютер для разработки, извлекая файл DatabricksJDBC42.jar из загруженного файла DatabricksJDBC42-<version>.zip.

Для подключения к DBeaver необходимо также иметь кластер Azure Databricks или хранилище SQL .

Шаг 1. Установка DBeaver

Скачайте и установите DBeaver CE следующим образом:

  • Linux: скачайте и запустите один из установщиков Linux с страницы скачивания на веб-сайте DBeaver. Варианты установки для snap и flatpak также предоставлены на этой странице.
  • macOS: используйте Homebrew для запуска brew install --cask dbeaver-communityили MacPorts для запуска sudo port install dbeaver-community. Установщик macOS также доступен на странице загрузки на веб-сайте DBeaver.
  • Windows: используйте Chocolatey для запуска choco install dbeaver. Установщик Windows также доступен на веб-сайте DBeaver на странице загрузки .

Шаг 2. Настройка драйвера JDBC Azure Databricks для DBeaver

Заполните Set DBeaver информацией о драйвере JDBC Databricks, который вы скачали ранее.

  1. Запустите DBeaver.
  2. Если вам будет предложено создать новую базу данных, щелкните Нет.
  3. Если вам будет предложено подключиться к базе данных или выполнить действие select, щелкните Отменить.
  4. Щелкните Database > Driver Manager.
  5. В диалоговом окне диспетчера драйверов щелкните Создать.
  6. В диалоговом окне Создание драйвера щелкните вкладку Библиотек.
  7. Щелкните Добавить файл.
  8. Перейдите к папке, в которую вы извлекли драйвер JDBC Azure Databricks.
  9. Перейдите на один уровень ниже, чтобы найти файл .jar.
  10. Выделите файл .jar и нажмите Открыть.
  11. На вкладке "Параметры " дляимени драйвера введите .
  12. На вкладке "Параметры " дляимени класса введите .
  13. Нажмите кнопку ОК.
  14. В диалоговом окне диспетчера драйверов нажмите кнопку Закрыть.

Шаг 3. Подключение DBeaver к базам данных Azure Databricks

Используйте DBeaver для подключения к кластеру или хранилищу SQL для доступа к базам данных в рабочей области Azure Databricks.

  1. В DBeaver щелкните Database > New Database Connection.

  2. В диалоговом окне Подключение к базе данных на вкладке Все щелкните Databricks, а затем щелкните Далее.

  3. Нажмите на вкладку Main и введите значение в поле URL-адрес JDBC для ресурса Azure Databricks. Сведения о синтаксисе поля URL-адресе JDBC см. в параметрах проверки подлинности Databricks JDBC Driver.

  4. Щелкните проверить подключение.

    Совет

    Перед тестированием подключения необходимо запустить ресурс Azure Databricks. В противном случае, когда ресурс запускается, тест может занять несколько минут для завершения.

  5. Если подключение выполнено успешно, в диалоговом окне теста подключения нажмите кнопку ОК.

  6. В диалоговом окне Подключение к базе данных нажмите кнопку Готово.

ВDatabase Navigator отображается запись Databricks. Чтобы изменить имя подключения, чтобы упростить идентификацию:

  1. Щелкните правой кнопкой мыши Databricks, а затем щелкните Изменить подключение.
  2. В диалоговом окне конфигурации подключения щелкните Общие.
  3. Для имени подключения замените Databricks на другое имя подключения.
  4. Нажмите кнопку ОК.

Повторите инструкции на этом шаге для каждого ресурса, к которому требуется доступ DBeaver.

Шаг 4. Использование DBeaver для просмотра объектов данных

Используйте DBeaver для доступа к объектам данных в рабочей области Azure Databricks, таким как tables и table свойства, views, индексы, типы данных и другие типы объектов данных.

  1. В DBeaver, в Навигаторе баз данныхwindow, щелкните правой кнопкой мыши подключение, которое вы хотите использовать.

  2. Если Connect включен, нажмите на него. (Если Connect отключен, вы уже подключены.)

    Совет

    Перед попыткой подключиться к нему необходимо запустить ресурс. В противном случае подключение может занять несколько минут во время запуска ресурса.

  3. Расширьте подключение, к которому вы только что подключились.

  4. Разверните и просмотрите доступные объекты данных. Дважды щелкните объект данных, чтобы получить get дополнительные сведения об этом.

Повторите инструкции на этом шаге, чтобы получить доступ к дополнительным объектам данных.

Шаг 5. Использование DBeaver для запуска инструкций SQL

Используйте DBeaver для загрузки примера tripstable из samplescatalognyctaxischema.

  1. В DBeaver в навигаторе базы данных window, нажмите правой кнопкой мыши по подключению, которое требуется использовать.

  2. Если Connect включен, щелкните его. (Если Connect отключено, вы уже подключены.)

    Совет

    Перед попыткой подключиться к нему необходимо запустить ресурс. В противном случае подключение может занять несколько минут во время запуска ресурса.

  3. Щелкните Редактор SQL, > Новый скрипт SQL.

  4. На вкладке (имя подключения) Script-1 введите следующую инструкцию SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Щелкните Редактор SQL, затем > Выполните скрипт SQL.

Дальнейшие действия

  • Используйте редактор объектов базы данных для работы с свойствами объектов базы данных, данными и схемами отношений сущностей.
  • С помощью редактора данных просматривать и изменять данные в базе данных table или представлении.
  • Используйте редактор SQL для работы со скриптами SQL.
  • Работа с схемами отношений сущностей (ERD) в DBeaver.
  • Импорт и экспорт данных в DBeaver и из DBeaver.
  • Перенос данных с помощью DBeaver.
  • Устранение проблем с драйвером JDBC в DBeaver.

Дополнительные ресурсы