Интеграция DBeaver с Azure Databricks
Заметка
В этой статье рассматриваются DBeaver, разработанные сторонними разработчиками. Чтобы связаться с поставщиком, перейдите на страницу с вопросами и проблемами в репозитории dbeaver/dbeaver на сайте GitHub.
DBeaver — это локальное многоплатформенное средство базы данных для разработчиков, администраторов баз данных, аналитиков данных, инженеров данных и других пользователей, которые должны работать с базами данных. DBeaver поддерживает Azure Databricks, а также другие популярные базы данных.
В этой статье описывается, как использовать локальный компьютер разработки для установки, настройки и использования бесплатного DBeaver Community Edition (CE) с открытым исходным кодом для работы с базами данных в Azure Databricks.
Заметка
Эта статья была протестирована с помощью macOS, Databricks JDBC Driver версии 2.6.36 и DBeaver CE версии 23.3.0.
Требования
Перед установкой DBeaver локальный компьютер разработки должен соответствовать следующим требованиям:
- 64-разрядная операционная система: Linux, macOS или Windows. (Поддерживается 32-разрядная версия Linux, но не рекомендуется.)
- Установите драйвер Databricks JDBC Driver на ваш локальный компьютер для разработки, извлекая файл
DatabricksJDBC42.jar
из загруженного файлаDatabricksJDBC42-<version>.zip
.
Для подключения к DBeaver необходимо также иметь кластер Azure Databricks или хранилище SQL .
Шаг 1. Установка DBeaver
Скачайте и установите DBeaver CE следующим образом:
-
Linux: скачайте и запустите один из установщиков Linux с страницы скачивания на веб-сайте DBeaver. Варианты установки для
snap
иflatpak
также предоставлены на этой странице. -
macOS: используйте Homebrew для запуска
brew install --cask dbeaver-community
или MacPorts для запускаsudo port install dbeaver-community
. Установщик macOS также доступен на странице загрузкина веб-сайте DBeaver. -
Windows: используйте Chocolatey для запуска
choco install dbeaver
. Установщик Windows также доступен на веб-сайте DBeaver на странице загрузки .
Шаг 2. Настройка драйвера JDBC Azure Databricks для DBeaver
Заполните Set DBeaver информацией о драйвере JDBC Databricks, который вы скачали ранее.
- Запустите DBeaver.
- Если вам будет предложено создать новую базу данных, щелкните Нет.
- Если вам будет предложено подключиться к базе данных или выполнить действие select, щелкните Отменить.
- Щелкните Database > Driver Manager.
- В диалоговом окне диспетчера драйверов
щелкните Создать . - В диалоговом окне Создание драйвера щелкните вкладку Библиотек.
- Щелкните Добавить файл.
- Перейдите к папке, в которую вы извлекли драйвер JDBC Azure Databricks.
- Перейдите на один уровень ниже, чтобы найти файл
.jar
. - Выделите файл
.jar
и нажмите Открыть. - На вкладке "Параметры
" дляимени драйверавведите . - На вкладке "Параметры
" дляимени классавведите . - Нажмите кнопку ОК.
- В диалоговом окне диспетчера драйверов
нажмите кнопку Закрыть .
Шаг 3. Подключение DBeaver к базам данных Azure Databricks
Используйте DBeaver для подключения к кластеру или хранилищу SQL для доступа к базам данных в рабочей области Azure Databricks.
В DBeaver щелкните Database > New Database Connection.
В диалоговом окне Подключение к базе данных на вкладке Все щелкните Databricks, а затем щелкните Далее.
Нажмите на вкладку Main и введите значение в поле URL-адрес JDBC для ресурса Azure Databricks. Сведения о синтаксисе поля URL-адресе JDBC
см. в параметрах проверки подлинности Databricks JDBC Driver .Щелкните проверить подключение.
Совет
Перед тестированием подключения необходимо запустить ресурс Azure Databricks. В противном случае, когда ресурс запускается, тест может занять несколько минут для завершения.
Если подключение выполнено успешно, в диалоговом окне теста подключения
нажмите кнопку ОК .В диалоговом окне Подключение к базе данных нажмите кнопку Готово.
В
- Щелкните правой кнопкой мыши Databricks, а затем щелкните Изменить подключение.
- В диалоговом окне конфигурации подключения щелкните Общие.
- Для имени подключения замените
Databricks
на другое имя подключения. - Нажмите кнопку ОК.
Повторите инструкции на этом шаге для каждого ресурса, к которому требуется доступ DBeaver.
Шаг 4. Использование DBeaver для просмотра объектов данных
Используйте DBeaver для доступа к объектам данных в рабочей области Azure Databricks, таким как tables и table свойства, views, индексы, типы данных и другие типы объектов данных.
В DBeaver, в Навигаторе баз данныхwindow, щелкните правой кнопкой мыши подключение, которое вы хотите использовать.
Если Connect включен, нажмите на него. (Если Connect отключен, вы уже подключены.)
Совет
Перед попыткой подключиться к нему необходимо запустить ресурс. В противном случае подключение может занять несколько минут во время запуска ресурса.
Расширьте подключение, к которому вы только что подключились.
Разверните и просмотрите доступные объекты данных. Дважды щелкните объект данных, чтобы получить get дополнительные сведения об этом.
Повторите инструкции на этом шаге, чтобы получить доступ к дополнительным объектам данных.
Шаг 5. Использование DBeaver для запуска инструкций SQL
Используйте DBeaver для загрузки примера trips
table из samples
catalognyctaxi
schema.
В DBeaver в навигаторе базы данных window, нажмите правой кнопкой мыши по подключению, которое требуется использовать.
Если Connect включен, щелкните его. (Если Connect отключено, вы уже подключены.)
Совет
Перед попыткой подключиться к нему необходимо запустить ресурс. В противном случае подключение может занять несколько минут во время запуска ресурса.
Щелкните Редактор SQL, > Новый скрипт SQL.
На вкладке (имя подключения) Script-1 введите следующую инструкцию SQL:
SELECT * FROM samples.nyctaxi.trips;
Щелкните Редактор SQL, затем > Выполните скрипт SQL.
Дальнейшие действия
- Используйте редактор объектов базы данных для работы с свойствами объектов базы данных, данными и схемами отношений сущностей.
- С помощью редактора данных просматривать и изменять данные в базе данных table или представлении.
- Используйте редактор SQL для работы со скриптами SQL.
- Работа с схемами отношений сущностей (ERD) в DBeaver.
- Импорт и экспорт данных в DBeaver и из DBeaver.
- Перенос данных с помощью DBeaver.
- Устранение проблем с драйвером JDBC в DBeaver.