Поделиться через


Подключение к Preset

Preset предоставляет современную бизнес-аналитику для всей организации. Preset обеспечивает мощную, простую в использовании платформу изучения и визуализации данных на базе Apache Superset с открытым кодом.

Вы можете интегрировать хранилища Databricks SQL (прежнее название — конечные точки Databricks SQL) и кластеры Azure Databricks с Preset.

Подключение к Preset с помощью Partner Connect

Чтобы подключить рабочую область Azure Databricks к предварительной настройке с помощью Partner Connect, см. статью "Подключение к партнерам бизнес-аналитики" с помощью Partner Connect.

Примечание.

Partner Connect поддерживает только хранилища Databricks SQL для Preset. Чтобы подключить кластер в рабочей области Azure Databricks к Preset, подключитесь к Preset вручную.

Подключение к Preset вручную

В этом разделе показано, как вручную подключить существующее хранилище SQL или кластер в рабочей области Azure Databricks к Preset.

Примечание.

Для хранилищ SQL вы можете использовать Partner Connect, чтобы упростить процесс подключения.

Требования

Прежде чем выполнить интеграцию с Preset вручную, необходимо получить следующее:

Действия по подключению

Чтобы подключиться к Preset вручную, выполните следующие действия:

  1. Создайте учетную запись Preset или войдите в существующую.

  2. Нажмите + Рабочая область.

  3. В диалоговом окне Добавление новой рабочей области введите имя рабочей области, выберите ближайший к вам регион рабочей области и нажмите кнопку Сохранить.

  4. Откройте рабочую область, щелкнув плитку рабочей области.

  5. На панели инструментов щелкните >".

  6. Щелкните + База данных.

  7. В диалоговом окне Подключение базы данных в списке Поддерживаемые базы данных выберите один из следующих вариантов.

    • Если используется хранилище SQL, выберите Хранилище Databricks SQL.
    • Для кластера выберите Интерактивный кластер Databricks.
  8. В поле URI SQLAlchemy введите следующее значение:

    Для хранилища SQL:

    databricks+pyodbc://token:{access token}@{server hostname}:{port}/{database name}
    

    Для кластера:

    databricks+pyhive://token:{access token}@{server hostname}:{port}/{database name}
    

    Замена:

    • {access token} на значение личного маркера доступа Azure Databricks<!– или значение маркера Azure Active Directory –> из требований.
    • {server hostname} на значение имени узла сервера из требований.
    • {port} на значение порта из требований.
    • {database name} на имя целевой базы данных в рабочей области Azure Databricks.

    Например, для хранилища SQL:

    databricks+pyodbc://token:dapi...@adb-1234567890123456.7.azuredatabricks.net:443/default
    

    Например, для кластера:

    databricks+pyhive://token:dapi...@adb-1234567890123456.7.azuredatabricks.net:443/default
    
  9. Перейдите на вкладку Дополнительно и разверните пункт Другое.

  10. В поле Параметры подсистемы введите следующее значение:

    Для хранилища SQL:

    {"connect_args": {"http_path": "sql/1.0/warehouses/****", "driver_path": "/opt/simba/spark/lib/64/libsparkodbc_sb64.so"}}
    

    Для кластера:

    {"connect_args": {"http_path": "sql/protocolv1/o/****"}}
    

    Замените sql/protocolv1/o/**** значением в поле Путь HTTP из требований.

    Например, для хранилища SQL:

    {"connect_args": {"http_path": "sql/1.0/warehouses/ab12345cd678e901", "driver_path": "/opt/simba/spark/lib/64/libsparkodbc_sb64.so"}}
    

    Например, для кластера:

    {"connect_args": {"http_path": "sql/protocolv1/o/1234567890123456/1234-567890-buyer123"}}
    
  11. Перейдите на вкладку Основные и нажмите кнопку Проверить подключение.

    Примечание.

    Сведения об устранении неполадок с подключением см. в пошаговом руководстве по подключению к базе данных для Databricks на веб-сайте Preset.

  12. После успешного соединения щелкните Подключить.

Следующие шаги

Ознакомьтесь со следующими ресурсами на веб-сайте Preset: