Поделиться через


Подключение к Dataiku

Dataiku — это сквозная платформа ИИ для подготовки данных, AutoML и MLOps. Вы можете интегрировать хранилища SQL Databricks и кластеры Azure Databricks с Dataiku.

Подключение к Dataiku с помощью Partner Connect

Примечание.

Partner Connect поддерживает только хранилища SQL для Dataiku. Чтобы подключить кластер к Dataiku, подключитесь к Dataiku вручную.

Чтобы подключить рабочую область Azure Databricks к Dataiku с помощью Partner Connect, сделайте следующее:

  1. На боковой панели щелкните значок MarketplaceMarketplace.

  2. В интеграции Partner Connectщелкните Просмотреть все.

  3. Щелкните плитку партнерского решения.

    Примечание.

    Если в плитке Dataiku есть значок галочки, администратор уже использовал Partner Connect для подключения Dataiku к рабочей области. Перейдите к шагу 5. Партнер использует адрес электронной почты для учетной записи Azure Databricks, чтобы заставить вас войти в существующую учетную запись Dataiku.

  4. Выберите каталог из раскрывающегося списка и нажмите кнопку "Далее".

    Примечание.

    Если рабочая область включена в каталоге Unity, но партнер не поддерживает каталог Unity с помощью Partner Connect, используется каталог рабочей области по умолчанию. Если рабочая область не включена в каталоге Unity, hive_metastore используется.

  5. Выберите схему из раскрывающегося списка и нажмите кнопку "Добавить". Этот шаг можно повторить, чтобы добавить несколько схем.

  6. Нажмите кнопку Далее.

    С помощью Partner Connect в рабочей области создаются следующие ресурсы:

    • Субъект-служба Azure Databricks <PARTNER>_USER
    • Личный маркер доступа Azure Databricks, связанный с субъектом-службой<PARTNER>_USER.

    Partner Connect также предоставляет следующие привилегии субъекту-службе <PARTNER>_USER :

    • (Каталог Unity)USE CATALOG: требуется для взаимодействия с объектами в выбранном каталоге.
    • (Каталог Unity) USE SCHEMA— предоставляет возможность считывать выбранные схемы.
    • (Каталог Unity)CREATE SCHEMA: предоставляет возможность создавать схемы в выбранном каталоге.
    • (Устаревшее хранилище метаданных Hive) USAGE— требуется для взаимодействия с объектами внутри hive_metastore и выбранными схемами.
    • (Устаревшее хранилище метаданных Hive) CREATE— предоставляет возможность создавать схему в hive_metastore.
    • (Устаревшее хранилище метаданных Hive) READ_METADATA. Предоставляет возможность чтения метаданных для выбранных схем.
    • (Устаревшее хранилище метаданных Hive) SELECT: предоставляет возможность читать выбранные схемы.
  7. Нажмите кнопку Далее.

    В поле Электронная почта отображается адрес электронной почты для учетной записи Azure Databricks. Dataiku использует этот адрес электронной почты для запроса на создание учетной записи партнера или вход в существующую учетную запись партнера.

  8. Нажмите кнопку "Подключиться к Dataiku" или "Войти".

    Откроется новая вкладка в веб-браузере, где отображается веб-сайт Dataiku.

  9. Выполните инструкции на экране на веб-сайте Dataiku, чтобы создать пробную учетную запись Dataiku или войти в существующую учетную запись Dataiku.

Подключение к Dataiku вручную

В этом разделе описывается, как подключить существующее хранилище ИЛИ кластер SQL в рабочей области Azure Databricks к Dataiku вручную.

Примечание.

Для хранилищ SQL Databricks можно подключиться к Dataiku с помощью Partner Connect, чтобы упростить работу.

Требования

Прежде чем подключиться к Dataiku вручную, вам потребуется следующее:

Действия по подключению

Чтобы подключиться к Dataiku вручную, выполните инструкции Databricks в документации по Dataiku.

Дополнительные ресурсы

Изучите следующие ресурсы Dataiku: