Подключение к Dataiku
Dataiku — это сквозная платформа ИИ для подготовки данных, AutoML и MLOps. Вы можете интегрировать хранилища SQL Databricks и кластеры Azure Databricks с Dataiku.
Подключение к Dataiku с помощью Partner Connect
Примечание.
Partner Connect поддерживает только хранилища SQL для Dataiku. Чтобы подключить кластер к Dataiku, подключитесь к Dataiku вручную.
Чтобы подключить рабочую область Azure Databricks к Dataiku с помощью Partner Connect, сделайте следующее:
На боковой панели щелкните значок Marketplace.
В интеграции Partner Connectщелкните Просмотреть все.
Щелкните плитку партнерского решения.
Примечание.
Если в плитке Dataiku есть значок галочки, администратор уже использовал Partner Connect для подключения Dataiku к рабочей области. Перейдите к шагу 5. Партнер использует адрес электронной почты для учетной записи Azure Databricks, чтобы заставить вас войти в существующую учетную запись Dataiku.
Выберите каталог из раскрывающегося списка и нажмите кнопку "Далее".
Примечание.
Если рабочая область включена в каталоге Unity, но партнер не поддерживает каталог Unity с помощью Partner Connect, используется каталог рабочей области по умолчанию. Если рабочая область не включена в каталоге Unity,
hive_metastore
используется.Выберите схему из раскрывающегося списка и нажмите кнопку "Добавить". Этот шаг можно повторить, чтобы добавить несколько схем.
Нажмите кнопку Далее.
С помощью Partner Connect в рабочей области создаются следующие ресурсы:
- Субъект-служба Azure Databricks
<PARTNER>_USER
- Личный маркер доступа Azure Databricks, связанный с субъектом-службой
<PARTNER>_USER
.
Partner Connect также предоставляет следующие привилегии субъекту-службе
<PARTNER>_USER
:- (Каталог Unity)
USE CATALOG
: требуется для взаимодействия с объектами в выбранном каталоге. - (Каталог Unity)
USE SCHEMA
— предоставляет возможность считывать выбранные схемы. - (Каталог Unity)
CREATE SCHEMA
: предоставляет возможность создавать схемы в выбранном каталоге. - (Устаревшее хранилище метаданных Hive)
USAGE
— требуется для взаимодействия с объектами внутриhive_metastore
и выбранными схемами. - (Устаревшее хранилище метаданных Hive)
CREATE
— предоставляет возможность создавать схему вhive_metastore
. - (Устаревшее хранилище метаданных Hive) READ_METADATA. Предоставляет возможность чтения метаданных для выбранных схем.
- (Устаревшее хранилище метаданных Hive) SELECT: предоставляет возможность читать выбранные схемы.
- Субъект-служба Azure Databricks
Нажмите кнопку Далее.
В поле Электронная почта отображается адрес электронной почты для учетной записи Azure Databricks. Dataiku использует этот адрес электронной почты для запроса на создание учетной записи партнера или вход в существующую учетную запись партнера.
Нажмите кнопку "Подключиться к Dataiku" или "Войти".
Откроется новая вкладка в веб-браузере, где отображается веб-сайт Dataiku.
Выполните инструкции на экране на веб-сайте Dataiku, чтобы создать пробную учетную запись Dataiku или войти в существующую учетную запись Dataiku.
Подключение к Dataiku вручную
В этом разделе описывается, как подключить существующее хранилище ИЛИ кластер SQL в рабочей области Azure Databricks к Dataiku вручную.
Примечание.
Для хранилищ SQL Databricks можно подключиться к Dataiku с помощью Partner Connect, чтобы упростить работу.
Требования
Прежде чем подключиться к Dataiku вручную, вам потребуется следующее:
Кластер хранилища SQL в рабочей области Azure Databricks.
- Справочник по конфигурации вычислений.
- Создание хранилища SQL.
Сведения о подключении для кластера или хранилища SQL, в частности имя узла сервера, порт и путь HTTP.
- Получение сведений о подключении для вычислительного ресурса Azure Databricks.
Маркер личного доступа Azure Databricks или токен Microsoft Entra ID (ранее Azure Active Directory). Чтобы создать личный маркер доступа, выполните действия, описанные в разделе "Личные маркеры доступа Azure Databricks" для пользователей рабочей области.
Примечание.
В качестве рекомендации по обеспечению безопасности при проверке подлинности с помощью автоматизированных средств, систем, сценариев и приложений Databricks рекомендуется использовать личные маркеры доступа, принадлежащие субъектам-службам, а не пользователям рабочей области. Сведения о создании маркеров для субъектов-служб см. в разделе "Управление маркерами" для субъекта-службы.
Действия по подключению
Чтобы подключиться к Dataiku вручную, выполните инструкции Databricks в документации по Dataiku.
Дополнительные ресурсы
Изучите следующие ресурсы Dataiku: