连接到 Dataiku
Dataiku 是用于数据准备、AutoML 和 MLOps 的端到端 AI 平台。 你可以将 Databricks SQL 仓库和 Azure Databricks 群集与 Dataiku 集成。
使用 Partner Connect 连接到 Dataiku
注意
对于 Dataiku,Partner Connect 仅支持 SQL 仓库。 若要将群集连接到 Dataiku,请手动连接到 Dataiku。
要使用 Partner Connect 将 Azure Databricks 工作区连接到 Dataiku,请执行以下操作:
在边栏中单击 “Partner Connect”。
单击合作伙伴磁贴。
注意
如果 Dataiku 磁贴内有复选标记图标,则意味着管理员已使用 Partner Connect 将 Dataiku 连接到你的工作区。 跳到步骤 5。 合作伙伴将使用你的 Azure Databricks 帐户的电子邮件地址来提示你登录现有的 Dataiku 帐户。
从下拉列表中选择目录,然后单击“下一步”。
注意
如果工作区已启用 Unity Catalog,但合作伙伴不支持具有 Partner Connect 的 Unity Catalog,则使用工作区默认目录。 如果工作区未启用 Unity Catalog,则使用
hive_metastore
。从下拉列表中选择架构,然后单击“添加”。 可以重复此步骤以添加多个架构。
单击“下一步”。
Partner Connect 在工作区中创建以下资源:
Partner Connect 还向
<PARTNER>_USER
服务主体授予以下权限:- (Unity Catalog)
USE CATALOG
:与所选目录中的对象进行交互所需。 - (Unity Catalog)
USE SCHEMA
:授予读取所选架构的能力。 - (Unity Catalog)
CREATE SCHEMA
:授予在所选目录中创建架构的能力。 - (旧版 Hive 元存储)
USAGE
:与所选架构中的hive_metastore
对象交互时必需。 - (旧版 Hive 元存储)
CREATE
:授予在hive_metastore
中创建架构的能力。 - (旧版 Hive 元存储)READ_METADATA:授予读取所选架构的元数据的权利。
- (旧版 Hive 元存储)SELECT:授予读取所选架构的能力。
- (Unity Catalog)
单击“下一步”。
“电子邮件”框显示 Azure Databricks 帐户的电子邮件地址。 Dataiku 使用此电子邮件地址提示你创建新的合作伙伴帐户或登录到现有的合作伙伴帐户。
单击“连接到 Dataiku”或“登录”。
此时会在 Web 浏览器中打开一个新标签页,其中显示 Dataiku 网站。
完成 Dataiku 网站上的屏幕说明,以创建试用版 Dataiku 帐户或登录到现有的 Dataiku 帐户。
手动连接到 Dataiku
本部分介绍如何将 Azure Databricks 工作区中的现有 SQL 仓库或群集手动连接到 Dataiku。
注意
对于 Databricks SQL 仓库,可以使用 Partner Connect 来连接到 Dataiku,从而简化连接过程。
要求
手动连接到 Dataiku 之前,需要具备以下各项:
Azure Databricks 工作区中的群集或 SQL 仓库。
群集或 SQL 仓库的连接详细信息,特别是“服务器主机名”、“端口”和“HTTP 路径”值。
Azure Databricks 个人访问令牌或 Microsoft Entra ID(以前称为 Azure Active Directory)令牌…… 若要创建个人访问令牌,请遵循工作区用户的 Azure Databricks 个人访问令牌中的步骤。
连接步骤
若要手动连接到 Dataiku,请按照 Dataiku 文档中的 Databricks 进行操作。
其他资源
浏览以下 Dataiku 资源: