连接到 Preset

Preset 为你的整个组织提供新式商业智能。 Preset 提供强大且易于使用的数据浏览和可视化平台,该平台由开源 Apache Superset 提供支持。

可以将 Databricks SQL 仓库(以前称为 Databricks SQL 终结点)和 Azure Databricks 群集与 Preset 集成。

使用 Partner Connect 连接到 Preset

若要使用 Partner Connect 将 Azure Databricks 工作区连接到 Preset,请参阅使用 Partner Connect 连接到 BI 合作伙伴

注意

对于 Preset,Partner Connect 仅支持 Databricks SQL 仓库。 若要将 Azure Databricks 工作区中的群集连接到 Preset,请手动连接到 Preset。

手动连接到 Preset

在本部分中,你将 Azure Databricks 工作区中的现有 SQL 仓库或群集连接到 Preset。

注意

对于 SQL 仓库,可以使用 Partner Connect 来简化连接过程。

要求

在手动与 Preset 集成之前,必须具备以下条件:

  • Azure Databricks 工作区中的群集或 SQL 仓库。

  • 群集或 SQL 仓库的连接详细信息,特别是“服务器主机名”、“端口”和“HTTP 路径”值。

  • Azure Databricks 个人访问令牌Microsoft Entra ID(以前称为 Azure Active Directory)令牌…… 若要创建个人访问令牌,请执行以下操作:

    1. 在 Azure Databricks 工作区中,单击顶部栏中的 Azure Databricks 用户名,然后从下拉列表中选择“设置”。
    2. 单击“开发人员”。
    3. 在“访问令牌”旁边,单击“管理”。
    4. 单击“生成新令牌”。
    5. (可选)输入有助于将来识别此令牌的注释,并将令牌的默认生存期更改为 90 天。 若要创建没有生存期的令牌(不建议),请将“生存期(天)”框留空(保留空白)。
    6. 单击“生成” 。
    7. 将显示的令牌复制到安全位置,然后单击“完成”。

    注意

    请务必将复制的令牌保存到安全的位置。 请勿与他人共享复制的令牌。 如果丢失了复制的令牌,你将无法重新生成完全相同的令牌, 而必须重复此过程来创建新令牌。 如果丢失了复制的令牌,或者认为令牌已泄露,Databricks 强烈建议通过单击“访问令牌”页上令牌旁边的垃圾桶(撤销)图标立即从工作区中删除该令牌。

    如果你无法在工作区中创建或使用令牌,可能是因为工作区管理员已禁用令牌或未授予你创建或使用令牌的权限。 请与工作区管理员联系,或参阅以下主题:

    注意

    作为安全最佳做法,在使用自动化工具、系统、脚本和应用进行身份验证时,Databricks 建议使用属于服务主体(而不是工作区用户)的个人访问令牌。 若要为服务主体创建令牌,请参阅管理服务主体的令牌

连接步骤

若要手动连接到 Preset,请执行以下操作:

  1. 创建新的 Preset 帐户,或登录到现有的 Preset 帐户

  2. 单击“+ 工作区”。

  3. 在“添加新工作区”对话框中,输入工作区的名称,选择离你最近的工作区区域,然后单击“保存”。

  4. 通过单击工作区磁贴打开工作区。

  5. 在工具栏上,单击“目录”>“数据库”。

  6. 单击“+ 数据库”。

  7. 在“连接数据库”对话框的“受支持的数据库”列表中,选择以下项之一:

    • 对于 SQL 仓库,请选择“Databricks SQL 仓库”。
    • 对于群集,请选择“Databricks 交互式群集”。
  8. 对于“SQLAlchemy URI”,请输入以下值:

    对于 SQL 仓库:

    databricks+pyodbc://token:{access token}@{server hostname}:{port}/{database name}
    

    对于群集:

    databricks+pyhive://token:{access token}@{server hostname}:{port}/{database name}
    

    将:

    • {access token} 使用要求中的 Azure Databricks 个人访问令牌值<!– 或 Azure Active Directory 令牌值 –>
    • {server hostname} 替换为要求中的“服务器主机名”值。
    • {port} 替换为要求中的“端口”值。
    • {database name} 替换为 Azure Databricks 工作区中的目标数据库的名称。

    例如,对于 SQL 仓库:

    databricks+pyodbc://token:dapi...@adb-1234567890123456.7.azuredatabricks.net:443/default
    

    例如,对于群集,请执行以下操作:

    databricks+pyhive://token:dapi...@adb-1234567890123456.7.azuredatabricks.net:443/default
    
  9. 单击“高级”选项卡,展开“其他”。

  10. 对于“引擎参数”,请输入以下值:

    对于 SQL 仓库:

    {"connect_args": {"http_path": "sql/1.0/warehouses/****", "driver_path": "/opt/simba/spark/lib/64/libsparkodbc_sb64.so"}}
    

    对于群集:

    {"connect_args": {"http_path": "sql/protocolv1/o/****"}}
    

    sql/protocolv1/o/**** 替换为要求中的“HTTP 路径”值。

    例如,对于 SQL 仓库:

    {"connect_args": {"http_path": "sql/1.0/warehouses/ab12345cd678e901", "driver_path": "/opt/simba/spark/lib/64/libsparkodbc_sb64.so"}}
    

    例如,对于群集,请执行以下操作:

    {"connect_args": {"http_path": "sql/protocolv1/o/1234567890123456/1234-567890-buyer123"}}
    
  11. 单击“基本”选项卡,然后单击“测试连接”。

    注意

    有关连接故障排除,请参阅 Preset 网站上的 Databricks 的数据库连接演练

  12. 在连接成功后,单击“连接”。

后续步骤

Preset 网站上浏览以下一个或多个资源: