連線至 Dataiku
Dataiku 是用於資料準備、AutoML 和 MLOps 的端對端 AI 平台。 可以將 Databricks SQL 倉儲和 Azure Databricks 叢集與 Dataiku 整合。
使用 Partner Connect 連線到 Dataiku
注意
Partner Connect 僅支援適用於 Dataiku 的 SQL 倉儲。 若要將叢集連線至 Dataiku,請手動連線至 Dataiku。
若要使用 Partner Connect 將 Azure Databricks 工作區連線至 Dataiku,請執行下列操作:
在側邊欄中,按一下 [Partner Connect]。
按一下合作夥伴圖格。
注意
如果 Dataiku 圖標內有核取記號圖示,管理員已使用 Partner Connect 將 Dataiku 連線到您的工作區。 跳到步驟 5。 合作夥伴會使用 Azure Databricks 帳戶的電子郵件地址,提示您登入現有的 Dataiku 帳戶。
從下拉式清單中選取目錄,然後按一下 [下一步]。
注意
如果工作區已啟用 Unity Catalog,但是合作夥伴不支援具有 Partner Connect 的 Unity Catalog,則會使用工作區預設目錄。 如果您的工作區未啟用 Unity 目錄,則會使用
hive_metastore
。從下拉式清單中選取結構描述,然後按一下 [新增]。 您可以重複此步驟以新增多個結構描述。
按一下 [下一步] 。
Partner Connect 會在您的工作區中建立下列資源:
Partner Connect 也會將下列權限授與給
<PARTNER>_USER
服務主體:- (Unity Catalog)
USE CATALOG
:需要與所選目錄內的物件互動。 - (Unity Catalog)
USE SCHEMA
:授與讀取所選結構描述的能力。 - (Unity Catalog)
CREATE SCHEMA
:授與在所選目錄內建立結構描述的能力。 - (舊版 Hive 中繼存放區)
USAGE
:需要與hive_metastore
內的物件和所選結構描述互動。 - (舊版 Hive 中繼存放區)
CREATE
:授與在hive_metastore
中建立結構描述的能力。 - (舊版 Hive 中繼存放區) READ_METADATA:授與針對所選結構描述讀取中繼資料的能力。
- (舊版 Hive 中繼存放區) SELECT:授與讀取所選結構描述的能力。
- (Unity Catalog)
按一下 [下一步] 。
[電子郵件] 方塊會顯示 Azure Databricks 帳戶的電子郵件地址。 Dataiku 會使用此電子郵件地址提示您建立新的合作夥伴帳戶,或登入您現有的合作夥伴帳戶。
按一下 [連線到 Dataiku] 或 [登入]。
新的索引標籤會在網頁瀏覽器中開啟,其中顯示 Dataiku 網站。
完成 Dataiku 網站中畫面上的指示,以建立您的試用 Dataiku 帳戶或登入現有的 Dataiku 帳戶。
手動連線至 Dataiku
本節介紹如何在 Azure Databricks 工作區中手動將現有 SQL 倉儲或叢集連線至 Dataiku。
注意
針對 Databricks SQL 倉儲,您可以使用 Partner Connect 連線至 Dataiku,以簡化體驗。
需求
在手動連線到 Dataiku 之前,您需要下列內容:
Azure Databricks 工作區中的叢集或 SQL 倉儲。
叢集或 SQL 倉儲的連線詳細資料,特別是伺服器主機名稱、連接埠和 HTTP 路徑值。
Azure Databricks 個人存取權杖或 Microsoft Entra ID (先前稱為 Azure Active Directory) 權杖。 若要建立個人存取令牌,請遵循適用於工作區使用者的 Azure Databricks 個人存取令牌中的步驟。
連線的步驟
若要手動連線到 Dataiku,請遵循 Dataiku 文件中的 Databricks。
其他資源
探索下列 Dataiku 資源: