Dataiku に接続する
Dataiku は、データ準備、AutoML、MLOps 用のエンド ツー エンドの AI プラットフォームです。 Dataiku を使用して、Databricks SQL ウェアハウスと Azure Databricks クラスターを統合できます。
Partner Connect を使用して Dataiku に接続する
Note
Partner Connect では、Dataiku に対して SQL ウェアハウスのみがサポートされています。 クラスターを Dataiku に接続するには、手動で Dataiku に接続してください。
Partner Connect を使用して Azure Databricks ワークスペースを Dataiku に接続するには、次の操作を行います。
サイド バーで、 [Partner Connect] をクリックします。
パートナー タイルをクリックします。
Note
Dataiku タイルの内部にチェック マーク アイコンが表示されている場合、管理者が既に Partner Connect を使用して Dataiku をワークスペースに接続しています。 ステップ 5 に進みます。 パートナーは、Azure Databricks アカウントのメール アドレスを使用して、既存の Dataiku アカウントへのサインインを求めます。
ドロップダウン リストからカタログを選択し、[次へ] をクリックします。
Note
ワークスペースが Unity Catalog 対応であっても、パートナーが Partner Connect を使用した Unity Catalog をサポートしていない場合は、ワークスペースの既定のカタログが使用されます。 ワークスペースが Unity Catalog 対応ではない場合は、
hive_metastore
が使用されます。ドロップダウン リストからスキーマを選択し、[追加] をクリックします。 この手順を繰り返して、複数のスキーマを追加できます。
次へをクリックします。
パートナー Connect によって、ワークスペースに次のリソースが作成されます。
<PARTNER>_USER
という名前の Azure Databricks サービス プリンシパル。<PARTNER>_USER
サービス プリンシパルを使用して関連付けられている Azure Databricks 個人用アクセス トークン。
Partner Connect は、
<PARTNER>_USER
サービス プリンシパルに次の特権も付与します:- (Unity Catalog)
USE CATALOG
: 選択したカタログ内のオブジェクトを操作するために必要です。 - (Unity Catalog)
USE SCHEMA
: 選択したスキーマを読み取る権限を付与します。 - (Unity カタログ)
CREATE SCHEMA
: 選択したカタログにスキーマを作成する機能を付与します。 - (レガシ Hive メタストア)
USAGE
:hive_metastore
内のオブジェクトおよび選択したスキーマを操作するために必要です。 - (レガシ Hive メタストア)
CREATE
:hive_metastore
内にスキーマを作成する権限を付与します。 - (レガシ Hive メタストア) READ_METADATA: 選択したスキーマのメタデータを読み取る権限を付与します。
- (レガシ Hive メタストア) SELECT: 選択したスキーマを読み取る権限を付与します。
次へをクリックします。
[メール] ボックスに、Azure Databricks アカウントのメール アドレスが表示されます。 Dataiku はこのメール アドレスを使用して、新しいパートナー アカウントを作成するか、既存のパートナー アカウントにサインインすることを求めます。
[Dataiku に接続する] または [サインイン] をクリックします。
Web ブラウザーで新しいタブが開き、Dataiku Web サイトが表示されます。
Dataiku Web サイトの画面の指示どおりに実行して、14 日間の試用版 Dataiku アカウントを作成するか、既存の Dataiku アカウントにサインインします。
手動で Dataiku に接続する
このセクションでは、Azure Databricks ワークスペース内の既存の SQL ウェアハウスまたはクラスターを Dataiku に手動で接続する方法について説明します。
Note
Databricks SQL ウェアハウスの場合、Partner Connect を使用して Dataiku に接続する方法が簡単です。
要件
Dataiku に手動で接続する前に、次のものが必要です。
Azure Databricks ワークスペース内のクラスターまたは SQL ウェアハウス。
クラスターまたは SQL ウェアハウスの接続の詳細。具体的には、[サーバーのホスト名]、[ポート]、および [HTTP パス] の値です。
Azure Databricks 個人用アクセス トークンまたは Microsoft Entra ID (旧称 Azure Active Directory) トークン。 個人用アクセス トークンを作成するには、「ワークスペース ユーザーの Azure Databricks 個人用アクセス トークンの手順に従います。
Note
セキュリティのベスト プラクティスとして、自動化ツール、システム、スクリプト、アプリを使用して認証する場合、Databricks では、ワークスペース ユーザーではなくサービス プリンシパルに属する個人用アクセス トークンを使用することを推奨しています。 サービス プリンシパルのトークンを作成するには、「サービス プリンシパルのトークンを管理する」をご覧ください。
接続する手順
Dataiku に手動で接続するには、Dataiku のドキュメントの「Databricks」に従います。
その他のリソース
次の Dataiku リソースを確認してください。