Dataiku に接続する
Dataiku は、データ準備、Mosaic AutoML、MLOps 用のエンド ツー エンドの AI プラットフォームです。 Dataiku を使用して、Databricks SQL ウェアハウスと Azure Databricks クラスターを統合できます。
Partner Connect を使用して Dataiku に接続する
Note
Partner Connect では、Dataiku に対して SQL ウェアハウスのみがサポートされています。 クラスターを Dataiku に接続するには、手動で Dataiku に接続してください。
Partner Connect を使用して Azure Databricks ワークスペースを Dataiku に接続するには、次の操作を行います。
サイド バーで、 [Partner Connect] をクリックします。
パートナー タイルをクリックします。
Note
Dataiku タイルの内部にチェック マーク アイコンが表示されている場合、管理者が既に Partner Connect を使用して Dataiku をワークスペースに接続しています。 ステップ 5 に進みます。 パートナーは、Azure Databricks アカウントのメール アドレスを使用して、既存の Dataiku アカウントへのサインインを求めます。
ドロップダウン リストからカタログを選択し、[次へ] をクリックします。
Note
ワークスペースが Unity Catalog 対応であっても、パートナーが Partner Connect を使用した Unity Catalog をサポートしていない場合は、ワークスペースの既定のカタログが使用されます。 ワークスペースが Unity Catalog 対応ではない場合は、
hive_metastore
が使用されます。ドロップダウン リストからスキーマを選択し、[追加] をクリックします。 この手順を繰り返して、複数のスキーマを追加できます。
次へをクリックします。
パートナー Connect によって、ワークスペースに次のリソースが作成されます。
<PARTNER>_USER
という名前の Azure Databricks サービス プリンシパル。<PARTNER>_USER
サービス プリンシパルを使用して関連付けられている Azure Databricks 個人用アクセス トークン。
Partner Connect は、
<PARTNER>_USER
サービス プリンシパルに次の特権も付与します:- (Unity Catalog)
USE CATALOG
: 選択したカタログ内のオブジェクトを操作するために必要です。 - (Unity Catalog)
USE SCHEMA
: 選択したスキーマを読み取る権限を付与します。 - (Unity カタログ)
CREATE SCHEMA
: 選択したカタログにスキーマを作成する機能を付与します。 - (レガシ Hive メタストア)
USAGE
:hive_metastore
内のオブジェクトおよび選択したスキーマを操作するために必要です。 - (レガシ Hive メタストア)
CREATE
:hive_metastore
内にスキーマを作成する権限を付与します。 - (レガシ Hive メタストア) READ_METADATA: 選択したスキーマのメタデータを読み取る権限を付与します。
- (レガシ Hive メタストア) SELECT: 選択したスキーマを読み取る権限を付与します。
次へをクリックします。
[メール] ボックスに、Azure Databricks アカウントのメール アドレスが表示されます。 Dataiku はこのメール アドレスを使用して、新しいパートナー アカウントを作成するか、既存のパートナー アカウントにサインインすることを求めます。
[Dataiku に接続する] または [サインイン] をクリックします。
Web ブラウザーで新しいタブが開き、Dataiku Web サイトが表示されます。
Dataiku Web サイトの画面の指示どおりに実行して、14 日間の試用版 Dataiku アカウントを作成するか、既存の Dataiku アカウントにサインインします。
手動で Dataiku に接続する
このセクションでは、Azure Databricks ワークスペース内の既存の SQL ウェアハウスまたはクラスターを Dataiku に手動で接続する方法について説明します。
Note
Databricks SQL ウェアハウスの場合、Partner Connect を使用して Dataiku に接続する方法が簡単です。
要件
Dataiku に手動で接続する前に、次のものが必要です。
Azure Databricks ワークスペース内のクラスターまたは SQL ウェアハウス。
クラスターまたは SQL ウェアハウスの接続の詳細。具体的には、[サーバーのホスト名]、[ポート]、および [HTTP パス] の値です。
Azure Databricks 個人用アクセス トークンまたは Microsoft Entra ID (旧称 Azure Active Directory) トークン。 個人用アクセス トークンを作成するには、次の操作を行います。
- Azure Databricks ワークスペースの上部バーで、目的の Azure Databricks ユーザー名をクリックし、次にドロップダウンから [設定] を選択します。
- [開発者] をクリックします。
- [アクセス トークン] の横にある [管理] をクリックします。
- [新しいトークンの生成] をクリックします。
- (省略可能) 将来このトークンを識別するのに役立つコメントを入力し、トークンの既定の有効期間 90 日を変更します。 有効期間のないトークンを作成するには (推奨されません)、[有効期間 (日)] ボックスを空のままにします。
- [Generate](生成) をクリックします。
- 表示されたトークンを安全な場所にコピーし、[完了] をクリックします。
Note
コピーしたトークンは必ず安全な場所に保存してください。 コピーしたトークンは他人に見せないでください。 コピーしたトークンを失った場合、それとまったく同じトークンは再生成できません。 代わりに、この手順を繰り返して新しいトークンを作成する必要があります。 コピーしたトークンを紛失した場合や、トークンが侵害されていると思われる場合、Databricks では、[アクセス トークン] ページのトークンの横にあるごみ箱 ([取り消し]) アイコンをクリックして、ワークスペースからそのトークンをすぐに削除することを強くお勧めします。
ワークスペースでトークンを作成することや使用することができない場合は、ワークスペース管理者によってトークンが無効にされているか、トークンを作成または使用する権限が作業者に付与されていない可能性があります。 ワークスペース管理者に連絡するか、以下のトピックを参照してください。
Note
セキュリティのベスト プラクティスとして、自動化ツール、システム、スクリプト、アプリを使用して認証する場合、Databricks では、ワークスペース ユーザーではなくサービス プリンシパルに属する個人用アクセス トークンを使用することを推奨しています。 サービス プリンシパルのトークンを作成するには、「サービス プリンシパルのトークンを管理する」をご覧ください。
接続する手順
Dataiku に手動で接続するには、Dataiku のドキュメントの「Databricks」に従います。
その他のリソース
次の Dataiku リソースを確認してください。