クリーン ルームでノートブックを実行する
重要
この機能はパブリック プレビュー段階にあります。
この記事では、クリーン ルームでノートブックを実行する方法について説明します。 ノートブックは、コラボレーターが共同でデータ分析を実行するために使用するインターフェイスです。
クリーン ルームにノートブックを追加する方法については、「クリーン ルームを作成する」を参照してください。
開始する前に
クリーン ルームでノートブックを実行するには、次の条件を満たす必要があります。
- クリーン ルームの所有者である。またはクリーン ルームに対して
EXECUTE CLEAN ROOM TASK
特権を持っている。 - ノートブックを作成しなかったコラボレーターである。 ノートブック作成者はノートブックを実行できません。 これにより、両方の当事者によるノートブックの暗黙的な承認が適用されます。
Note
作成者は、Databricks アカウントのクリーン ルームの所有者として自動的に割り当てられます。 コラボレーターの組織のメタストア管理者には、Databricks アカウントのクリーン ルームの所有権が自動的に割り当てられます。 所有権は譲渡することができます。 「Unity Catalog オブジェクトの所有権を管理する」を参照してください。
クリーン ルームでノートブックを実行する
クリーン ルームでノートブックを実行するには、カタログ エクスプローラーを使用する必要があります。
Azure Databricks ワークスペースで、 [カタログ] をクリックします。
[カタログ] ペインの上部にある 歯車アイコンをクリックし、[クリーン ルーム] を選択します。
または、[クイック アクセス] ページで [クリーン ルーム] > ボタンをクリックします。
一覧からクリーン ルームを選択します。
[ノートブック] でノートブックをクリックしてプレビュー モードで開きます。
[実行] ボタンをクリックします。
他のコラボレーターが共有しているノートブックのみを実行できます。
(省略可能) パラメーター付きのノートブックの実行 ダイアログで、 + 追加 をクリックして、ノートブック ジョブ タスクにパラメーター値を渡します。
ジョブ タスクのパラメーターの詳細については、「ジョブのパラメーター化」を参照してください。
確認のチェックボックスをオンにします。
[実行] をクリックします。
[詳細を表示する] をクリックして、実行の進行状況を表示します。
または、このページの [実行] に移動するか、ワークスペース サイドバーの [ワークフロー] をクリックして [ジョブ実行] タブに移動すると、実行の進行状況を表示できます。
ノートブックの実行結果を表示します。
実行が完了すると、ノートブックの結果が表示されます。 過去の実行を表示するには、[実行] に移動し、[開始時刻] 列のリンクをクリックします。
出力テーブルを使用してノートブックの出力を共有する
出力テーブルは、ノートブック実行によって生成され、ノートブック ランナーのメタストアと共有される一時的な読み取り専用テーブルです。 ノートブックが出力テーブルを作成する場合、ノートブック ランナーは 出力カタログでアクセスし ワークスペース内の他のユーザーと共有できます。 Databricks Clean Rooms での出力テーブルの作成と操作を参照してください。
Azure Databricks ワークフローを使用してクリーン ルーム ノートブックを実行する
Azure Databricks ジョブを使用してノートブックを実行し、出力テーブルでタスクを実行できるため、クリーン ルーム資産を含む複雑なワークフローを構築できます。 特にこれらの機能により、このようなワークフローが可能になります。
- Clean Room ノートブック タスクの種類では、ワークフロー タスクとしてクリーン ルーム ノートブックを選択して実行できます。 ジョブについては、 Clean Room ノートブック タスクを参照してください。
- ワークフローによって開始されるノートブックの実行では、他のワークフロー タスクから参照できる出力テーブルを生成できます。 Databricks Clean Rooms での出力テーブルの作成と操作を参照してください。
- ワークフローでは、 Task 値を使用できます ジョブ パラメーター値を渡して、クリーン ルーム ノートブックを取得したり、クリーン ルーム ノートブックの出力をキャプチャしたり、その出力を他のワークフロー タスクに渡したりできます。 「タスク値を使用してタスク間で情報を渡す」を参照してください。
たとえば、次の手順を実行して、動的に生成された出力スキーマ名をタスク間で伝達するワークフローを作成できます。
次のタスク値の設定を含むノートブックを実行するタスク Clean Rooms ノートブック タスクの種類のタスクを作成します。
dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
output_schema
値を参照して出力を処理する後続のタスクを作成します。