Databricks Assistant とは?
Databricks アシスタントは、ノートブック、クエリ、ダッシュボード、ファイルを作成する際の効率性を高める AI ベースのペアプログラマ兼サポート エージェントです。 これは、コードとクエリを生成、最適化、完了、説明、修正することで、質問に迅速に答えるのに役立ちます。
このページには、アシスタントに関する一般的な情報が記載されています。 プライバシーとセキュリティに関する質問については、「プライバシーとセキュリティ」を参照してください。
Databricks アシスタントはどのように役立ちますか?
Databricks アシスタントは、次のタスクに役立ちます。
- コードの生成、デバッグ、最適化、説明。 を参照
- AI/BI ダッシュボードでデータ視覚化を作成します。 Databricks アシスタントを使用した視覚化の作成についてを参照してください。
- デバッグ ジョブ (パブリック プレビュー機能)。 「デバッグ ジョブ」を参照してください。
- 自然言語を使用して、データの分析、視覚化の作成、データのフィルター処理を行います。 「Databricks Genie とは?」と「自然言語プロンプトを使用したデータのフィルター処理」を参照してください。
- Azure Databricks のドキュメントで関連するヘルプを参照してください。
アシスタントでは、テーブル、列、説明、社内全体でよく使用されるデータ資産を理解し、パーソナライズされた応答を提供するために、Unity Catalog のメタデータが使用されます。
Databricks アシスタントによって生成されるコードは、Databricks コンピューティング環境内での実行用です。 Databricks でサポートされているプログラミング言語、フレームワーク、方言でコードを作成するように最適化されています。 汎用プログラミング アシスタントとしては意図されていません。 アシスタントは、Databricks ドキュメント Web サイトやナレッジ ベースなどの Databricks リソースからの情報を使用して、ユーザー クエリにより的確に回答します。 ユーザーの質問が、ワークスペースの Databricks ドキュメント、Unity Catalog,、およびユーザー コードの知識を使用して回答できる質問に関連している場合に最適です。
Databricks Assistant からコーディングのヘルプを取得する
Databricks アシスタントにアクセスするには、ノートブック、ファイル エディター、SQL エディター、またはダッシュボードの [データ] タブの左側のサイドバーにある Assistant アイコンをクリックします。
[アシスタント] ウィンドウは、画面の左側または右側で開くことができます。
エラーが発生する場合があるため、ユーザーは、実行前にアシスタントによって生成されたコードを常に確認する必要があります。
Databricks アシスタントを使用して視覚化を作成する
Databricks アシスタントは、ダッシュボードのドラフトを作成するときに使用できます。 既存のダッシュボード データセットで視覚化を作成するときに、生成されたグラフの形式で応答を受け取るように質問をアシスタントに表示します。 ダッシュボードでアシスタントを使用するには、まず 1 つ以上のデータセットを作成してから、キャンバスに視覚化ウィジェットを追加します。 視覚化ウィジェットには、新しいグラフを説明するプロンプトが含まれています。 表示するグラフの説明を入力すると、アシスタントによって生成されます。 グラフを承認または却下したり、説明を変更して新しいものを生成したりできます。
ダッシュボードでアシスタントを使用する方法の詳細と例については、「Databricks アシスタントを使用して視覚化を作成する」を参照してください。
Databricks アシスタントによって使用されるサービス
Databricks Assistant は、Azure OpenAI サービスを使用して応答を提供します。
Azure OpenAI サービスは、OpenAI ではなく Microsoft によって運営されており、それぞれのデータ管理ポリシーが適用されます。 このサービスに送信されるデータは、モデル トレーニングには使用されません。 詳細については、Azure データ管理ポリシーに関する記事を参照してください。
Azure OpenAI の場合、Azure Databricks は 不正使用の監視 をオプトアウトしているため、Azure OpenAI でプロンプトや応答が格納されません。
結果の正確性を向上させるヒント
プロンプト “Find Tables” を使用すると、より良い応答が得られます。 テーブルのデータについて質問する前に、件名やその他の特徴から関連するテーブルを検索するようアシスタントに依頼します。 例:
Find tables related to NFL games
。必要な応答の構造を指定します。 Databricks アシスタントが提供する構造と詳細は、同じプロンプトであっても異なります。 Databricks アシスタントはテーブルと列のスキーマとメタデータを把握しているため、自然言語を使用して質問できます。 例:
s.player_id
やs.attempts
などの列のデータを使用したList active and retired NFL quarterbacks' passing completion rate, for those who had over 500 attempts in a season.
アシスタントの回答。行レベルのデータ値の例を示します。 Databricks アシスタントは行レベルのデータにアクセスできません。したがって、より正確な回答のためにはデータの例を示します。 例:
List the average height for each position in inches
。 データセットが6-2
のようにフィートとインチで身長を示しているため、これはエラーを返します。[アシスタント] ウィンドウでコード スニペットを実行してテストします。 [アシスタント] ウィンドウは、クエリとアシスタントの回答の繰り返しを保存するスクラッチ パッドとして使用します。 ノートブックに追加する準備ができるまで、ウィンドウでコードを実行したり編集したりすることができます。
ノートブックでセル アクションを使用します。 セル アクションには、コードの文書化 (コメント)、修正、説明などの一般的なタスクへのショートカットが含まれます。
完全に図解された例については、「Databricks アシスタントの 5 つのヒント」を参照してください。
Databricks Assistant では会話の履歴が考慮されるため、質問を調整できます。
Databricks アシスタントの価格はどうなっていますか?
Databricks アシスタントの現在の機能はすべて、どのようなお客様でも追加コストなしで利用できます。
ユーザーが支払いを行うのは、ノートブック、クエリ、ジョブなどを実行するために使用するコンピューティングに対してだけです。 乱用を防ぐために適度な使用制限が設定されています。 ほとんどのユーザーはこれらの制限の影響を受けません。
フィードバックを送る
フィードバックを送信する最良の方法は、ノートブックと SQL エディターの「フィードバックの提供」リンクを使用することです。 assistant-feedback@databricks.com またはアカウント チームにメールを送信することもできます。
迅速な正確性に関するフィードバックよりも、製品の改善に関する提案やユーザー エクスペリエンスの問題を共有してください。 アシスタントから役に立たない提案を受け取った場合は、「役に立たなかった」 ボタンをクリックしてください。
アシスタント機能の利用可能地域
Databricks アシスタントは、顧客コンテンツを処理するときにデータの保管場所を管理するために地域を使用する指定サービスです。 さまざまな地域でアシスタント機能を利用できるかどうかの詳細については、Databricks の指定サービスに関する記事を参照してください。
プライバシーとセキュリティ
Q: モデルにはどのようなデータが送信されますか?
Databricks Assistant は、各 API 要求でコードとメタデータをモデルに送信します。 これは、データに対してより関連性の高い結果を返すのに役立ちます。 以下に例を示します。
- 現在のノートブックのセルまたは SQL エディター タブのコード/クエリ
- テーブルと列の名前と説明
- 以前の質問
- お気に入りのテーブル
Q: モデルに送信されるメタデータでは、ユーザーの Unity Catalog のアクセス許可を尊重しますか?
はい。モデルに送信されるすべてのデータでは、ユーザーの Unity Catalog のアクセス許可が尊重されるため、表示するアクセス許可がユーザーにないテーブルに関連するメタデータは送信されません。
Q: 結果を含むクエリを実行してから質問した場合、クエリの結果はモデルに送信されますか?
いいえ、セル内のコード内容、テーブルに関するメタデータ、ユーザーが入力したテキストのみがモデルと共有されます。 “エラー修正” 機能の場合、Databricks はエラー出力からのスタック トレースも共有します。
Q: Databricks Assistant は危険なコードを実行しますか?
いいえ。 Databricks アシスタントは、ユーザーに代わってコードを自動的に実行しません。 AI モデルは間違いを犯したり、意図を誤解したり、幻覚を見せたり、間違った答えを出したりする可能性があります。 AI で生成されたコードを実行する前に確認してテストします。
Q: Databricks は Assistant 応答の正確性と妥当性の評価を行いましたか?
はい。 Databricks には、アシスタントによってヘイト スピーチ、安全でないコード、プロンプトのジェイルブレイク、サードパーティの著作権コンテンツなどの有害な応答を生成するのを防ぐための軽減策があります。 Databricks では、軽減策の堅牢性を評価するために、シミュレートされたユーザーによる何千もの入力を使用して、すべての AI 支援機能の広範なテストを行いました。 これらの評価では、Python、Databricks SQL、R、Scala 言語でのコード生成など、Assistant で想定されるユース ケースに重点を置きました。
Q: 規制対象データ (PHI、PCI、IRAP、FedRAMP) を処理するテーブルで Databricks アシスタントを使用できますか?
はい。 使用するには、コンプライアンス セキュリティ プロファイルを有効にするなどの要件に準拠し、コンプライアンス セキュリティ プロファイル構成の一部として関連するコンプライアンス標準を追加する必要があります。