次の方法で共有


データ サイエンスおよびデータ エンジニアリングの Copilot の概要 (プレビュー)

重要

この機能は、プレビュー段階にあります。

データ サイエンスとデータ エンジニアリングの Copilot は、データの分析と視覚化に役立つ AI アシスタントです。 Lakehouse のテーブルとファイル、Power BI データセット、pandas/spark/fabric データフレームと連携し、ノートブックで回答とコード スニペットを直接提供します。 Copilot を使用する最も効果的な方法は、データフレームとしてデータを追加することです。 チャット パネルで質問できます。AI は、ノートブックにコピーするための応答またはコードを提供します。 データのスキーマとメタデータが認識され、データがデータフレームに読み込まれると、データ フレーム内のデータも認識されます。 データに関する分析情報の提供、視覚化用のコードの作成、データ変換のコードの提供を Copilot に依頼できます。また、ファイル名を認識して参照しやすくすることができます。 Copilot 複雑なコーディングを排除することで、データ分析を効率化します。

手記

ファブリック データ サイエンス向けデータ サイエンスおよびデータ エンジニアリングのための Copilot 入門

データ サイエンスとデータ エンジニアリングの Copilot を使用すると、データ分析と視覚化のタスクを処理するのに役立つ AI アシスタントとチャットできます。 ノートブック内の lakehouse テーブル、Power BI データセット、Pandas/Spark データフレームに関する Copilot の質問をすることができます。 自然言語やコード スニペットで回答します Copilot。 Copilot タスクに応じて、データ固有のコードを生成することもできます。 たとえば、データ サイエンスとデータ エンジニアリングの Copilot は、次のコードを生成できます。

  • グラフの作成
  • データのフィルター処理
  • 変換の適用
  • 機械学習モデル

まず、ノートブック リボンの Copilot アイコンを選択します。 Copilot チャット パネルが開き、ノートブックの上部に新しいセルが表示されます。 このセルは、Spark セッションが Fabric ノートブックに読み込まれるたびに実行する必要があります。 そうしないと、Copilot エクスペリエンスが正しく動作しません。 今後のリリースでは、この必要な初期化を処理するための他のメカニズムを評価中です。

リボンの [Copilot] ボタンを示すスクリーンショット。

次のコードを使用して、ノートブックの上部にあるセルを実行します。

#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot

セルが正常に実行されたら、Copilotを使用できます。 ノートブック内のセッションが閉じるたびに、ノートブックの上部にあるセルを再実行する必要があります。

成功したセルの実行を示すスクリーンショット。

Copilot 効果を最大化するには、テーブルまたはデータセットをノートブックのデータフレームとして読み込みます。 これにより、AI はデータにアクセスし、その構造と内容を理解できます。 次に、AI とのチャットを開始します。 ノートブック ツール バーのチャット アイコンを選択し、チャット パネルに質問または要求を入力します。 たとえば、次の質問を行うことができます。

  • "このデータセットの顧客の平均年齢は何ですか?
  • "地域別の売上の横棒グラフを表示する"

その他も含む。 Copilot 回答またはコードで応答します。このコードをコピーしてノートブックに貼り付けることができます。 データ サイエンスとデータ エンジニアリングの Copilot は、データを探索して分析するための便利な対話型の方法です。

Copilotを使用すると、ノートブック セル内でマジック コマンドを呼び出して、ノートブック内で直接出力を取得することもできます。 たとえば、応答に対する自然言語の回答については、次のような "%%chat" コマンドを使用して質問できます。

%%chat
What are some machine learning models that may fit this dataset?

コード生成を示すスクリーンショット。

または

%%code
Can you generate code for a logistic regression that fits this data?

ロジスティック回帰コードの生成を示すスクリーンショット。

データ サイエンスとデータ エンジニアリングの Copilot には、レイクハウス内のテーブルのスキーマとメタデータの認識もあります。 Copilot は、接続されたレイクハウス内のデータのコンテキストで関連情報を提供できます。 たとえば、次の質問を行うことができます。

  • "レイクハウスには何個のテーブルが含まれていますか?
  • "テーブル「顧客」の列は何ですか?"

lakehouse をノートブックに追加した場合、Copilot は関連情報で応答します。 Copilot は、ノートブックにアタッチされている任意のレイクハウスに追加されたファイル名を認識しています。 これらのファイルは、チャット内の名前で参照できます。 たとえば、lakehouse に sales.csv という名前のファイルがある場合は、"sales.csvからデータフレームを作成する" というメッセージを表示できます。 Copilot コードを生成し、チャット パネルに表示します。 ノートブックの Copilot を使用すると、さまざまなソースのデータに簡単にアクセスしてクエリを実行できます。 これを行うために正確なコマンド構文は必要ありません。

ヒント

  • チャット パネルの上部にあるほうきで、Copilot チャット パネルで会話を "クリア" します。 Copilot にセッション中の入力または出力に関する知識は保持されたままであり、これは現在の内容が紛らわしい場合に役立ちます。
  • チャット マジック ライブラリを使用して、プライバシー設定など、Copilotに関する設定を構成します。 既定の共有モードは、アクセスできるコンテキスト共有 Copilot を最大化するように設計されているため、副操縦に提供される情報を制限すると、応答の関連性に直接および大きな影響を与える可能性があります。
  • 最初 Copilot 起動すると、開始に役立つ一連の役に立つプロンプトが表示されます。 彼らは Copilotとの会話を開始するのに役立ちます. 後でプロンプトを参照するには、チャット パネルの下部にあるスパークル ボタンを使用します。
  • copilot チャットのサイドバーを "ドラッグ" してチャット パネルを展開したり、コードをより明確に表示したり、画面上の出力を読みやすくしたりできます。

制限

データサイエンスエクスペリエンスの Copilot 機能は現在、ノートブックに限定されています。 これらの機能には、Copilot チャット ウィンドウ、コード セル内で使用できる IPython マジック コマンド、コード セルに入力する際の自動コード候補が含まれます。 Copilot では、セマンティック リンクの統合を使用して Power BI セマンティック モデルを読み取ることもできます。

Copilot には、次の 2 つの主な用途があります。

  • 1 つは、ノートブック内のデータを調べて分析するように Copilot に依頼できます (たとえば、最初に DataFrame を読み込んでから、DataFrame 内のデータに関する Copilot を確認するなど)。
  • 2 つ目は、関連する予測モデル、さまざまな種類のデータ分析を実行するコード、完成したノートブックのドキュメントなど、データ分析プロセスに関するさまざまな提案を生成するように Copilot に依頼できます。

動きの速いライブラリまたは最近リリースされたライブラリを使用したコード生成には、不正確や製造が含まれる可能性があることに注意してください。