次の方法で共有


ノートブックを使用してミラー化データベース内のデータを探索する

ノートブックの Spark クエリを使用して、ミラー化データベースからレプリケートされたデータを探索できます。

ノートブックは、データに対する Apache Spark ジョブと機械学習の実験を開発するための強力なコード項目です。 Fabric レイクハウスのノートブックを使用して、ミラー化テーブルを調べることができます。

前提条件

ショートカットを作成する

まず、ミラー化テーブルからレイクハウスへのショートカットを作成し、次にレイクハウスで Spark クエリを使用してノートブックを作成する必要があります。

  1. Fabric ポータルで、[データ エンジニア]を開きます。

  2. Lakehouse をまだ作成していない場合は、レイクハウスを選択し、名前を付けることで新しいレイクハウスを作成します。

  3. [データの取得] ->[新しいショートカット] を選択します。

  4. [Microsoft OneLake] を選択します。

  5. Fabric ワークスペース内のすべてのミラー化データベースを表示できます。

  6. ショートカットとして、レイクハウスに追加するミラー化データベースを選択します。

  7. ミラー化データベースから目的のテーブルを選択します。

  8. [次へ][作成] の順に選択します。

  9. エクスプローラーで、選択したテーブル データをレイクハウスに表示できるようになりました。 ミラー化データベース テーブルとデータを表示するレイクハウス エクスプローラーを示す、Fabric ポータルのスクリーンショット。

    ヒント

    レイクハウスで他のデータを直接追加したり、S3、ADLS Gen2 などのショートカットを使用したりできます。 レイクハウスの SQL 分析エンドポイントに移動し、これらすべてのソースのデータをミラー化データとシームレスに結合できます。

  10. Spark でこのデータを調べるには、任意のテーブルの横にある ... ドットを選択します。 [新しいノートブック] または [既存のノートブック] を選択して分析を開始します。 ノートブックでミラー化データベース テーブルを開くコンテキスト メニューを示す Fabric ポータルのスクリーンショット。

  11. ノートブックが自動的に開き、SELECT ... LIMIT 1000 Spark SQL クエリを使用してデータフレームが読み込まれます。

    • 新しいノートブックは、完全に読み込むのに最大 2 分かかる場合があります。 アクティブなセッションで既存のノートブックを使用することで、この遅延を回避できます。 Spark SQL クエリを使用した新しいノートブックのミラー化データベース テーブルからのデータを示す Fabric ポータルのスクリーンショット。