レイクハウス内のデータを探索して変換する
データの変換と読み込み
ほとんどのデータには、テーブルに読み込む前に変換が必要です。 生データをレイクハウスに直接取り込んだ後、変換してテーブルに読み込むこともできます。 ETL 設計に関係なく、同じツールを使用してデータを取り込むだけで、データを変換して読み込むことができます。 次に、変換されたデータは、ファイルまたは Delta テーブルとして読み込むことができます。
- ノートブックは、PySpark、SQL、Scala など、さまざまなプログラミング言語に精通しているデータ エンジニアに好まれます。
- データフロー Gen2 は、PowerQuery インターフェイスを使用する、Power BI または Excel に精通している開発者に最適です。
- パイプラインには、ETL プロセスを実行および調整するためのビジュアル インターフェイスが備わっています。 パイプラインは、必要に応じて単純にも複雑にもなります。
レイクハウス内のデータを分析して視覚化する
データは取り込まれ、変換され、読み込まれたら、他のユーザーが使用できるようになります。 Fabric 項目には、あらゆる組織に必要な柔軟性が備わっているため、自分に最も合ったツールを使用できます。
- データ サイエンティストは、ノートブックまたは Data Wrangler を使用して、AI 用の機械学習モデルを探索してトレーニングできます。
- レポート開発者は、セマンティック モデルを使用して Power BI レポートを作成できます。
- アナリストは、SQL 分析エンドポイントを使用して、レイクハウス テーブル内のデータのクエリ、フィルター処理、集計、その他の探索を行うことができます。
Power BI のデータの可視化機能と、データ レイクハウスの一元的なストレージおよび表形式スキーマを組み合わせて、1 つのプラットフォームにエンドツーエンドの分析ソリューションを実装できます。