Microsoft Fabric を使用してレイクハウスを実装する

中級
データ アナリスト
データ エンジニア
データ サイエンティスト
Microsoft Fabric

このラーニング パスでは、Microsoft Fabric を使用してデータ レイクハウスを実装するための基本的なコンポーネントについて説明します。

前提条件

基本的なデータの概念と用語を理解している必要があります。

このラーニング パス内のモジュール

Microsoft Fabric を使用して 1 つのプラットフォームで企業の分析ニーズを満たす方法について説明します。 Microsoft Fabric とそのしくみについて学習し、分析ニーズに対して使用する方法を特定します。

レイクハウスは、データ レイク ストレージの柔軟性とデータ ウェアハウス分析を組み合わせたものです。 Microsoft Fabric には、単一の SaaS プラットフォームでの包括的な分析のためのレイクハウス ソリューションが用意されています。

Apache Spark は、大規模なデータ分析のためのコア テクノロジです。 Microsoft Fabric は、Spark クラスターに対するサポートを備えており、Lakehouse での大規模なデータの分析と処理が可能です。

Microsoft Fabric Lakehouse のテーブルは、Apache Spark でよく使われる Delta Lake ストレージ形式に基づいています。 デルタ テーブルの強化された機能を使うと、高度な分析ソリューションを作成できます。

分析ではデータ インジェストが重要です。 Microsoft Fabric の Data Factory には、Power Query Online を使用して複数ステップのデータ インジェストと変換を視覚的に作成するためのデータフローが用意されています。

Microsoft Fabric には、データ インジェストと変換のタスクを調整するパイプラインを作成する機能など、Data Factory の機能が含まれています。

Microsoft Fabric での medallion アーキテクチャ設計の可能性を調べます。 分析を最適化するために、レイクハウスのブロンズ、シルバー、ゴールドの各レイヤーでデータを整理して変換します。