Microsoft Fabric のレイクハウスとは
Microsoft Fabric Lakehouse は、構造化データと非構造化データを 1 つの場所に格納、管理、分析するためのデータ アーキテクチャ プラットフォームです。 これは、組織がさまざまなツールとフレームワークを使用して大量のデータを処理し、そのデータを処理および分析できるようにする柔軟でスケーラブルなソリューションです。 他のデータ管理および分析ツールと統合して、データ エンジニアリングと分析のための包括的なソリューションを提供します。 Lakehouse は、データ レイクのスケーラビリティとデータ ウェアハウスのパフォーマンスと構造を組み合わせ、データ ストレージ、管理、分析のための統合プラットフォームを提供します。
Lakehouse SQL 分析エンドポイント
Lakehouse は、作成時に SQL 分析エンドポイントと既定のセマンティック モデルを自動的に生成することで、サービス レイヤーを作成します。 この新しいシースルー機能を使用すると、ユーザーはレイク内の Delta テーブルの上で直接作業し、データ インジェストからレポートまで、摩擦のないパフォーマンスの高いエクスペリエンスを提供できます。
SQL 分析エンドポイント は読み取り専用のエクスペリエンスであり、トランザクション データ ウェアハウスの完全な T-SQL サーフェス領域をサポートしていない点に注意してください。
手記
SQL 分析エンドポイントでは、Delta 形式のテーブルのみを使用できます。 Parquet、CSV、およびその他の形式は、SQL 分析エンドポイントを使用してクエリを実行できません。 テーブルが表示されない場合は、Delta 形式に変換する必要があります。
テーブルの自動検出と登録
テーブルの自動検出と登録は、データ エンジニアやデータ サイエンティストにテーブル エクスペリエンスを提供するフル マネージド ファイルを提供する Lakehouse の機能です。 ファイルを Lakehouse の管理領域にドロップすると、サポートされている構造化形式がシステムによって自動的に検証され、列名、形式、圧縮などの必要なメタデータを使用してメタストアに登録されます。 (現在サポートされている唯一の形式は Delta テーブルです)。その後、ファイルをテーブルとして参照し、SparkSQL 構文を使用してデータを操作できます。
レイクハウス アイテムの操作
データ エンジニアは、複数の方法でレイクハウスとレイクハウス内のデータを操作できます。
Lakehouse エクスプローラー: エクスプローラーは、Lakehouse のメイン操作ページです。 レイクハウスにデータを読み込み、オブジェクト エクスプローラーを使用してレイクハウス内のデータを探索し、MIP ラベル & その他を設定できます。 エクスプローラーのエクスペリエンスの詳細については、「Fabric Lakehouse エクスプローラーを操作する」を参照してください。
Notebooks: データ エンジニアは、ノートブックを使用して、テーブルやフォルダーとして Lakehouse に直接読み取り、変換、書き込みを行うコードを記述できます。 Lakehouse のノートブックの使用方法の詳細については、「ノートブック を使用して Lakehouse 内のデータを探索する」と「ノートブックを使用して Lakehouseにデータを読み込む方法」を参照してください。
Pipelines: データ エンジニアは、パイプライン コピー ツールなどのデータ統合ツールを使用して、他のソースからデータをプルし、Lakehouse に移動できます。 コピー アクティビティの使用方法の詳細については、「コピー アクティビティを使用してデータをコピーする方法」を参照してください。
Apache Spark ジョブ定義: データ エンジニアは、堅牢なアプリケーションを開発し、Java、Scala、Python でコンパイルされた Spark ジョブの実行を調整できます。 Spark ジョブの詳細については、「Apache Spark ジョブ定義とは」を参照してください。
Dataflows Gen 2: データ エンジニアは、データフロー Gen 2 を使用してデータを取り込み、準備できます。 データフローを使用してデータを読み込む方法の詳細については、「データを取得して変換する最初のデータフローを作成。
レイクハウスにデータを読み込むさまざまな方法の詳細については、Fabric Lakehouse にデータを取得するためのオプションを参照してください。
lakehouse を使用したマルチタスク
マルチタスクエクスペリエンスは、複数のアイテムをシームレスに開いて切り替え、データレイクハウスをこれまで以上に効率的に管理できるようにするブラウザタブデザインを提供します。 異なるウィンドウ間をジャグリングしたり、タスクの追跡を失ったりする必要はありません。 Lakehouse は、次の機能を使用して、データ管理の取り組みを可能な限り効率的かつユーザーフレンドリーにするために、マルチタスクエクスペリエンスを強化します。
実行中の操作を保持する: 1 つのタブでデータ読み込み操作をアップロードまたは実行し、別のタブで別のタスクを確認できます。マルチタスク機能が強化された場合、タブ間を移動しても実行中の操作は取り消されません。 中断することなく作業に集中できます。
コンテキストを保持する: 選択したオブジェクト、データ テーブル、またはファイルは開いたままになり、タブを切り替えるとすぐに使用できます。 データレイクハウスのコンテキストは常に簡単にアクセス可能です。
非ブロッキング リストの再読み込み: ファイルとテーブルの一覧の非ブロッキング 再読み込みメカニズム。 リストがバックグラウンドで更新されている間も作業を続けることができます。 これにより、スムーズで中断のないエクスペリエンスを提供しながら、最新のデータが確実に得られます。
明確に定義された通知: トースト通知では、受信元のレイクハウスが指定されるため、マルチタスク環境での変更や更新を簡単に追跡できます。
アクセシビリティの高いレイクハウスのデザイン
アクセシビリティは常に最優先事項であり、Lakehouse が包括的で、すべてのユーザーにとってわかりやすいものになるようにしています。 アクセシビリティをサポートするためにこれまでに実装した主なイニシアチブを次に示します。
スクリーン リーダーの互換性: 人気のあるスクリーン リーダーとシームレスに連携できるため、視覚障なったユーザーがプラットフォームを効果的に移動して操作できるようになります。
テキストリフロー さまざまな画面サイズと向きに適応するレスポンシブデザインです。 テキストとコンテンツのリフローが動的に行われ、ユーザーはさまざまなデバイスでアプリケーションを簡単に表示および操作できます。
キーボード ナビゲーション: ユーザーがマウスに頼らずにレイクハウス内を移動できるようにキーボード ナビゲーションが改善され、運動障なっているユーザーのエクスペリエンスが向上します。
画像の代替テキスト: すべての画像にわかりやすい代替テキストが含まれるようになり、スクリーン リーダーが意味のある情報を伝えることができるようになりました。
フォーム フィールドとラベル: すべてのフォーム フィールドにラベルが関連付けられているため、スクリーン リーダーを使用する場合を含め、すべてのユーザーのデータ入力が簡略化されます。
関連コンテンツ
この概要では、レイクハウスの基本的な理解を得ます。 次の記事に進み、独自のレイクハウスを作成して使用する方法を学習してください。
- レイクハウスの使用を開始するには、「Microsoft Fabricでレイクハウスを作成する」を参照してください。