次の方法で共有


Microsoft Fabric のデータ ウェアハウスとは

適用対象:✅ Microsoft Fabric の SQL 分析エンドポイントおよびウェアハウス

Fabric Data Warehouse は、Microsoft Fabric 内の次世代のデータ ウェアハウス ソリューションです。

エンタープライズ グレードの分散処理エンジンに基づいてレイク中心のウェアハウスが構築されています。これにより、業界をリードするパフォーマンスを大規模に実現しながら、構成と管理を最小限にします。 データ レイクに存在し、オープン データ形式をネイティブにサポートするように設計された Fabric Data Warehouse を使用すると、セキュリティやガバナンスを損なうことなく、データ エンジニアとビジネス ユーザー間のシームレスなコラボレーションが可能になります。

また、使いやすい SaaS エクスペリエンスは、Power BI と緊密に統合され、データ レイクとウェアハウスの世界の分析、レポート、収束を容易にし、分析エステートへの組織の投資を大幅に簡素化します。 

データ ウェアハウスのお客様には、次のメリットがあります。

  • Delta-parquet 形式で格納されたデータは ACID トランザクションを有効にし、他の Fabric ワークロードとの相互運用性により、データの複数のコピーは必要ありません。
  • クロス データベース クエリは、複数のデータ ソースを使用して、迅速な分析情報を得て、データの重複をゼロにできます。
  • パイプライン、データフロー、データベース間クエリ、または COPY INTO コマンドを使用して、大規模なデータの取り込み、読み込み、変換を簡単に行うことができます
  • 業界をリードする分散クエリ処理エンジンを使用した自律的なワークロード管理は、クラス最高のパフォーマンスを実現するためにノブを回す必要がないことを意味します。
  • ビジネスの需要に合わせてほぼ瞬時にスケーリングします。 ストレージとコンピューティングは区切られています。
  • Direct Lake モードで Power BI と統合された、簡単に使用できる常に接続されたセマンティック モデルにより分析情報への時間が短縮されました。 レポートには、分析とレポート用の最新のデータが常に含まれます。
  • 市民開発者から DBA またはデータ エンジニアまで、あらゆるスキル レベル向けに構築されています

データ ウェアハウス アイテム

Fabric Data Warehouse は従来のエンタープライズ データ ウェアハウスではなく、Fabric データ ウェアハウスと SQL 分析エンドポイントという 2 種類のウェアハウス項目をサポートするレイク ウェアハウスです。 どちらも、クラス最高のパフォーマンスを提供し、コストを最小限に抑え、管理オーバーヘッドを削減しながら、お客様のビジネス ニーズを満たすように設計されています。

Fabric データ ウェアハウス

Microsoft Fabric ワークスペースでは、Fabric ウェアハウスには [種類] 列で "ウェアハウス" というラベルが付けられます。 データ ウェアハウスの全機能とトランザクション機能 (DDL と DML クエリのサポート) が必要な場合は、これが高速でシンプルなソリューションです。

ワークスペースのウェアハウスの種類を示す画面のスクリーンショット。

ウェアハウスには、COPY INTOPipelinesデータフロー、または CREATE TABLE AS SELECT (CTAS)INSERT..SELECT、またはSELECT INTO などのデータベース間取り込みオプションなどのサポートされているデータ インジェスト方法のいずれかが設定できます。

ウェアハウスの使用を開始するには、次を参照してください。

レイクハウスの SQL 分析エンドポイント

Microsoft Fabric ワークスペースでは、各レイクハウスに自動生成された "SQL 分析エンドポイント" があり、これを使用してレイクハウスの "Lake" ビュー (データ エンジニアリングと Apache Spark をサポート) から同じレイクハウスの "SQL" ビューに移行し、ビュー、関数、ストアド プロシージャを作成し、SQL セキュリティを適用できます。

ワークスペースの SQL 分析エンドポイントの種類を示すスクリーンショット。

レイクハウスの SQL 分析エンドポイントを使用して、T-SQL コマンドはデータ オブジェクトの定義およびクエリはできるが、データの操作または修正はできません。 SQL 分析エンドポイントで実行できるアクションは、次のとおりです。

  • レイク内の Delta Lake フォルダー内のデータを参照するテーブルに対してクエリを実行します。
  • T-SQL でセマンティクスとビジネス ロジックをカプセル化するためのビュー、インライン TVF、およびプロシージャを作成します。
  • オブジェクトに対するアクセス許可を管理します。

SQL 分析エンドポイントの概要については、次を参照してください。

ウェアハウスまたはレイクハウス

ウェアハウスとレイクハウスのどちらを使用するかを決定するときは、データ管理と分析の要件の特定のニーズとコンテキストを考慮することが重要です。 同様に重要なのは、これは一方向な決定ではないということです!

ビジネス ニーズが変化し、どこから開始するかに関係なく、ウェアハウスとレイクハウスの両方がすべての T-SQL クエリに同じ強力な SQL エンジンを使用する場合は、後でいずれかを追加できます。

決定に役立つ一般的なガイドラインを次に示します。

  • オープン標準形式、ノブのないパフォーマンス、最小限のセットアップを備えたエンタープライズ規模のソリューションが必要な場合、データ ウェアハウスを選択します。  半構造化データ形式と構造化データ形式に最適なデータ ウェアハウスは、初心者と経験豊富なデータ プロフェッショナルの両方に適しており、シンプルで直感的なエクスペリエンスを提供します。

  • 異種ソースからの高度に構造化されていないデータの大規模なリポジトリが必要で、低コストのオブジェクト ストレージを利用し、プライマリ開発ツールとして SPARK を使用する場合は、レイクハウスを選択します。 "軽量" なデータ ウェアハウスとして機能する場合は、常に SQL エンドポイントと T-SQL ツールを使用して、レイクハウスでレポートとデータ インテリジェンスのシナリオを提供することができます。

詳細な決定ガイダンスについては、「Microsoft Fabric 決定ガイド: ウェアハウスとレイクハウスの選択」を参照してください。