データマートの概要
ビジネス ユーザーは、情報技術チーム (IT) によって構築された一元管理されるデータ ソースに大きく依存していますが、IT 部門が特定のデータ ソースに変更を提供するまで数か月かかる場合があります。 これに対して、ユーザーは多くの場合、Access データベース、ローカル ファイル、SharePoint サイト、スプレッドシートを使用して独自のデータ マートを構築するという手段を取ります。その結果、そのようなデータ ソースをサポートおよび妥当なパフォーマンスを確保するための、ガバナンスと適切な監視が不足することになります。
データマートは、ビジネス ユーザーと IT のギャップを埋めるのに役立ちます。 データマートはセルフサービス分析ソリューションです。ユーザーはフル マネージド データベースに読み込まれたデータを格納し、探索できます。 データマートを使用すると、さまざまなデータ ソースからデータを取り込み、Power Query を使用したデータの抽出、変換、読み込み (ETL) を行い、チューニングや最適化を必要としないフル マネージドの Azure SQL データベースに読み込むための、シンプルでコードなしのオプションがあるエクスペリエンスが提供されます。
データがデータマートに読み込まれたら、ビジネス インテリジェンスと分析用のリレーションシップとポリシーを追加で定義できます。 データマートで自動的に生成されるデータセットまたはセマンティック モデルを使用して、Power BI レポートとダッシュボードを作成できます。 T-SQL エンドポイントを使用するかビジュアル エクスペリエンスを使用して、データマートにクエリを実行することもできます。
データマートには次の利点があります。
- セルフサービス ユーザーは、データベース管理者に依頼する必要なく、リレーショナル データベース分析を簡単に実行できます
- データマートにより、コードなしのエクスペリエンスを含め、SQL を使用したエンド ツー エンドのデータ インジェスト、準備、探索が実現します
- 1 つの包括的なエクスペリエンス内でのセマンティック モデルとレポートを構築できるようになります
データマートの特徴:
- 100% Web ベースで、その他のソフトウェアは不要
- コードなしのエクスペリエンスにより、フル マネージドのデータマートが実現
- 自動パフォーマンス チューニング
- アドホック分析用の組み込みのビジュアルおよび SQL クエリ エディター
- SQL およびその他の一般的なクライアント ツールのサポート
- Power BI、Microsoft Office、その他の Microsoft 分析オファリングとのネイティブ統合
- Power BI Premium 容量と Premium Per User に付属
データマートを使用する場合
データマートは、セルフサービス シナリオの対話型データ ワークロードを対象としています。 たとえば、会計や財務の作業をしている場合は、独自のデータ モデルとコレクションを構築し、T-SQL と視覚的なクエリ エクスペリエンスを通じて、ビジネス上の質問と回答のセルフサービスのために使用できます。 さらに、それらのデータ コレクションは、従来型の Power BI レポート エクスペリエンスで引き続き使用できます。 データマートは、ドメイン指向で分散型のデータの所有権とアーキテクチャを必要とするお客様にお勧めします。たとえば、製品またはセルフサービス データ プラットフォームとしてのデータを必要とするユーザーの場合です。
データマートは、次のシナリオをサポートするように設計されています。
部門のセルフサービス データ: セルフサービスのフル マネージド SQL データベースで、小規模から中程度のデータ ボリューム (約 100 GB) を一元化します。 データマートを使用すると、1 つのストアを指定して、セルフサービスによる部門のダウンストリーム レポートのニーズ (Excel、Power BI レポートなど) に対応できるため、セルフサービス ソリューションのインフラストラクチャを削減できます。
Power BI を使用したリレーショナル データベース分析: 外部の SQL クライアントを使用してデータマートのデータにアクセスします。 T-SQL を使用する Azure Synapse やその他のサービスとツールでも、Power BI 内でデータマートを使用できます。
エンド ツー エンドのセマンティック モデル: Power BI の作成者が、他のツールや IT チームに依存することなく、エンド ツー エンドのソリューションを構築できるようになります。 データマートでは、自動生成されるセマンティック モデルを使用することで、データフローとセマンティック モデルの間のオーケストレーションを管理せずに済む一方、データのクエリとアドホック分析のための視覚的なエクスペリエンスが提供され、すべてが Azure SQL DB によってサポートされます。
次の表では、これらのオファリングとそれぞれの最適な用途について、データマートでの役割を含めて説明します。
Item | 推奨されるユース ケース | 補完的なデータマートでの役割 |
---|---|---|
データマート | ユーザー ベースのデータ ウェアハウスと SQL によるデータへのアクセス | SQL エンドポイントを使用して、データマートを他のデータマートまたは項目のソースとして使用できます。
|
データフロー | セマンティック モデルまたはマートの再利用可能なデータ準備 (ETL) | データマートでは、ETL 用に 1 つの組み込みデータフローが使用されます。 データフローでこれを強調し、次のことを可能にできます。
|
セマンティック モデル | BI レポート用のメトリックとセマンティック レイヤー | データマートでレポート用に自動生成されたセマンティック モデルが提供され、次のことが可能になります。
|
データマートとデータフローの統合
場合によっては、データフローとデータマートの両方を同じソリューションに組み込むのが便利な場合があります。 次の状況では、データフローとデータマートの両方を組み込む方が有利です。
既存のデータフローを含むソリューションの場合、次が行えます。
- データマートでデータを簡単に使用して、追加の変換を適用したり、SQL クエリを使用してアドホック分析とクエリを有効にしたりする
- コードなしのデータ ウェアハウス ソリューションとセマンティック モデルの管理を簡単に統合する
既存のデータマートを含むソリューションの場合、次が行えます。
- 大量のデータに対して再利用可能な抽出、変換、読み込み (ETL) を大規模に実行する
- 独自のデータ レイクを持ち込み、データフローをデータマートのパイプラインとして使用する
データフローとデータマートの比較
このセクションでは、データフローとデータマートの違いについて説明します。
データフローは、再利用可能な抽出、変換、読み込み (ETL) を実現します。 テーブルは、セマンティック モデルがないと参照、クエリ実行、探索することはできませんが、再利用のために定義することはできます。 独自のデータ レイクを持ち込む場合、データは Power BI または CDM 形式で公開されます。 データフローは、データマートにデータを取り込むために Power BI によって使用されます。 ETL ロジックを再利用する場合は常に、データフローを使用する必要があります。
次の必要がある場合は、データフローを使用します。
- Power BI 内の項目の再利用可能で共有可能なデータ準備を構築します。
データマートは、リレーショナルおよびフル マネージドの Azure SQL DB にデータを格納して探索できる、フル マネージド データベースです。 データマートにより、SQL のサポート、コードなしの視覚化クエリ デザイナー、行レベル セキュリティ (RLS)、各データマートのセマンティック モデルの自動生成が提供されます。 アドホック分析を実行し、すべて Web 上でレポートを作成できます。
次の必要がある場合は、データマートを使用します。
- 並べ替え、フィルター処理、簡単な集計を視覚的に行うか、SQL で定義された式を使用する
- 結果、セット、テーブル、およびフィルター処理されたデータ テーブルである出力の場合
- SQL エンドポイントを介して、アクセス可能なデータを提供する
- Power BI Desktop にアクセスできないユーザーに力を与える
関連するコンテンツ
この記事では、Power BI の概要とさまざまな使用方法について説明しました。
データマートと Power BI の詳細については、以下の記事を参照してください。
- データマートを理解する
- データマートの使用を開始する
- データマートの分析
- データマートを使ってレポートを作成する
- データマートのアクセスの制御
- データマートの管理
- Microsoft Fabric 決定ガイド: データ ウェアハウスまたはレイクハウス
データフローとデータ変換の詳細については、次の記事を参照してください。