次の方法で共有


Microsoft Fabric ミラー化されたデータベースのデータ品質

データ レプリケーション ソリューションとして、Fabric でのミラーリングは、さまざまなシステムのデータを 1 つの分析プラットフォームにまとめる低コストで待機時間の短いソリューションです。 Azure SQL Database、Azure Cosmos DB、Snowflake からのデータなど、既存のデータ資産を Fabric の OneLake に直接継続的にレプリケートできます。

Fabric でのミラーリングを使用すると、ユーザーは分析ニーズを簡素化するように設計されたエンド ツー エンドの製品を利用できます。 オープンソースのデルタ レイク テーブル形式を読み取ることができる Microsoft とテクノロジ ソリューション間のオープン性とコラボレーションのために構築されたミラーリングは、低コストで低待機時間のソリューションであり、OneLake でデータのレプリカを作成できます。これは、すべての分析ニーズに使用できます。 Fabric ミラーリングの詳細については、 Fabric のドキュメントを参照してください

ファブリック ミラーリング データベースのデータ品質を構成する

  1. Fabric テナントでミラーリングを有効にします。 Power BI 管理者は、Power BI 管理ポータルにある設定を使用して、organization全体または特定のセキュリティ グループのミラーリングを有効または無効にすることができます。 ミラーリングは、運用データ ソースへのセキュリティで保護された接続を作成することで有効になります。 データベース全体または個々のテーブルをレプリケートするかどうかを選択すると、ミラーリングによってデータが自動的に同期されます。設定が完了すると、データは分析のために OneLake に継続的にレプリケートされます。

  2. ミラーリングを有効にし、レプリケーションを開始した後、ミラーリング レプリケーションが正常に完了したことを確認します。

  3. SQL 分析エンドポイントを開きます

    SQL エンドポイントを移動するスクリーンショット。

  4. [レポート] タブ 、[ セマンティック モデルの自動更新] を選択します。

    セマンティック モデルを自動的に更新します。

  5. Microsoft Purview データ マップに移動し、データ ソースをスキャンします。 サービス プリンシパル認証を使用します。

    データマップ スキャンにサービス プリンシパルを使用します。

  6. スキャンが完了したら、キュレーションとデータ品質評価のために、新しいデータ資産をMicrosoft Purview 統合カタログのデータ製品に関連付けます。

  7. データ製品で、カタログからミラー化されたデータベース (個々のテーブルではない) を選択します。 Power BI データセットとして使用できる必要があります。

    Power BI データセットを選択する

  8. ミラー化されたデータベース内のすべてのテーブルは、 OneLake Delta Tables としてデータ製品に自動的に追加されます。

    One Lake Delta テーブルのスクリーンショット。

  9. 統合カタログの Heath 管理データ品質領域で、データ品質スキャンを実行するか、通常どおりデータをプロファイリングします

重要

  • データ マップ スキャンにはサービス プリンシパルを使用し、データ品質スキャンにはマネージド ID を使用します。
  • 個々のテーブルではなく、ミラー化されたデータベースを選択します。
  • セマンティック モデルを毎回更新します。
  • ミラー化されたデータベース テーブルが Fabric Lakehouse で使用できない場合は、Fabric サポートにお問い合わせください。
  • データ品質スキャンは、Lakehouse delta、iceberg、Parquet ファイル形式でのみサポートされます。
  • OneLake SDK for Lakehouse subartifacts のネイティブ項目とショートカット項目を区別するには、Fabric チームに依存しています。 現時点では、すべてのショートカット 項目 (テーブルとファイル) は、スキャンのネイティブ項目と見なされます。