Microsoft Fabric ミラー化されたデータベースのデータ品質
注:
Microsoft Purview データ カタログは、名前を Microsoft Purview 統合カタログに変更しています。 すべての機能は同じままです。 新しい Microsoft Purview データ ガバナンス エクスペリエンスがリージョンで一般公開されると、名前の変更が表示されます。 リージョン内の名前を確認します。
データ レプリケーション ソリューションとして、Fabric でのミラーリングは、さまざまなシステムのデータを 1 つの分析プラットフォームにまとめる低コストで待機時間の短いソリューションです。 Azure SQL Database、Azure Cosmos DB、Snowflake からのデータなど、既存のデータ資産を Fabric の OneLake に直接継続的にレプリケートできます。
Fabric でのミラーリングを使用すると、ユーザーは分析ニーズを簡素化するように設計されたエンド ツー エンドの製品を利用できます。 オープンソースのデルタ レイク テーブル形式を読み取ることができる Microsoft とテクノロジ ソリューション間のオープン性とコラボレーションのために構築されたミラーリングは、低コストで低待機時間のソリューションであり、OneLake でデータのレプリカを作成できます。これは、すべての分析ニーズに使用できます。 Fabric ミラーリングの詳細については、 Fabric のドキュメントを参照してください。
ファブリック ミラーリング データベースのデータ品質を構成する
Fabric テナントでミラーリングを有効にします。 Power BI 管理者は、Power BI 管理ポータルにある設定を使用して、organization全体または特定のセキュリティ グループのミラーリングを有効または無効にすることができます。 ミラーリングは、運用データ ソースへのセキュリティで保護された接続を作成することで有効になります。 データベース全体または個々のテーブルをレプリケートするかどうかを選択すると、ミラーリングによってデータが自動的に同期されます。設定が完了すると、データは分析のために OneLake に継続的にレプリケートされます。
ミラーリングを有効にし、レプリケーションを開始した後、ミラーリング レプリケーションが正常に完了したことを確認します。
このページで、[レポート] タブに移動し、[ セマンティック モデルの自動更新] を選択します。
[Microsoft Purview データ マップ] ページに移動し、データ ソースをスキャンします。 サービス プリンシパル認証を使用します。
Microsoft Purview データ品質 ソリューションを開き、データ品質スキャンを実行するか、通常どおりデータをプロファイリングします。
重要
- データ マップ スキャンにはサービス プリンシパルを使用し、データ品質スキャンにはマネージド ID を使用します。
- ミラー化されたデータベース テーブルが Fabric Lakehouse で使用できない場合は、Fabric サポートにお問い合わせください。
- データ品質スキャンは、Lakehouse デルタ テーブルと Parquet ファイルに対してのみサポートされます。
- Purview for Fabric Lakehouse subartifacts でのメタデータの収集は、2023 年 12 月にリリースされた Fabric のメタデータの収集に基づく機能強化です。 この機能は プライベート プレビュー 段階です。
- OneLake SDK for Lakehouse subartifacts のネイティブ項目とショートカット項目を区別するには、Fabric チームに依存しています。 現時点では、すべてのショートカット 項目 (テーブルとファイル) は、スキャンのネイティブ項目と見なされます。 ファブリック レイクハウス データ DQ 評価を有効にするには、テナントの一覧を許可する必要があります。